CN108093356A - 一种啸叫检测方法及装置 - Google Patents

一种啸叫检测方法及装置 Download PDF

Info

Publication number
CN108093356A
CN108093356A CN201611048183.XA CN201611048183A CN108093356A CN 108093356 A CN108093356 A CN 108093356A CN 201611048183 A CN201611048183 A CN 201611048183A CN 108093356 A CN108093356 A CN 108093356A
Authority
CN
China
Prior art keywords
pitched sounds
audio signal
long
type
default
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611048183.XA
Other languages
English (en)
Other versions
CN108093356B (zh
Inventor
王晟
苏辉
栾国良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou fluorite Network Co.,Ltd.
Original Assignee
Hangzhou Ezviz Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Ezviz Network Co Ltd filed Critical Hangzhou Ezviz Network Co Ltd
Priority to CN201611048183.XA priority Critical patent/CN108093356B/zh
Publication of CN108093356A publication Critical patent/CN108093356A/zh
Application granted granted Critical
Publication of CN108093356B publication Critical patent/CN108093356B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本申请公开了一种啸叫检测方法,用以解决现有技术中通过检测音频信号的频率来确定是否产生啸叫的方式准确率较低的问题。该方法包括:在接收到预设帧数的音频信号后,确定所述音频信号的类型,所述类型包括啸叫类型,所述啸叫类型的音频信号的波形特征满足预设的啸叫特征条件;根据预设时间区间内确定的啸叫类型的音频信号的数量,判断所述预设时间区间内是否产生啸叫。本申请还公开了一种啸叫检测装置。

Description

一种啸叫检测方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种啸叫检测方法及装置。
背景技术
拾音器(俗称麦克风)和扬声器,是我们在日常生活中经常接触到的设备,其中,拾音器可以对环境中的音频信号进行采集,而扬声器可以将拾音器采集到的音频信号播放至环境中。
当扬声器将拾音器采集到的音频信号播放出去后,如果该音频信号又被输入到该拾音器中,那么,音频信号便可在拾音器和扬声器形成的闭合环路中传播,当环路对音频信号的增益大于1时,信号会被不断的放大,便会产生啸叫,这会严重影响用户的产品体验。
为了在啸叫产生时对啸叫进行抑制,可以对啸叫进行检测,由啸叫产生的原因可知,啸叫产生时音频信号的频率往往是周期性的,在现有技术中,往往通过检测音频信号的频率来确定是否产生啸叫,然而对于不同的设备,由于拾音器和扬声器的位置和结构往往不同,那么产生的啸叫的频率往往也不同,因此通过检测音频信号的频率来确定是否产生啸叫的方式,准确率较低。
发明内容
本申请实施例提供一种啸叫检测方法,用以解决现有技术中通过检测音频信号的频率来确定是否产生啸叫的方式准确率较低的问题。
本申请实施例采用下述技术方案:
一种啸叫检测方法,包括:
在接收到预设帧数的音频信号后,确定所述音频信号的类型,所述类型包括啸叫类型,所述啸叫类型的音频信号的波形特征满足预设的啸叫特征条件;
根据预设时间区间内确定的啸叫类型的音频信号的数量,判断所述预设时间区间内是否产生啸叫。
本申请实施例还提供一种啸叫检测装置,用以解决现有技术中通过检测音频信号的频率来确定是否产生啸叫的方式准确率较低的问题。
本申请实施例采用下述技术方案:
一种啸叫检测装置,包括:
确定单元,在接收到预设帧数的音频信号后,确定所述音频信号的类型,所述类型包括啸叫类型,所述啸叫类型的音频信号的波形特征满足预设的啸叫特征条件;
判断单元,根据预设时间区间内确定的啸叫类型的音频信号的数量,判断所述预设时间区间内是否产生啸叫。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过在接收到预设帧数的音频信号后,确定预设时间区间内啸叫类型的音频信号的数量,来确定该预设时间区间内是否产生了啸叫。由于啸叫产生时的音频信号的波形特征与正常的音频信号的波形特征不同,因此这里的啸叫类型音频信号的波形特征满足预设的啸叫特征条件,并且通过根据预设时间区间内确定的啸叫类型的音频信号的数量,确定预设时间区间内是否产生啸叫,降低了误报的可能,相对于现有技术中通过检测音频信号的频率来确定是否产生啸叫的方式,准确率较高。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种啸叫检测方法的实现流程示意图;
图2-1为本申请实施例提供的一种啸叫产生时音频信号的时域波形图;
图2-2为本申请实施例提供的一种正常情况下音频信号的时域波形图;
图2-3为本申请实施例提供的一种标准波和非标准波的时域波形示意图;
图3为本申请实施例提供的一种确定音频信号类型的方法的实现流程示意图;
图4为本申请实施例提供的一种啸叫检测方法的实现流程示意图;
图5为本申请实施例提供的一种啸叫检测装置的具体结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
实施例1
为解决现有技术中通过检测音频信号的频率来确定是否产生啸叫的方式准确率较低的问题,本申请实施例1提供一种啸叫检测方法。本申请实施例提供的啸叫检测方法的执行主体可以是计算设备,例如,可视对讲设备,等等。
该方法的执行主体可以是产生啸叫的设备本身,也可以是用于对产生啸叫的设备进行检测的设备。此外,该方法的执行主体,也可以是啸叫检测软件本身。
为便于描述,下文以该方法的执行主体为啸叫检测模块为例,对该方法的实施方式进行介绍。可以理解,该方法的执行主体为啸叫检测模块只是一种示例性的说明,并不应理解为对该方法的限定。
啸叫检测模块可以接收音频信号,来判断接收到的音频信号是否为啸叫产生时的音频信号。比如,啸叫检测模块可以通过拾音器实时接收环境中的音频信号,从而可以实时地判断当前环境中是否产生了啸叫。为便于描述,后文将啸叫产生时的音频信号简称为啸叫音频信号。
拾音器对环境中的音频信号进行采集时,首先会得到模拟信号形式的音频信号,然后再将模拟信号数字化,即可得到数字信号形式的音频信号。从连续的模拟信号中提取并组成离散的数字信号的过程可以称为采样过程,对于数字音频信号而言,可以以帧为单位对音频信号进行划分,每一帧的音频信号包含预定个数的采样点。
本申请实施例中,可以通过对数字信号形式的音频信号进行分析,来判断接收到的音频信号是否为啸叫音频信号。当音频信号为通过脉冲编码调制(Pulse-codemodulation,PCM)方法得到的数字音频信号时,啸叫检测模块可以通过接收PCM数据的形式来接收音频信号。通常,对于单通道音频信号的PCM数据而言,可以将1024个采样点看作一帧。
在对音频信号进行分析时,可以先确定待分析的音频信号的属性信息,这里的音频信号的属性信息包括:音频数据采样率和每帧采样点个数。然后根据确定的音频信号的属性信息,对接收到的音频信号进行分析。
下面将详细描述本申请提供的啸叫检测方法,该方法的实现流程示意图如图1所示,包括下述步骤:
步骤S101:在接收到预设帧数的音频信号后,确定所述音频信号的类型;
所述类型包括啸叫类型,所述啸叫类型的音频信号的波形特征满足预设的啸叫特征条件;
啸叫检测模块可以持续地接收音频信号,在对音频信号进行分析时,由于音频信号可以是持续不断地输入过来的,因此,在对音频信号进行分析时,可以先确定预设帧数的音频信号,然后对确定的预设帧数的音频信号进行分析,来判断确定的预设帧数的音频信号是否是啸叫音频信号。比如,这里的预设帧数可以是一帧,即可以以一帧为单位对音频信号进行分析,当分析完一帧音频信号后,便可继续接收后续的各帧音频信号,当前接收到的音频信号可以是拾音器实时采集的音频信号。
通过对大量的啸叫时的音频信号和正常的音频信号进行分析,可以发现啸叫时声波的波形与正常声波的波形存在一些区别,这里所说的波形可以是音频信号的时域波形。比如,啸叫时声波的波形大部分为正弦波,如图2-1所示,为啸叫产生时采集到的一段音频信号的时域波形图,而正常声波的波形则杂乱无章,如图2-2所示,为正常情况下采集到的一段音频信号的时域波形图。
那么,可以根据啸叫时声波的特征来预先设定啸叫特征条件,然后当音频信号的波形特征满足预设的啸叫特征条件时,将音频信号确定为啸叫类型的音频信号。该预设的啸叫特征条件比如可以是,波形特征与啸叫音频信号的波形特征相同或相似。
当确定预设帧数的音频信号的类型为啸叫类型后,为了避免误报,可以根据预设时间区间内确定的啸叫类型的音频信号的数量,来确定预设时间区间内是否产生啸叫。同样,为了尽可能精确地确定预设时间区间内是否产生啸叫,可以逐帧来确定各帧音频信号是否为啸叫类型的信号,即预设帧数可以是一帧。
步骤S102:根据预设时间区间内确定的啸叫类型的音频信号的数量,确定所述预设时间区间内是否产生啸叫。
具体的,若预设时间区间内,所述啸叫类型的音频信号的数量大于预设的第一阈值,则确定所述预设时间区间内产生啸叫。
这里的预设时间区间,可以是从当前时刻至当前时刻前的某一预定时刻之间的时间区间,也可以是预设的两个时刻之间的时间区间,也可以是当前时刻至当前时刻前的某一段时间区间,等等,本申请对预设时间区间不作限定。
本申请实施例中,为了尽可能地防止误报,在确定预定帧数的音频信号的类型时,对音频信号类型的确定可以较为严格,比如,可以将预设的啸叫特征条件设置的较高,这样,当音频信号的波形特征与啸叫音频信号的波形相似度较高时,才将其认定为啸叫类型的音频信号。同时为了尽可能地防止漏报,在根据确定的啸叫类型的音频信号的数量确定是否产生啸叫时,可以将条件适当放宽,比如,可以将预设的第一阈值设置的较小。
下面结合实际应用中具体的实施方式,详细介绍本申请提供的啸叫检测方法。
对于确定预设帧数的音频信号的类型而言,可以根据音频信号的波形特征来确定。比如,当检测到音频信号的波形特征和啸叫音频信号的波形特征完全相同时,则可以确定音频信号的类型为啸叫类型。但是,在实际应用中,同一设备每次产生啸叫时的音频信号的波形往往也并不完全相同,因此想要通过某个啸叫音频信号的波形来确定啸叫类型是非常困难的。
在本申请实施例中,可以根据啸叫音频信号的共性来确定音频信号的类型,通过比较图2-1和图2-2可以看出,啸叫音频信号的波形大部分为正弦波,当某个音频信号的特征与啸叫音频信号的正玄波相似时,则该音频信号很有可能是啸叫音频信号。
基于可以通过音频信号的波形特征来确定音频信号的类型,那么,可以确定啸叫音频信号波形的共性,在实际应用中,可以将啸叫音频信号中满足预设的啸叫波形条件的波称为标准波。比如,可以将经过预设的正区间阈值和负区间阈值的半个波长的波称为一个标准波,而不满足上述条件的半个波长的波则称为非标准波,如图2-3所示,给出了标准波和非标准波的一种示例。下面就本申请实施例中优选的几个能够反映啸叫音频信号共性的参数进行详细说明。
1、标准波的平均周期,由于啸叫产生原理的特殊性,啸叫产生时音频信号的波形近似于正弦波,因此啸叫时标准波的周期较小;2、标准波的平均振幅,由于啸叫的产生原理的特殊性,啸叫的音量通常较大,因此啸叫音频信号的标准波的振幅较大;3、标准波的周期方差,由于啸叫的波形相似度高,因此啸叫时每帧音频信号的标准波的周期方差较小;4、非标准波与标准波的比值,由于啸叫时的波形近似正弦波,波形平滑,非标准波的数量较多,因此啸叫时每帧音频信号的非标准波数与标准波数的比值较小。
基于上述四种能够反映啸叫音频信号共性的参数,可以预先设定如下四种啸叫特征条件:
1、音频信号中标准波的平均周期小于预设的周期阈值;
2、音频信号中标准波的平均振幅大于预设的振幅阈值;
3、音频信号中标准波的周期方差大于预设的方差阈值;
4、音频信号中非标准波与标准波的比值大于预设的比值阈值。
在啸叫特征条件的各阈值中,周期阈值越大,则灵敏度越高;振幅阈值越小,则灵敏度越高;方差阈值越小,则灵敏度越高,比值阈值越小,则灵敏度越高。所谓的灵敏度越高指越容易将音频信号判定为啸叫类型的音频信号,那么,在实际应用中,可以结合实际的应用场景对各阈值进行设置。比如,为了尽可能地减少误判,即期望啸叫检测的灵敏度较低时,可以通过设置各阈值,将啸叫特征条件设定的较为苛刻。
在实际应用中,为了尽可能地减少误判,可以在音频信号的波形特征同时满足所有的啸叫特征条件时,才将音频信号判定为啸叫类型的音频信号。
在预先设定好啸叫特征条件的各阈值后,在对预定帧数的音频信号的类型进行判断时,便可以确定该音频信号的波形特征的值,然后将确定的波形特征的值与啸叫特征条件中的值进行比较,当确定该音频信号的波形特征的值满足预设的啸叫特征条件时,则确定该音频信号为啸叫类型的音频信号。
下面以预设的啸叫特征条件为上述四种啸叫特征条件、预设帧数的音频信号为一帧音频信号为例,对确定音频信号的类型的具体实施过程进行说明,该过程的实现流程示意图如图3所示,包括下述步骤:
步骤S201:接收输入的一帧音频信号;
对于通过PCM方法得到的音频信号而言,即为接收输入的一帧PCM数据。
步骤S202:计算该帧音频信号中标准波的平均周期和平均振幅;
针对标准波的平均周期:遍历一帧音频信号的所有采样点,每发现一个标准波则计算标准波所含采样点数,并将该采样点数加入到标准波的总采样点数中,并且所计算的标准波的数量加1。最后用标准波的总采样点数除以标准波的数量得到标准波平均所含采样点数,用标准波平均所含采样点数乘以每个采样点的间隔时间,得到标准波的平均周期。
针对标准波的平均振幅:遍历一帧音频数据的所有采样点,每发现一个标准波则计算标准波振幅最大值和振幅最小值的绝对值,并将该绝对值加入到标准波的总振幅中,并且所计算的标准波数量加1。最后将标准波的总振幅除以标准波数量,得到标准波的平均振幅。
步骤S203:根据平均周期计算标准波的周期方差;
针对标准波的周期方差:在通过执行步骤S202计算出标准波的平均周期和平均振幅后,重新遍历一遍音频数据,得出每个标准波的周期,按照方差公式计算得出标准波的周期方差。
步骤S204:计算非标准波数与标准波数比值;
非标准波数与标准波数比值:遍历一帧音频数据的所有采样点,当出现拐点时,总波数加1,总波数减去标准波数得出非标准波数,最后将非标准波数除以标准波数得出比值。
步骤S205:将得到的该帧音频信号的波形特征的各值,分别与预设的啸叫特征条件中相应的阈值进行比较;
步骤S206:当得到的该帧音频信号的波形特征的值满足预设的啸叫特征条件时,则确定该帧音频信号为啸叫类型的音频信号;
即,该帧音频信号中标准波的平均周期小于预设的周期阈值;该帧音频信号中标准波的平均振幅大于预设的振幅阈值;该帧音频信号中标准波的周期方差大于预设的方差阈值;该帧音频信号中非标准波与标准波的比值大于预设的比值阈值。此时便可确定该帧音频信号为啸叫类型的音频信号。
步骤S207:当得到的音频信号的波形特征的值不满足所述预设的啸叫特征条件时,则确定所述音频信号的类型为非啸叫类型。
在本申请实施例中,音频信号的类型还包括非啸叫类型,非啸叫类型的音频信号的波形特征不满足预设的啸叫特征条件。
并且,若预设时间区间内,非啸叫类型的音频信号的数量大于预设的第二阈值,则确定所述预设时间区间内未产生啸叫。这样,在预设时间区间内啸叫类型的音频信号的数量还没有大于预设的第一阈值时,即无法通过啸叫类型来判断预设时间区间是否产生啸叫时,当通过非啸叫类型的音频信号确定预设时间区间内没有产生啸叫时,便无需再去确定预设时间区间内是否产生了啸叫,节省了处理资源。
在根据啸叫类型的音频信号的数量和非啸叫类型的音频信号的数量判断是否产生啸叫时,可以以一帧(预设帧数)音频信号为单位,持续地确定接收到的每一帧音频信号的类型,并且在每确定一帧音频信号的类型后,便判断预设时间区间内是否产生啸叫,这样便能够及时地确定预设时间区间内是否产生了啸叫。
当确定预设时间区间内是否产生啸叫后,便无需再对已经确定是否产生了啸叫的时间区间再进行判断,那么,优选的,本申请实施例中的预设时间区间可以是当前时刻之前已确定了音频信号的类型,但未确定是否产生啸叫的时间区间。
下面,以预设时间区间为当前时刻之前已确定了音频信号的类型,但未确定是否产生啸叫的时间区间为例,对根据啸叫类型的音频信号的数量和非啸叫类型的音频信号的数量判断是否产生啸叫的过程进行详细描述,该过程的实现流程示意图如图4所示,包括下述步骤:
步骤S301:接收输入的预设帧数的音频信号;
步骤S302:确定当前接收到的预设帧数的音频信号的类型;
确定音频信号的类型的具体方式请参见前文的相关描述,比如可以通过执行步骤S201-S207来确定,此处不再赘述。
步骤S303:如果该音频信号的类型为啸叫类型,则确定当前状态;
当前状态包括正常状态和啸叫状态,顾名思义,啸叫状态指通过之前的判断,确定当前为产生了啸叫的状态,而正常状态指未产生啸叫的状态。
步骤S304:如果当前状态为正常状态,则将预设时间区间内记录的啸叫类型音频信号的数量加1;
步骤S305:判断预设时间区间内啸叫类型音频信号的数量是否大于预设的第一阈值;
第一阈值越大,则表示达到判定啸叫产生所需要的啸叫类型音频信号的数量越多,判定啸叫产生越困难,则灵敏度越低。因此,第一阈值的具体设定可以根据需要自行设定。
步骤S306:如果预设时间区间内啸叫类型音频信号的数量大于预设的第一阈值,则确定产生啸叫,并清零记录的啸叫类型音频信号的数量和非啸叫类型音频信号的数量;
即将当前状态从正常状态转变为啸叫状态。
步骤S307:如果预设时间区间内啸叫类型音频信号的数量不大于预设的第一阈值,则不确定预设时间区间内产生了啸叫;
步骤S308:如果当前状态为啸叫状态,则确定当前状态仍为啸叫状态;
在当前状态已经是啸叫状态时,如果判断出该音频信号的类型为啸叫类型,则可以直接确定当前状态仍为啸叫状态,而无需再将预设时间区间内啸叫类型音频信号的数量加1,无需判断啸叫类型音频信号的数量是否大于第一阈值,节省了处理资源。
步骤S309:如果该音频信号的类型为非啸叫类型,则将预设时间区间内非啸叫类型音频信号的数量加1;
步骤S310:判断预设时间区间内记录的非啸叫类型音频信号的数量是否大于预设的第二阈值;
第二阈值越大,则表示达到判定啸叫产生时可容忍的非啸叫类型音频信号的数量越多,判定为啸叫越容易,则灵敏度越高。同时表示当判定啸叫已经产生时,需要更多的非啸叫类型的音频信号才能解除啸叫
步骤S311:如果预设时间区间内非啸叫类型音频信号的数量大于预设的第二阈值,则确定未产生啸叫,并清零记录的啸叫类型音频信号的数量和非啸叫类型音频信号的数量;
那么如果当前状态为之前判定的啸叫状态,则可以将当前状态从啸叫状态转变为正常状态。
步骤S312:如果预设时间区间内非啸叫类型音频信号的数量小于预设的第二阈值,则不确定预设时间区间内是未产生啸叫。
至此,便完成了接收到预设帧数的音频后判断是否产生啸叫的整个过程。在该过程中,在确定是否产生啸叫后,便可以将记录的啸叫类型音频信号的数量和非啸叫类型音频信号的数量清零,然后继续接收后续输入的预设帧数的音频信号,并执行步骤S301-S312。同样,在执行步骤S307或步骤S312后,也可以继续接收后续输入的预设帧数的音频信号,并执行步骤S301-S312。这样便可以持续接收环境中的音频信号,以便确定当前环境中是否产生了啸叫。
本申请实施例中,为了降低误报率,可以将啸叫特征条件设置的较高,同样,为了降低漏报率,可以将第一阈值设置的较小,并且将第二阈值设置的较大。这样,在保证误报率较低的情况下,漏报率也会很低。
下面结合具体的实施场景,来说明在该实施场景下设置的各阈值的优选值:
在该场景中,持续接收到的预定帧数的音频信号为一帧PCM格式的音频信号,该音频信号的属性为:采样率为46K,每帧采样点为1024,音频信号为单通道音频。
在该场景下,各阈值分别设置如下:
预设的啸叫波形条件中,标准波的周期阈值为0.21ms,标准波的振幅阈值为3500,标准波的方差阈值为3,总波数与标准波数比值的比值阈值为1.03。第一阈值为5,第二阈值为50。
在预先设置好上述阈值后,通过本申请实施例提供的啸叫检测方法,对几种常见的声音环境进行测试,最终的测试结果如表1所示:
表1
通过表1的测试结果可以看出,通过设置的上述阈值参数,本申请实施例提供的啸叫检测方法的误报率为0,而且漏报率极低。
本申请实施例1提供的啸叫检测方法,通过在接收到预设帧数的音频信号后,确定预设时间区间内啸叫类型的音频信号的数量,来确定该预设时间区间内是否产生了啸叫。由于啸叫产生时的音频信号的波形特征与正常的音频信号的波形特征不同,因此这里的啸叫类型音频信号的波形特征满足预设的啸叫特征条件,并且通过根据预设时间区间内确定的啸叫类型的音频信号的数量,确定预设时间区间内是否产生啸叫,降低了误报的可能,相对于现有技术中通过检测音频信号的频率来确定是否产生啸叫的方式,准确率较高。
需要说明的是,实施例1所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤S301和步骤S302的执行主体可以为设备1,步骤S303的执行主体可以为设备2;又比如,步骤S301、步骤S302和步骤S303的执行主体均为设备1;等等。
实施例2
为解决现有技术中通过检测音频信号的频率来确定是否产生啸叫的方式准确率较低的问题,本申请实施例2提供一种啸叫检测装置。该啸叫检测装置的结构示意图如图5所示,主要包括下述功能单元:
第一确定单元401,在接收到预设帧数的音频信号后,确定所述音频信号的类型,所述类型包括啸叫类型,所述啸叫类型的音频信号的波形特征满足预设的啸叫特征条件;
判断单元402,根据预设时间区间内确定的啸叫类型的音频信号的数量,判断所述预设时间区间内是否产生啸叫。
上述装置实施例的具体工作流程是,第一确定单元401在接收到预设帧数的音频信号后,确定所述音频信号的类型,所述类型包括啸叫类型,所述啸叫类型的音频信号的波形特征满足预设的啸叫特征条件,然后判断单元402根据预设时间区间内确定的啸叫类型的音频信号的数量,判断所述预设时间区间内是否产生啸叫。
本申请实施例中,上述装置的具体实施方式有很多种,为了提高确定音频信号的类型的准确率,在一种实施方式中,所述预设的啸叫特征条件包括下述至少一种:
所述音频信号中标准波的平均周期小于预设的周期阈值;所述标准波的波形满足预设的啸叫波形条件;
所述音频信号中标准波的平均振幅大于预设的振幅阈值;
所述音频信号中标准波的周期方差大于预设的方差阈值;
所述音频信号中非标准波与标准波的比值大于预设的比值阈值;所述非标准波的波形不满足预设的啸叫波形条件。
在一种实施方式中,所述第一确定单元401具体包括第一确定子单元401-1和第二确定子单元401-2,其中:
所述第一确定子单元401-1,确定所述音频信号的波形特征的值;
所述第二确定子单元401-2,在确定的所述音频信号的波形特征的值满足所述预设的啸叫特征条件时,确定所述音频信号为啸叫类型的音频信号。
为了降低啸叫检测的误报率,在一种实施方式中,所述判断单元402,在预设时间区间内所述啸叫类型的音频信号的数量大于预设的第一阈值时,确定所述预设时间区间内产生啸叫。
为了减少啸叫检测的漏报率,在一种实施方式中,所述类型还包括非啸叫类型,所述非啸叫类型的音频信号的波形特征不满足所述预设的啸叫特征条件;
所述第一确定单元,确定所述音频信号的波形特征的值;在确定的所述音频信号的波形特征的值不满足所述预设的啸叫特征条件时,确定所述音频信号的类型为非啸叫类型。
所述装置还包括:
第二确定单元,在预设时间区间内非啸叫类型的音频信号的数量大于预设的第二阈值时,确定所述预设时间区间内未产生啸叫。
为了节省处理资源,在一种实施方式中,所述预设时间区间包括:当前时刻之前已确定音频信号的类型,但未确定是否产生啸叫的时间区间。
本申请实施例2提供的啸叫检测装置,通过在接收到预设帧数的音频信号后,确定预设时间区间内啸叫类型的音频信号的数量,来确定该预设时间区间内是否产生了啸叫。由于啸叫产生时的音频信号的波形特征与正常的音频信号的波形特征不同,因此这里的啸叫类型音频信号的波形特征满足预设的啸叫特征条件,并且通过根据预设时间区间内确定的啸叫类型的音频信号的数量,确定预设时间区间内是否产生啸叫,降低了误报的可能,相对于现有技术中通过检测音频信号的频率来确定是否产生啸叫的方式,准确率较高。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (12)

1.一种啸叫检测方法,其特征在于,包括:
在接收到预设帧数的音频信号后,确定所述音频信号的类型,所述类型包括啸叫类型,所述啸叫类型的音频信号的波形特征满足预设的啸叫特征条件;
根据预设时间区间内确定的啸叫类型的音频信号的数量,判断所述预设时间区间内是否产生啸叫。
2.如权利要求1所述方法,其特征在于,所述预设的啸叫特征条件包括下述至少一种:
所述音频信号中标准波的平均周期小于预设的周期阈值;所述标准波的波形满足预设的啸叫波形条件;
所述音频信号中标准波的平均振幅大于预设的振幅阈值;
所述音频信号中标准波的周期方差大于预设的方差阈值;
所述音频信号中非标准波与标准波的比值大于预设的比值阈值;所述非标准波的波形不满足预设的啸叫波形条件。
3.如权利要求2所述方法,其特征在于,确定所述音频信号的类型,具体包括:
确定所述音频信号的波形特征的值;
当确定的所述音频信号的波形特征的值满足所述预设的啸叫特征条件时,则确定所述音频信号为啸叫类型的音频信号。
4.如权利要求3所述方法,其特征在于,根据预设时间区间内啸叫信号的数量,确定所述预设时间区间内是否产生啸叫,具体包括:
若预设时间区间内,所述啸叫类型的音频信号的数量大于预设的第一阈值,则确定所述预设时间区间内产生啸叫。
5.如权利要求4所述方法,其特征在于,所述类型还包括非啸叫类型,所述非啸叫类型的音频信号的波形特征不满足所述预设的啸叫特征条件;
确定所述音频信号的类型,具体包括:
确定所述音频信号的波形特征的值;
当确定的所述音频信号的波形特征的值不满足所述预设的啸叫特征条件时,则确定所述音频信号的类型为非啸叫类型。
所述方法还包括:
若预设时间区间内,非啸叫类型的音频信号的数量大于预设的第二阈值,则确定所述预设时间区间内未产生啸叫。
6.如权利要求5所述方法,其特征在于,所述预设时间区间包括:
当前时刻之前已确定音频信号的类型,但未确定是否产生啸叫的时间区间。
7.一种啸叫检测装置,其特征在于,包括:
第一确定单元,在接收到预设帧数的音频信号后,确定所述音频信号的类型,所述类型包括啸叫类型,所述啸叫类型的音频信号的波形特征满足预设的啸叫特征条件;
判断单元,根据预设时间区间内确定的啸叫类型的音频信号的数量,判断所述预设时间区间内是否产生啸叫。
8.如权利要求1所述装置,其特征在于,所述预设的啸叫特征条件包括下述至少一种:
所述音频信号中标准波的平均周期小于预设的周期阈值;所述标准波的波形满足预设的啸叫波形条件;
所述音频信号中标准波的平均振幅大于预设的振幅阈值;
所述音频信号中标准波的周期方差大于预设的方差阈值;
所述音频信号中非标准波与标准波的比值大于预设的比值阈值;所述非标准波的波形不满足预设的啸叫波形条件。
9.如权利要求8所述装置,其特征在于,所述第一确定单元具体包括第一确定子单元和第二确定子单元,其中:
所述第一确定子单元,确定所述音频信号的波形特征的值;
所述第二确定子单元,在确定的所述音频信号的波形特征的值满足所述预设的啸叫特征条件时,确定所述音频信号为啸叫类型的音频信号。
10.如权利要求9所述装置,其特征在于:
所述判断单元,在预设时间区间内所述啸叫类型的音频信号的数量大于预设的第一阈值时,确定所述预设时间区间内产生啸叫。
11.如权利要求10所述装置,其特征在于,所述类型还包括非啸叫类型,所述非啸叫类型的音频信号的波形特征不满足所述预设的啸叫特征条件;
所述第一确定单元,确定所述音频信号的波形特征的值;在确定的所述音频信号的波形特征的值不满足所述预设的啸叫特征条件时,确定所述音频信号的类型为非啸叫类型。
所述装置还包括:
第二确定单元,在预设时间区间内非啸叫类型的音频信号的数量大于预设的第二阈值时,确定所述预设时间区间内未产生啸叫。
12.如权利要求11所述装置,其特征在于,所述预设时间区间包括:
当前时刻之前已确定音频信号的类型,但未确定是否产生啸叫的时间区间。
CN201611048183.XA 2016-11-23 2016-11-23 一种啸叫检测方法及装置 Active CN108093356B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611048183.XA CN108093356B (zh) 2016-11-23 2016-11-23 一种啸叫检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611048183.XA CN108093356B (zh) 2016-11-23 2016-11-23 一种啸叫检测方法及装置

Publications (2)

Publication Number Publication Date
CN108093356A true CN108093356A (zh) 2018-05-29
CN108093356B CN108093356B (zh) 2020-10-23

Family

ID=62170015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611048183.XA Active CN108093356B (zh) 2016-11-23 2016-11-23 一种啸叫检测方法及装置

Country Status (1)

Country Link
CN (1) CN108093356B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108810745A (zh) * 2018-06-13 2018-11-13 安克创新科技股份有限公司 啸叫测试方法、啸叫测试系统与相关装置
CN111724811A (zh) * 2019-03-21 2020-09-29 成都鼎桥通信技术有限公司 基于亚音频的啸叫识别方法及设备
CN112004177A (zh) * 2020-09-03 2020-11-27 重庆瑞可利科技有限公司 一种啸叫检测方法、麦克风音量调节方法及介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6343427A (ja) * 1986-08-11 1988-02-24 Matsushita Electric Ind Co Ltd ハウリング抑圧方法
US4905290A (en) * 1988-07-12 1990-02-27 Viva Co., Ltd. Howling protective apparatus
US20030012388A1 (en) * 2001-07-16 2003-01-16 Takefumi Ura Howling detecting and suppressing apparatus, method and computer program product
CN1489417A (zh) * 2002-03-05 2004-04-14 ���µ�����ҵ��ʽ���� 麦克风-扬声器设备
CN1934897A (zh) * 2004-02-20 2007-03-21 松下电器产业株式会社 啸叫检测方法及装置、以及具有它们的音响装置
CN101248341A (zh) * 2005-08-25 2008-08-20 罗伯特·博世有限公司 评估啸叫噪音干扰性的方法和装置
CN101621730A (zh) * 2008-07-01 2010-01-06 索尼株式会社 用于检测声反馈的装置和方法
CN102165792A (zh) * 2008-09-24 2011-08-24 雅马哈株式会社 环路增益推定装置以及啸叫防止装置
US8891786B1 (en) * 2010-05-17 2014-11-18 Marvell International Ltd. Selective notch filtering for howling suppression
JP2014239320A (ja) * 2013-06-07 2014-12-18 パナソニック株式会社 補聴器
CN104703106A (zh) * 2013-12-06 2015-06-10 奥迪康有限公司 用于免提通信的助听器装置
CN104703094A (zh) * 2014-12-26 2015-06-10 南京信息工程大学 基于max262和fpga的啸叫检测抑制系统及其控制方法
CN105812993A (zh) * 2014-12-29 2016-07-27 联芯科技有限公司 啸叫检测和抑制方法及其装置
CN105979197A (zh) * 2016-07-19 2016-09-28 块互动(北京)科技有限公司 基于啸叫音自动识别的远程会议控制方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6343427A (ja) * 1986-08-11 1988-02-24 Matsushita Electric Ind Co Ltd ハウリング抑圧方法
US4905290A (en) * 1988-07-12 1990-02-27 Viva Co., Ltd. Howling protective apparatus
US20030012388A1 (en) * 2001-07-16 2003-01-16 Takefumi Ura Howling detecting and suppressing apparatus, method and computer program product
CN1489417A (zh) * 2002-03-05 2004-04-14 ���µ�����ҵ��ʽ���� 麦克风-扬声器设备
CN1934897A (zh) * 2004-02-20 2007-03-21 松下电器产业株式会社 啸叫检测方法及装置、以及具有它们的音响装置
CN101248341A (zh) * 2005-08-25 2008-08-20 罗伯特·博世有限公司 评估啸叫噪音干扰性的方法和装置
CN101621730A (zh) * 2008-07-01 2010-01-06 索尼株式会社 用于检测声反馈的装置和方法
CN102165792A (zh) * 2008-09-24 2011-08-24 雅马哈株式会社 环路增益推定装置以及啸叫防止装置
US8891786B1 (en) * 2010-05-17 2014-11-18 Marvell International Ltd. Selective notch filtering for howling suppression
JP2014239320A (ja) * 2013-06-07 2014-12-18 パナソニック株式会社 補聴器
CN104703106A (zh) * 2013-12-06 2015-06-10 奥迪康有限公司 用于免提通信的助听器装置
CN104703094A (zh) * 2014-12-26 2015-06-10 南京信息工程大学 基于max262和fpga的啸叫检测抑制系统及其控制方法
CN105812993A (zh) * 2014-12-29 2016-07-27 联芯科技有限公司 啸叫检测和抑制方法及其装置
CN105979197A (zh) * 2016-07-19 2016-09-28 块互动(北京)科技有限公司 基于啸叫音自动识别的远程会议控制方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张秀再,陈彭鑫,吴华娟,赵益波: "基于FPGA和MAX262的啸叫检测与抑制系统", 《电子技术及信息科学》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108810745A (zh) * 2018-06-13 2018-11-13 安克创新科技股份有限公司 啸叫测试方法、啸叫测试系统与相关装置
CN111724811A (zh) * 2019-03-21 2020-09-29 成都鼎桥通信技术有限公司 基于亚音频的啸叫识别方法及设备
CN111724811B (zh) * 2019-03-21 2023-01-24 成都鼎桥通信技术有限公司 基于亚音频的啸叫识别方法及设备
CN112004177A (zh) * 2020-09-03 2020-11-27 重庆瑞可利科技有限公司 一种啸叫检测方法、麦克风音量调节方法及介质
CN112004177B (zh) * 2020-09-03 2021-08-31 重庆瑞可利科技有限公司 一种啸叫检测方法、麦克风音量调节方法及存储介质

Also Published As

Publication number Publication date
CN108093356B (zh) 2020-10-23

Similar Documents

Publication Publication Date Title
US11670325B2 (en) Voice activity detection using a soft decision mechanism
JP6999012B2 (ja) 音声信号検出方法及び装置
US8971549B2 (en) Audio signal processing apparatus, audio signal processing method, and program
CN108986822A (zh) 语音识别方法、装置、电子设备及非暂态计算机存储介质
JP5664480B2 (ja) 異常状態検出装置、電話機、異常状態検出方法、及びプログラム
US20240038250A1 (en) Method and system for triggering events
JP2009053694A (ja) 室内インパルス応答モデリング方法および装置
CN108093356A (zh) 一种啸叫检测方法及装置
CN113259832B (zh) 麦克风阵列的检测方法、装置、电子设备及存储介质
CN111031463A (zh) 麦克风阵列性能评测方法、装置、设备和介质
CN109767784B (zh) 鼾声识别的方法及装置、存储介质和处理器
CN102421056A (zh) 扬声器的检测方法和装置
CN106486134A (zh) 话语状态确定装置及方法
JP2010097084A (ja) 携帯端末、拍位置推定方法および拍位置推定プログラム
CN113053365A (zh) 语音分离方法、装置、设备和存储介质
JP5815435B2 (ja) 音源位置判定装置、音源位置判定方法、プログラム
CN114678038A (zh) 音频噪声检测方法、计算机设备和计算机程序产品
CN112750458B (zh) 一种触屏声音检测方法和装置
JP2014002336A (ja) コンテンツ処理装置、コンテンツ処理方法、およびコンピュータプログラム
TW200923911A (en) Apparatus, server, method, and computer readable medium thereof for processing and recognizing a voice signal
JP6298339B2 (ja) 呼吸音解析装置及び呼吸音解析方法、並びにコンピュータプログラム及び記録媒体
JP2015188642A (ja) 呼吸音解析装置及び呼吸音解析方法、並びにコンピュータプログラム及び記録媒体
CN111314536B (zh) 一种用于检测终端设备的收听模块的方法及设备
CN110491413B (zh) 一种基于孪生网络的音频内容一致性监测方法及系统
CN112885380A (zh) 一种清浊音检测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 310051 Room 301, building B, building 2, No. 399, Danfeng Road, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Hangzhou fluorite Network Co.,Ltd.

Address before: No.555, Qianmo Road, Binjiang District, Hangzhou City, Zhejiang Province

Patentee before: HANGZHOU EZVIZ NETWORK Co.,Ltd.

CP03 Change of name, title or address