CN112349295B - 啸叫检测方法及装置 - Google Patents
啸叫检测方法及装置 Download PDFInfo
- Publication number
- CN112349295B CN112349295B CN202011126475.7A CN202011126475A CN112349295B CN 112349295 B CN112349295 B CN 112349295B CN 202011126475 A CN202011126475 A CN 202011126475A CN 112349295 B CN112349295 B CN 112349295B
- Authority
- CN
- China
- Prior art keywords
- frame signal
- howling
- current frame
- value
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 53
- 238000001228 spectrum Methods 0.000 claims abstract description 63
- 238000004590 computer program Methods 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 14
- 230000015654 memory Effects 0.000 claims description 9
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000009432 framing Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请公开了一种啸叫检测方法及装置。其中,该啸叫检测方法包括:计算当前帧信号的功率谱;基于当前帧信号的功率谱确定当前帧信号的候选啸叫点;基于当前帧信号的前r帧信号的功率谱,计算当前帧信号的候选啸叫点的帧间功率值平均增益,其中,r为大于或等于1的正整数;将帧间功率值平均增益大于第一预设值的候选啸叫点作为真实啸叫点。本申请啸叫检测方法能够减少误检,提高啸叫检测效率。
Description
技术领域
本申请涉及声音处理技术领域,特别是涉及一种啸叫检测方法及装置。
背景技术
在日常生活中,当人们应用电子设备发送和接收声音信号时,经常会发生喇叭发出的声音莫名持续增大。这种情况的发生大多是由于声信号在电子设备内部或和相应的环境形成了正反馈,使得信号被不断的放大,从而变成刺耳的噪声,这也就是我们俗称的啸叫。针对啸叫抑制的研究已经有50多年的历史,在常用的陷波器抑制啸叫方法中就需要先检测出啸叫再对其进行抑制,因为如果无法有效及时的检测到啸叫,则也就无法抑制啸叫。目前,啸叫检测经常会出现误检的情况,而误检会导致正常语音信号被抑制从而失真。
发明内容
本申请提供一种啸叫检测方法及装置,以避免误检,提高啸叫检测效率。
为达到上述目的,本申请提供一种啸叫检测方法,包括:
计算当前帧信号的功率谱;
基于当前帧信号的功率谱确定当前帧信号的候选啸叫点;
基于当前帧信号的前r帧信号的功率谱,计算当前帧信号的候选啸叫点的帧间功率值平均增益,其中,r为大于或等于1的正整数;
将帧间功率值平均增益大于第一预设值的候选啸叫点作为真实啸叫点,其中,第一预设值为真实啸叫点的帧间功率值平均增益的下限值。
其中,基于当前帧信号的前r帧信号的功率谱,计算当前帧信号的候选啸叫点的帧间功率值平均增益,包括:
确认前r帧信号中的匹配啸叫点;其中,匹配啸叫点为前r帧信号的候选啸叫点,且匹配啸叫点与当前帧信号的候选啸叫点的差值的绝对值小于或等于第二预设值,其中,第二预设值为匹配啸叫点与当前帧信号的候选啸叫点的差值的绝对值的上限值;
确认前r帧信号中具有匹配啸叫点的帧数;
若帧数大于第三预设值,计算当前帧信号的候选啸叫点的帧间功率值平均增益,其中,第三预设值为计算帧间功率值平均增益的帧数的下限值。
其中,计算当前帧信号的候选啸叫点的帧间功率值平均增益,包括:
计算当前帧信号和前r帧信号中相邻两帧信号位于当前帧信号的候选啸叫点处的功率差值;
计算功率差值的均值,得到当前帧信号的候选啸叫点的帧间功率值平均增益。
其中,计算当前帧信号和前r帧信号中相邻两帧信号位于当前帧信号的候选啸叫点处的功率差值,包括:
确认前r帧信号位于当前帧信号的候选啸叫点的参考功率值;
计算前r帧信号中相邻两帧信号的参考功率值之间的差值,得到至少一个第一差值;
计算当前帧信号的候选啸叫点的功率值和当前帧信号的前一帧信号的参考功率值之间的差值,得到第二差值;
计算功率差值的均值,包括:计算至少一个第一差值和第二差值的均值;
其中,前r帧信号中具有匹配啸叫点的信号的参考功率值为具有匹配啸叫点的信号中匹配啸叫点的功率值的均值;前r帧信号中不具有匹配啸叫点的信号的参考功率值为,不具有匹配啸叫点的信号位于当前帧信号的候选啸叫点的功率值。
其中,计算当前帧信号的功率谱,之前包括:
对时域信号进行分帧处理;
计算当前帧信号的平均能量和/或平均幅度;
计算当前帧信号的功率谱,包括:在当前帧信号的平均能量大于第一阈值和/或平均幅度大于第二阈值时,利用傅里叶变换计算当前帧信号的功率谱。
其中,基于当前帧信号的功率谱确定当前帧信号的候选啸叫点,包括:
对当前帧信号的功率谱进行峰值检测,确定当前帧信号的峰值点;
计算出当前帧信号的峰值点的峰值固定门限比和峰值平均功率比;
将峰值固定门限比大于第三阈值且峰值平均功率比大于第四阈值的峰值点作为当前帧信号的候选啸叫点。
其中,确定当前帧信号的峰值点,包括:确定当前帧信号中功率值大于第五阈值的峰值点。
其中,将帧间功率值平均增益大于第一预设值的候选啸叫点作为真实啸叫点,之后包括:
计算真实啸叫点的平均谱平坦度;
将平均谱平坦度低于第六阈值的真实啸叫点作为最终真实啸叫点。
为达到上述目的,本申请提供一种啸叫检测方法,包括处理器和存储器,存储器中存储有计算机程序,处理器用于执行计算机程序以实现上述啸叫检测方法中的步骤。
为达到上述目的,本申请提供一种计算机可读存储介质,其中存储有计算机程序,计算机程序被执行时实现上述啸叫检测方法中的步骤。
本申请先对语音时域信号进行分帧处理,对至少部分帧进行计算,以得到至少部分帧的功率谱,然后通过当前帧信号的功率谱确定出当前帧信号的候选啸叫点;接着基于前r帧信号的功率谱,计算当前帧信号的候选啸叫点的帧间功率值平均增益,并将帧间功率值平均增益大于第一预设值的候选啸叫点作为真实啸叫点,这样就可充分利用啸叫点频率值稳定且所处频率功率值不断增强的特性准确地确定出当前帧信号中的真实啸叫点,减少了对语音信号的误检,以提高啸叫检测的效率。
附图说明
图1是本申请啸叫检测方法一实施方式的流程示意图;
图2是本申请啸叫检测方法另一实施方式的流程示意图;
图3是本申请啸叫检测装置一实施方式的结构示意图;
图4是本申请计算机可读存储介质一实施方式的结构示意图。
具体实施方式
为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本申请所提供的一种啸叫检测方法及装置做进一步详细描述。
具体请参阅图1,图1是本申请啸叫检测方法第一实施方式的流程示意图。本实施例啸叫检测方法包括以下步骤。
S110:计算当前帧信号的功率谱。
可以计算出当前帧信号的功率谱,以便后续基于功率谱确定当前帧信号是否存在真实啸叫点。
可选地,在步骤S110之前,可以对当前帧信号进行加窗处理,然后对当前帧信号加窗处理的结果进行计算,以得到当前帧信号的功率谱。具体可将帧信号与加窗函数相乘,以得到帧信号的加窗处理结果。可以理解的是,通过加窗处理可得到当前帧信号在频域上的对数谱,使得原本没有周期性的语音信号可以呈现出周期函数的部分特征。
其中,可以利用傅里叶变换、AR模型或MA模型等计算得到当前帧信号的功率谱。
示例性地,通过加窗处理和傅里叶变换得到帧信号的功率谱的公式可如下所示:
P(ωk,i)=|Y(ωk,i)|2;
其中h(n)为选定的窗函数,例如汉明窗、矩形窗、三角窗、海明窗、布拉克曼窗或凯塞窗等;j表示虚数单位,yi(n)为帧信号,|·|表示取模长。
S120:基于当前帧信号的功率谱确定当前帧信号的候选啸叫点。
计算得到当前帧信号的功率谱后,可以基于当前帧信号的功率谱确定当前帧信号的候选啸叫点,以便后续确定当前帧信号的候选啸叫点的帧间功率值平均增益,以利用帧间功率值平均增益从所有候选啸叫点中确定出真实啸叫点。
可选地,可以对功率谱进行峰值检测,以得到当前帧信号的峰值点,将当前帧信号的峰值点作为当前帧信号的候选啸叫点。另外还可以通过多种方式对当前帧信号的峰值点进行筛选,将峰值点中有可能是真实啸叫点筛选为候选啸叫点,以减少不必要的计算。例如,可以从所有峰值点中,将功率值大于第五阈值的峰值点作为候选啸叫点。又例如,可以从所有峰值点中,将峰值固定门限比大于第三阈值的峰值点作为候选啸叫点。另例如,可以从所有峰值点中,将峰值平均功率比大于第四阈值的峰值点作为候选啸叫点。
S130:基于当前帧信号的前r帧信号的功率谱,计算当前帧信号的候选啸叫点的帧间功率值平均增益。
确定出当前帧信号的候选啸叫点后,可以基于当前帧信号的前r帧信号的功率谱,计算出当前帧信号的候选啸叫点的帧间功率值平均增益,以便利用帧间功率值平均增益从所有候选啸叫点中确定出真实啸叫点。
S140:将帧间功率值平均增益大于第一预设值的候选啸叫点作为真实啸叫点。
在本实施方式中,先对当前帧信号进行计算,以得到当前帧信号的功率谱,然后通过当前帧信号的功率谱确定出当前帧信号的候选啸叫点;接着基于前r帧信号的功率谱,计算当前帧信号的候选啸叫点的帧间功率值平均增益,并将帧间功率值平均增益大于第一预设值的候选啸叫点作为真实啸叫点,这样就可充分利用啸叫点频率值稳定且所处频率功率值不断增强的特性准确地确定出当前帧信号中的真实啸叫点,减少了对语音信号的误检和对啸叫信号的漏检,以提高啸叫检测效率。
其中,第一预设值为真实啸叫点的帧间功率值平均增益的下限值。第一预设值可以根据实际情况进行设定,例如可为50或100等。
具体请参阅图2,图2是本申请啸叫检测方法第二实施方式的流程示意图。本实施例啸叫检测方法包括以下步骤。
S210:对时域信号进行分帧。
可以先对语音时域信号进行分帧,以便后续可以对每帧信号进行处理得到每帧信号的功率谱,然后基于功率谱确定每帧信号中是否存在真实啸叫点。
其中,语音信号在宏观上是典型的非平稳信号,在微观上是平稳的,具有短时平稳性,通常可以认为10---30ms内的语音信号是平稳信号,从而可以把语音信号分割为片段来进行处理,每一个片段称为一帧(CHUNK),当然每一个片段的时长不限定于上述描述的10---30ms,本申请对帧的时长不加以限制。
其次,在分帧的时候,每一帧可以重复截取一部分,即前一帧的后一部分内容与当前帧前一部分内容相同,避免一帧信号的两端部分被削弱而得到过分降噪的音频数据,以使加窗处理后的音频信号更为连续。
在一实现方式中,可以直接进入步骤S230,以计算全部帧信号的功率谱,然后利用每帧信号的功率谱确定每帧信号中是否存在真实啸叫点。
在另一实现方式中,可以进入步骤S220,以过滤掉沉默段的帧信号,仅计算出非沉默的帧信号的功率谱,然后确定非沉默的帧信号中是否存在真实啸叫点,避免了不必要的计算,节省资源消耗。可以理解的是,除通过步骤S220筛除沉默的帧信号外,还可通过其他方法筛除沉默的帧信号。例如仅判断当前帧信号的平均幅度是否超过第二阈值;若当前帧信号的平均幅度超过第二阈值,则当前帧信号为非沉默信号;若当前帧信号的平均幅度不超过第二阈值,则当前帧信号为沉默信号。又例如仅判断当前帧信号的平均能量是否超过第一阈值;若当前帧信号的平均能量超过第一阈值,则当前帧信号为非沉默信号;若当前帧信号的平均能量不超过第一阈值,则当前帧信号为沉默信号。
S220:计算当前帧信号的平均能量和平均幅度。
对时域信号进行分帧处理后,可以计算当前帧信号的平均能量和平均幅度,以过滤掉沉默段的帧信号,避免了不必要的计算,节省资源消耗。
可选地,帧信号的平均幅度的计算公式可如下所示:
可选地,帧信号的平均能量的计算公式可如下所示:
S230:若当前帧信号的平均能量大于第一阈值且平均幅度大于第二阈值,则计算出当前帧信号的功率谱。
计算出当前帧信号的平均能量和平均幅度后,可以判断当前帧信号的平均能量是否大于第一阈值,且判断当前帧的平均幅度是否大于第二阈值,即判断当前帧信号是否为非沉默信号,以筛除掉平均能量小于第一阈值和平均幅度小于第二阈值的沉默信号,以避免不必要的计算,同时降低误检的几率,若当前帧信号的平均能量大于第一阈值且平均幅度大于第二阈值,则计算出当前帧信号的功率谱。
可选地,对信号进行处理得到功率谱的过程可参见步骤S110,在此不做赘述。
其中,第一阈值和第二阈值可以根据实际情况进行设定,在此不做限定。
S240:基于当前帧信号的功率谱确定当前帧信号的候选啸叫点。
计算出非沉默信号的功率谱后,可以基于非沉默信号的功率谱筛选出当前帧信号的候选啸叫点。
可选地,在步骤S240中,可以先对当前帧信号的功率谱进行峰值检测,确认出当前帧信号的峰值点;然后计算出当前帧信号的峰值点的PTPR(峰值固定门限比)和PAPR(Peakto Average Power Ratio,峰值平均功率比),将峰值固定门限比大于第三阈值且峰值平均功率比大于第四阈值的峰值点作为当前帧信号的候选啸叫点。其中,峰值固定门限比的计算公式如下所示:
其中,峰值点的峰值平均功率比的计算公式可如下所示:
其中,第三阈值和第四阈值可以根据实际情况进行设定,在此不做限定。
S250:基于当前帧信号的前r帧信号的功率谱,计算当前帧信号的候选啸叫点的帧间功率值平均增益。
确认出当前帧信号的候选啸叫点后,可以计算出候选啸叫点的帧间功率值平均增益。
可选地,在步骤S250中,可以先确认前r帧信号中的匹配啸叫点,其中,匹配啸叫点为前r帧信号的候选啸叫点,且匹配啸叫点与当前帧信号的候选啸叫点的差值的绝对值小于或等于第二预设值;确认出前r帧信号中具有匹配啸叫点的帧数;若帧数大于第三预设值,计算出当前帧信号的候选啸叫点的帧间功率值。其中,第二预设值为匹配啸叫点与当前帧信号的候选啸叫点的差值的绝对值的上限值。第三预设值为计算当前帧信号的候选啸叫点的帧间功率值平均增益的帧数的下限值。第二预设值和第三预设值可以根据实际情况进行设定,在此不做限定。
可选地,计算出当前帧信号的候选啸叫点的帧间功率值的步骤,可以包括:计算当前帧信号和前r帧信号中相邻两帧信号位于当前帧信号的候选啸叫点处的功率差值;计算出功率差值的均值,得到当前帧信号的候选啸叫点的帧间功率值平均增益。
可以理解的是,前r帧信号中位于当前帧信号的候选啸叫点处的功率值可以是前r帧信号中位于当前帧信号的候选啸叫点的参考功率值。其中,前r帧信号中具有匹配啸叫点的信号的参考功率值为具有匹配啸叫点的信号中匹配啸叫点的功率值的均值。前r帧信号中不具有匹配啸叫点的信号的参考功率值为,不具有匹配啸叫点的信号位于当前帧信号的候选啸叫点的功率值。具体地,计算当前帧信号和前r帧信号中相邻两帧信号位于当前帧信号的候选啸叫点处的功率差值、以及计算出功率差值的均值的步骤,可以包括:确认前r帧信号位于当前帧信号的候选啸叫点的参考功率值;计算前r帧信号中相邻两帧信号的参考功率值之间的差值,得到至少一个第一差值;计算当前帧信号的候选啸叫点的功率值和当前帧信号的前一帧信号的参考功率值之间的差值,得到第二差值;计算至少一个第一差值和第二差值的均值。
在另一实现方式中,前r帧信号中位于当前帧信号的候选啸叫点处的功率值还可以是前r帧信号中位于当前帧信号的候选啸叫点的实际功率值。
例如,N为6,在前6帧信号中,第一帧信号的候选啸叫点为2380Hz和2930Hz,第二帧信号的候选啸叫点为1780Hz,第三帧信号的候选啸叫点为2650Hz,第四帧信号的候选啸叫点为1050Hz和3200Hz,第五帧信号的候选啸叫点为2912Hz和4580Hz,第六帧信号的候选啸叫点为2920Hz和2943Hz。当前帧信号的候选啸叫点为2925Hz,第二预设值为30Hz,第三预设值为2,从而第一帧信号的匹配啸叫点为2930Hz,第五帧信号的匹配啸叫点为2912Hz,第六帧信号的匹配啸叫点为2920Hz和2943Hz,即具有匹配啸叫点的信号的帧数大于第三预设值。其中,第一帧信号在2925Hz处的参考功率值可为第一帧信号中2930Hz处的功率值;第二帧信号在2925Hz处的参考功率值可为第二帧信号中2925Hz处的功率值;第三帧信号在2925Hz处的参考功率值可为第三帧信号中2925Hz处的功率值;第四帧信号在2925Hz处的参考功率值可为第四帧信号中2925Hz处的功率值;第五帧信号在2925Hz处的参考功率值可为第五帧信号中2912Hz处的功率值;第六帧信号在2925Hz处的参考功率值可为第六帧信号中2920Hz处的功率值和2943Hz处的功率值的平均值。利用下述公式计算出当前帧信号的候选啸叫点的帧间功率值平均增益:
S260:将帧间功率值平均增益大于第一预设值的候选啸叫点作为真实啸叫点。
计算出当前帧信号的候选啸叫点的帧间功率值平均增益后,可以将帧间功率平均增益大于第一预设值的候选啸叫点作为真实啸叫点。
S270:计算真实啸叫点的平均谱平坦度。
确认当前帧信号的真实啸叫点后,还可以计算真实啸叫点的平均谱平坦度。
可选地,真实啸叫点的平均谱平坦度的计算公式如下所示:
其中,L(i)可通过下述公式计算得到:
S280:将平均谱平坦度低于第六阈值的真实啸叫点作为最终真实啸叫点。
计算出真实啸叫点的平均谱平坦度后,可以判断真实啸叫点的平均谱平坦度的真实啸叫点是否低于第六阈值,若低于第六阈值,则确认真实啸叫点为最终确认的啸叫点,这样充分利用啸叫信号的平均谱平坦度要小于正常语音信号的特性,进一步避免了对语音信号的误检,以降低误检率。其中,第六阈值可以根据实际情况进行设定,在此不做限定。
请参阅图3,图3是本申请啸叫检测装置一实施方式的结构示意图。本啸叫检测装置10包括相互耦接的存储器11和处理器12,存储器11用于存储程序指令,处理器12用于执行程序指令以实现上述任一实施方式的方法。
上述啸叫检测方法的逻辑过程以计算机程序呈现,在计算机程序方面,若其作为独立的软件产品销售或使用时,其可存储在计算机可读存储介质中,因而本申请提出一种计算机可读存储介质。请参阅图4,图4是本申请计算机可读存储介质一实施方式的结构示意图,本实施方式计算机可读存储介质20中存储有计算机程序21,计算机程序21被处理器执行时实现上述啸叫检测方法中的步骤。
该计算机可读存储介质20具体可以为U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory,)、磁碟或者光盘等可以存储计算机程序的介质,或者也可以为存储有该计算机程序的服务器,该服务器可将存储的计算机程序发送给其他设备运行,或者也可以自运行该存储的计算机程序。该计算机可读存储介质20从物理实体上来看,可以为多个实体的组合,例如多个服务器、服务器加存储器、或存储器加移动硬盘等多种组合方式。
以上仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (9)
1.一种啸叫检测方法,其特征在于,所述方法包括:
计算当前帧信号的功率谱;
基于所述当前帧信号的功率谱确定所述当前帧信号的候选啸叫点;
基于所述当前帧信号的前r帧信号的功率谱,计算所述当前帧信号的候选啸叫点的帧间功率值平均增益,其中,r为大于1的正整数;
将所述帧间功率值平均增益大于第一预设值的候选啸叫点作为真实啸叫点,其中,所述第一预设值为真实啸叫点的帧间功率值平均增益的下限值;
其中,所述计算所述当前帧信号的候选啸叫点的帧间功率值平均增益,包括:
计算所述前r帧信号和所述当前帧信号中的相邻两帧信号位于所述当前帧信号的候选啸叫点处的功率差值;
计算所述功率差值的均值,得到当前帧信号的候选啸叫点的帧间功率值平均增益。
2.根据权利要求1所述的啸叫检测方法,其特征在于,所述基于所述当前帧信号的前r帧信号的功率谱,计算所述当前帧信号的候选啸叫点的帧间功率值平均增益,包括:
确认所述前r帧信号中的匹配啸叫点;其中,所述匹配啸叫点为前r帧信号的候选啸叫点,且所述匹配啸叫点与所述当前帧信号的候选啸叫点的差值的绝对值小于或等于第二预设值,其中,所述第二预设值为所述匹配啸叫点与所述当前帧信号的候选啸叫点的差值的绝对值的上限值;
确认前r帧信号中具有所述匹配啸叫点的帧数;
若所述帧数大于第三预设值,计算所述当前帧信号的候选啸叫点的帧间功率值平均增益,其中,所述第三预设值为计算所述帧间功率值平均增益的所述帧数的下限值。
3.根据权利要求2所述的啸叫检测方法,其特征在于,所述计算所述前r帧信号和所述当前帧信号中的相邻两帧信号位于所述当前帧信号的候选啸叫点处的功率差值,包括:
确认前r帧信号位于所述当前帧信号的候选啸叫点的参考功率值;
计算前r帧信号中相邻两帧信号的参考功率值之间的差值,得到至少一个第一差值;
计算所述当前帧信号的候选啸叫点的功率值和所述当前帧信号的前一帧信号的参考功率值之间的差值,得到第二差值;
所述计算所述功率差值的均值,包括:计算所述至少一个第一差值和所述第二差值的均值;
其中,前r帧信号中具有所述匹配啸叫点的信号的参考功率值为所述具有所述匹配啸叫点的信号中匹配啸叫点的功率值的均值;前r帧信号中不具有所述匹配啸叫点的信号的参考功率值为,所述不具有所述匹配啸叫点的信号位于所述当前帧信号的候选啸叫点的功率值。
4.根据权利要求1所述的啸叫检测方法,其特征在于,所述计算当前帧信号的功率谱,之前包括:
对时域信号进行分帧处理;
计算当前帧信号的平均能量和/或平均幅度;
所述计算当前帧信号的功率谱,包括:在当前帧信号的平均能量大于第一阈值和/或平均幅度大于第二阈值时,利用傅里叶变换计算当前帧信号的功率谱。
5.根据权利要求1所述的啸叫检测方法,其特征在于,所述基于所述当前帧信号的功率谱确定所述当前帧信号的候选啸叫点,包括:
对当前帧信号的功率谱进行峰值检测,确定当前帧信号的峰值点;
计算出所述当前帧信号的峰值点的峰值固定门限比和峰值平均功率比;
将峰值固定门限比大于第三阈值且所述峰值平均功率比大于第四阈值的峰值点作为所述当前帧信号的候选啸叫点。
6.根据权利要求5所述的啸叫检测方法,其特征在于,所述确定当前帧信号的峰值点,包括:确定当前帧信号中功率值大于第五阈值的峰值点。
7.根据权利要求1所述的啸叫检测方法,其特征在于,所述将所述帧间功率值平均增益大于第一预设值的候选啸叫点作为真实啸叫点,之后包括:
计算所述真实啸叫点的平均谱平坦度;
将所述平均谱平坦度低于第六阈值的真实啸叫点作为最终真实啸叫点。
8.一种啸叫检测装置,其特征在于,所述啸叫检测装置包括存储器和处理器;所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以实现如权利要求1-7中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011126475.7A CN112349295B (zh) | 2020-10-20 | 2020-10-20 | 啸叫检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011126475.7A CN112349295B (zh) | 2020-10-20 | 2020-10-20 | 啸叫检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112349295A CN112349295A (zh) | 2021-02-09 |
CN112349295B true CN112349295B (zh) | 2023-03-31 |
Family
ID=74358620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011126475.7A Active CN112349295B (zh) | 2020-10-20 | 2020-10-20 | 啸叫检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112349295B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117641218B (zh) * | 2024-01-25 | 2024-04-12 | 北京中电慧声科技有限公司 | 一种啸叫检测和抑制方法、系统及介质 |
CN118016042B (zh) * | 2024-04-09 | 2024-05-31 | 成都启英泰伦科技有限公司 | 一种啸叫抑制方法及装置 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1398054A (zh) * | 2001-07-16 | 2003-02-19 | 松下电器产业株式会社 | 啸叫检测和抑制设备、方法和计算机程序产品 |
WO2003077594A1 (fr) * | 2002-03-12 | 2003-09-18 | Matsushita Electric Industrial Co., Ltd. | Dispositif de commande de reaction acoustique et procede de commande de reaction acoustique |
CN102740214A (zh) * | 2011-04-01 | 2012-10-17 | 中国科学院声学研究所 | 一种基于反馈信号频谱估计的啸叫抑制方法 |
US8891786B1 (en) * | 2010-05-17 | 2014-11-18 | Marvell International Ltd. | Selective notch filtering for howling suppression |
CN104464752A (zh) * | 2014-12-24 | 2015-03-25 | 海能达通信股份有限公司 | 一种声反馈检测方法和装置 |
CN105516876A (zh) * | 2015-12-09 | 2016-04-20 | 天津大学 | 一种基于谱熵的啸叫检测方法 |
CN105812993A (zh) * | 2014-12-29 | 2016-07-27 | 联芯科技有限公司 | 啸叫检测和抑制方法及其装置 |
CN105872910A (zh) * | 2016-03-23 | 2016-08-17 | 成都普创通信技术股份有限公司 | 一种音频信号啸叫检测方法 |
CN105895115A (zh) * | 2016-04-01 | 2016-08-24 | 北京小米移动软件有限公司 | 啸叫的判定方法及装置 |
CN106303878A (zh) * | 2015-05-22 | 2017-01-04 | 成都鼎桥通信技术有限公司 | 一种啸叫检测和抑制方法 |
CN106373587A (zh) * | 2016-08-31 | 2017-02-01 | 北京容联易通信息技术有限公司 | 一种实时通信系统中的自动声反馈检测与消除方法 |
CN107371116A (zh) * | 2017-07-21 | 2017-11-21 | 天津大学 | 一种基于帧间谱平坦度偏差的啸叫检测方法 |
CN107919134A (zh) * | 2016-10-10 | 2018-04-17 | 杭州海康威视数字技术股份有限公司 | 啸叫检测方法及装置和啸叫抑制方法及装置 |
CN109461455A (zh) * | 2018-11-30 | 2019-03-12 | 维沃移动通信(深圳)有限公司 | 一种消除啸叫的系统及方法 |
CN110213694A (zh) * | 2019-04-16 | 2019-09-06 | 浙江大华技术股份有限公司 | 一种音频设备及其啸叫的处理方法、计算机存储介质 |
CN111402911A (zh) * | 2019-12-23 | 2020-07-10 | 佛山慧明电子科技有限公司 | 一种啸叫检测与抑制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150043858A (ko) * | 2013-10-15 | 2015-04-23 | 한국전자통신연구원 | 하울링 제거 장치 및 방법 |
-
2020
- 2020-10-20 CN CN202011126475.7A patent/CN112349295B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1398054A (zh) * | 2001-07-16 | 2003-02-19 | 松下电器产业株式会社 | 啸叫检测和抑制设备、方法和计算机程序产品 |
WO2003077594A1 (fr) * | 2002-03-12 | 2003-09-18 | Matsushita Electric Industrial Co., Ltd. | Dispositif de commande de reaction acoustique et procede de commande de reaction acoustique |
US8891786B1 (en) * | 2010-05-17 | 2014-11-18 | Marvell International Ltd. | Selective notch filtering for howling suppression |
CN102740214A (zh) * | 2011-04-01 | 2012-10-17 | 中国科学院声学研究所 | 一种基于反馈信号频谱估计的啸叫抑制方法 |
CN104464752A (zh) * | 2014-12-24 | 2015-03-25 | 海能达通信股份有限公司 | 一种声反馈检测方法和装置 |
CN105812993A (zh) * | 2014-12-29 | 2016-07-27 | 联芯科技有限公司 | 啸叫检测和抑制方法及其装置 |
CN106303878A (zh) * | 2015-05-22 | 2017-01-04 | 成都鼎桥通信技术有限公司 | 一种啸叫检测和抑制方法 |
CN105516876A (zh) * | 2015-12-09 | 2016-04-20 | 天津大学 | 一种基于谱熵的啸叫检测方法 |
CN105872910A (zh) * | 2016-03-23 | 2016-08-17 | 成都普创通信技术股份有限公司 | 一种音频信号啸叫检测方法 |
CN105895115A (zh) * | 2016-04-01 | 2016-08-24 | 北京小米移动软件有限公司 | 啸叫的判定方法及装置 |
CN106373587A (zh) * | 2016-08-31 | 2017-02-01 | 北京容联易通信息技术有限公司 | 一种实时通信系统中的自动声反馈检测与消除方法 |
CN107919134A (zh) * | 2016-10-10 | 2018-04-17 | 杭州海康威视数字技术股份有限公司 | 啸叫检测方法及装置和啸叫抑制方法及装置 |
CN107371116A (zh) * | 2017-07-21 | 2017-11-21 | 天津大学 | 一种基于帧间谱平坦度偏差的啸叫检测方法 |
CN109461455A (zh) * | 2018-11-30 | 2019-03-12 | 维沃移动通信(深圳)有限公司 | 一种消除啸叫的系统及方法 |
CN110213694A (zh) * | 2019-04-16 | 2019-09-06 | 浙江大华技术股份有限公司 | 一种音频设备及其啸叫的处理方法、计算机存储介质 |
CN111402911A (zh) * | 2019-12-23 | 2020-07-10 | 佛山慧明电子科技有限公司 | 一种啸叫检测与抑制方法 |
Non-Patent Citations (3)
Title |
---|
Adaptive feedback canceller with howling detection for hearing aids;Kakeru Kashima等;《2015 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA)》;20160225;全文 * |
声反馈抑制算法的研究与实现;李康康;《中国优秀硕士学位论文全文数据库信息科技辑》;20180615;全文 * |
电视电话会议系统中的啸叫检测方法研究;查全有;《中国优秀硕士学位论文全文数据库信息科技辑》;20170315;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112349295A (zh) | 2021-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8983833B2 (en) | Method and apparatus for masking wind noise | |
CN112349295B (zh) | 啸叫检测方法及装置 | |
JP4519169B2 (ja) | 信号処理方法および信号処理装置 | |
CN112004177B (zh) | 一种啸叫检测方法、麦克风音量调节方法及存储介质 | |
CN111583949A (zh) | 啸叫抑制的方法、装置和设备 | |
CN112951259B (zh) | 音频降噪方法、装置、电子设备及计算机可读存储介质 | |
US9749741B1 (en) | Systems and methods for reducing intermodulation distortion | |
CN110213694B (zh) | 一种音频设备及其啸叫的处理方法、计算机存储介质 | |
JP2014122939A (ja) | 音声処理装置および方法、並びにプログラム | |
CN104867497A (zh) | 一种语音降噪方法 | |
US9066177B2 (en) | Method and arrangement for processing of audio signals | |
CN111800725A (zh) | 啸叫检测方法及装置、存储介质、计算机设备 | |
CN110503973B (zh) | 音频信号瞬态噪音抑制方法、系统以及存储介质 | |
US9002030B2 (en) | System and method for performing voice activity detection | |
JP2004341339A (ja) | 雑音抑圧装置 | |
CN112669797B (zh) | 音频处理方法、装置、电子设备及存储介质 | |
JP4548953B2 (ja) | 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム | |
Ngo et al. | Incorporating the conditional speech presence probability in multi-channel Wiener filter based noise reduction in hearing aids | |
CN114267370A (zh) | 一种基于频域处理的啸叫抑制方法及装置 | |
CN111477246A (zh) | 语音处理方法、装置及智能终端 | |
Khoubrouy et al. | A method of howling detection in presence of speech signal | |
JP6644213B1 (ja) | 音響信号処理装置、音響システム、音響信号処理方法、及び音響信号処理プログラム | |
JP2002175099A (ja) | 雑音抑制方法および雑音抑制装置 | |
CN113611319A (zh) | 基于语音成分实现的风噪抑制方法、装置、设备及系统 | |
JP2008129077A (ja) | ノイズ除去装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |