CN113316075B - 一种啸叫检测方法、装置及电子设备 - Google Patents
一种啸叫检测方法、装置及电子设备 Download PDFInfo
- Publication number
- CN113316075B CN113316075B CN202110512494.1A CN202110512494A CN113316075B CN 113316075 B CN113316075 B CN 113316075B CN 202110512494 A CN202110512494 A CN 202110512494A CN 113316075 B CN113316075 B CN 113316075B
- Authority
- CN
- China
- Prior art keywords
- signal
- howling
- point
- frequency
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 claims abstract description 51
- 238000001228 spectrum Methods 0.000 claims description 149
- 230000001629 suppression Effects 0.000 claims description 57
- 230000003595 spectral effect Effects 0.000 claims description 39
- 238000004891 communication Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012512 characterization method Methods 0.000 claims 5
- 230000000875 corresponding effect Effects 0.000 description 61
- 230000005236 sound signal Effects 0.000 description 34
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/001—Monitoring arrangements; Testing arrangements for loudspeakers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Abstract
本申请公开了一种啸叫检测方法、装置及电子设备,该方法包括:根据待检测信号的第一频带的能量和,确定待检测信号的信号类型;该第一频带的频点小于第一频点阈值;该信号类型用于指示待检测信号为语音帧信号或者非语音帧信号;获取待检测信号的频域特征信息;当频域特征信息中各参数位于信号类型对应的预设参数范围内时,确定待检测信号中存在啸叫。可以准确检测出待检测信号中的啸叫。
Description
技术领域
本申请涉及音频信号处理技术领域,尤其涉及一种啸叫检测方法、装置及电子设备。
背景技术
目前,在音频设备中,由于音频设备的采集方式等因素,导致采集到的音频信号存在啸叫。例如,在扩音系统中,麦克风接收的音频信号经功率放大器放大后由扬声器输出,输出的信号经过反射和/或折射可能重新被麦克风接收,形成正反馈回路。根据奈奎斯特稳定判据可知,一些频点可能会产生均匀振荡,导致扩音系统的音频信号的功率不断增大,系统不稳定,可能产生声反馈啸叫现象。从而导致音频设备发出令人不悦的声音,音频信号质量低,影响用户体验。并且,声反馈啸叫现象严重时还可能会损坏音频设备,如烧毁功率放大器和/或扬声器的中高音单元等。
为了提升音频信号的质量,可以对音频信号进行啸叫检测,并依据啸叫检测的检测结果对音频信号进行啸叫抑制。其中,啸叫抑制后的音频信号的质量与啸叫检测的检测结果相关,即啸叫检测的准确性越高,啸叫抑制后的音频信号的质量越好。因此,如何提升啸叫检测的准确性是一个亟需解决的问题。
发明内容
本申请实施例提供了一种啸叫检测方法。该方法可以准确检测待检测信号中的啸叫。
第一方面,本申请实施例提供了一种啸叫检测方法,该啸叫检测方法包括:
根据待检测信号的第一频带的能量和,确定待检测信号的信号类型;该第一频带的频点小于第一频点阈值;该信号类型用于指示待检测信号为语音帧信号或者非语音帧信号;
获取待检测信号的频域特征信息;
当频域特征信息中各参数位于信号类型对应的预设参数范围内时,确定待检测信号中存在啸叫。
基于第一方面描述的方法,电子设备可以根据第一频带内的能量和确定待检测信号是语音帧信号还是非语音帧信号。然后获取待检测信号的信号类型对应的频域特征信息,并根据频域特征信息中各参数与信号类型对应的预设参数范围确定待检测信号是否存在啸叫。由于利用第一频带内的能量和区分语音帧信号与非语音帧信号,对语音帧信号的频域特征信息与非语音帧信号的频域特征信息分别进行分析,考虑了语音帧信号的频域特征信息和非语音帧信号的频域特征信息的区别,使得电子设备可以更准确的检测语音帧信号中的啸叫与非语音帧信号中的啸叫。
结合第一方面,在一些可行的实施方式中,根据待检测信号的第一频带的能量和,确定待检测信号的信号类型,包括:
当第一频带的能量和,大于能量阈值时,确定待检测信号为语音帧信号;
当第一频带的能量和,小于或等于能量阈值时,确定待检测信号为非语音帧信号。
结合第一方面,在一些可行的实施方式中,该待检测信号为语音帧信号;该频域特征信息包括:第一功率谱峰值;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:第一功率谱峰值所在的频点大于第二频点阈值。
结合第一方面,在一些可行的实施方式中,该频域特征信息包括:第一候选啸叫点的谐波功率比,该第一候选啸叫点包括第一功率谱峰值所在的频点中大于第二频点阈值的频点;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:
第一候选啸叫点的谐波功率比,大于第一谐波功率比阈值。
结合第一方面,在一些可行的实施方式中,该频域特征信息包括:第一候选啸叫点的邻近峰值比;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第一候选啸叫点的邻近峰值比,大于第一邻近峰值比阈值。
结合第一方面,在一些可行的实施方式中,电子设备确定待检测信号中存在啸叫之后,该方法还包括:
获取语音帧信号中的至少一个第一频点,该第一频点包括语音信号帧中小于或等于第二频点阈值的频点;
获取至少一个第一频点的幅度值,并确定第一幅度值,该第一幅度值为至少一个第一频点的幅度值中的最大值;
根据第一幅度值对语音帧信号进行啸叫抑制。
结合第一方面,在一些可行的实施方式中,根据第一幅度值对语音帧信号进行啸叫抑制,包括:
若语音帧信号中的一个频点的幅度值大于第一幅度值,则利用第一幅度值替换语音帧信号中的一个频点的幅度值。
结合第一方面,在一些可行的实施方式中,待检测信号为非语音帧信号;该方法还包括:
获取非语音帧信号的幅度谱,并计算幅度谱的几何平均数以及算术平均数;
根据幅度谱的几何平均数和幅度谱的算术平均数确定谱平坦度。
结合第一方面,在一些可行的实施方式中,该频域特征信息包括:谱平坦度;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:谱平坦度小于或等于谱平坦度阈值。
结合第一方面,在一些可行的实施方式中,待检测信号为非语音帧信号;该频域特征信息包括:第二功率谱峰值;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:第二功率谱峰值所在的频点大于第三频点阈值。
结合第一方面,在一些可行的实施方式中,该频域特征信息包括:第二候选啸叫点的谐波功率比,该第二候选啸叫点包括第二功率谱峰值所在的频点中大于第三频点阈值的频点;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第二候选啸叫点的谐波功率比,大于第二谐波功率比阈值。
结合第一方面,在一些可行的实施方式中,该频域特征信息包括:第二候选啸叫点的邻近峰值比;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第二候选啸叫点的邻近峰值比,大于第二邻近峰值比阈值。
结合第一方面,在一些可行的实施方式中,电子设备确定待检测信号中存在啸叫之后,该方法还包括:
获取非语音帧信号中的至少一个第二频点;该第二频点包括小于或等于第三频点阈值的频点;
获取至少一个第二频点的幅度值,并确定第二幅度值,该第二幅度值为至少一个第二频点的幅度值中的最大值;
根据第二幅度值对非语音帧信号进行啸叫抑制。
结合第一方面,在一些可行的实施方式中,根据第二幅度值对非语音帧信号进行啸叫抑制,包括:
若非语音帧信号中的一个频点的幅度值大于第二幅度值,则利用第二幅度值替换非语音帧信号中的一个频点的幅度值。
第二方面,本申请实施例提供了一种啸叫检测装置,该啸叫检测装置包括:
确定单元,用于根据待检测信号的第一频带的能量和,确定待检测信号的信号类型;该第一频带的频点小于第一频点阈值;该信号类型用于指示待检测信号为语音帧信号或者非语音帧信号;
获取单元,用于获取待检测信号的频域特征信息;
该确定单元还用于当频域特征信息中各参数位于信号类型对应的预设参数范围内时,确定待检测信号中存在啸叫。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,处理器和存储器相连,其中,存储器用于存储程序代码,处理器用于调用程序代码以执行第一方面的啸叫检测方法。
第四方面,本申请实施例提供了一种芯片,该芯片用于根据待检测信号的第一频带的能量和,确定待检测信号的信号类型;该第一频带的频点小于第一频点阈值;该信号类型用于指示待检测信号为语音帧信号或者非语音帧信号;
获取待检测信号的频域特征信息;
当频域特征信息中各参数位于信号类型对应的预设参数范围内时,确定待检测信号中存在啸叫。
第五方面,本申请实施例提供了一种模组设备,该模组设备包括处理器和通信接口,处理器与通信接口相连,通信接口用于收发信号,处理器用于:
根据待检测信号的第一频带的能量和,确定待检测信号的信号类型;该第一频带的频点小于第一频点阈值;该信号类型用于指示待检测信号为语音帧信号或者非语音帧信号;
获取待检测信号的频域特征信息;
当频域特征信息中各参数位于信号类型对应的预设参数范围内时,确定待检测信号中存在啸叫。
第六方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时以实现第一方面的啸叫检测方法。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供一种音频信号的处理流程示意图;
图2是本申请实施例提供一种啸叫检测方法的流程示意图;
图3是本申请实施例提供一种对语音帧信号进行啸叫检测的流程示意图;
图4是本申请实施例提供另一种对语音帧信号进行啸叫检测的流程示意图;
图5是本申请实施例提供一种对语音帧信号进行啸叫抑制的流程示意图;
图6是本申请实施例提供一种对非语音帧信号进行啸叫检测的流程示意图;
图7是本申请实施例提供另一种对非语音帧信号进行啸叫检测的流程示意图;
图8是本申请实施例提供另一种对非语音帧信号进行啸叫检测的流程示意图;
图9是本申请实施例提供一种对非语音帧信号进行啸叫抑制的流程示意图;
图10是本申请实施例提供一种啸叫检测装置的结构示意图;
图11是本申请实施例提供一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了提升音频信号的质量,可以对音频信号进行啸叫检测以及啸叫抑制。请参见图1,图1示出了一种音频信号的处理流程示意图。如图1所示,电子设备接收第一音频信号,即输入信号,并对第一音频信号进行信号分析,得到N帧第二音频信号的频域信号。然后分别对每帧第二音频信号的频域信号进行信号处理,得到第二音频信号对应的第三音频信号,最后对N帧第三音频信号进行信号合成得到输出的第四音频信号,即输出信号。
其中,信号分析可以包括分帧加窗,和傅里叶变换。由于电子设备是基于频域信号中的频域特征信息进行啸叫检测和啸叫抑制的,为了提升啸叫检测和啸叫抑制的准确性,需要准确获得频域信号所包含的频域特征信息,因此,电子设备需要将时间间隔较长的第一音频信号进行分帧加窗得到时间间隔较短的第二音频信号,然后对第二音频信号进行傅里叶变换得到第二音频信号对应的频域信号。由于第二音频信号的时间间隔较短,第二音频信号对应的频域信号能很好的体现第二音频信号的频域信息,频域特征信息更准确。其中,傅里叶变换可以包括快速傅里叶变换(fast Fourier transform,FFT)等。
其中,信号处理可以包括啸叫检测和啸叫抑制,本申请后续实施例将对此进行详细阐述,这里不赘述。
其中,信号合成可以包括逆傅里叶变换和窗口合成。其中,由于前述分别对N帧第二音频信号的频域信号进行信号处理后得到N帧第三音频信号,所以在将第三音频信号进行逆傅里叶变换后,还需要对逆傅里叶变换的N个第三音频信号的时域信号进行窗口合成得到第四音频信号。
其中,本申请所提及的电子设备可以是具有采集音频信号的任意设备,可以包括但不限于扩音系统,语音通信终端(如智能音箱、智能手机、对讲机、车载终端)和台式计算机等等,本申请对此不做限定。
基于上述描述,本申请实施例提出了一种啸叫检测方法;该啸叫检测方法可以由上述所提及的电子设备执行。参见图2所示,该啸叫检测方法可包括S201-S203:
S201:根据待检测信号的第一频带的能量和,确定待检测信号的信号类型;第一频带的频点小于第一频点阈值;信号类型用于指示待检测信号为语音帧信号或者非语音帧信号。
其中,待检测信号可以是指前文所提到的第二音频信号。电子设备可以对待检测信号进行傅里叶变换处理得到待检测信号对应的频域信号,然后根据频域信号中第一频带的能量和,确定待检测信号为语音帧信号或者非语音帧信号。
其中,由于啸叫不易出现在低频带,所以低频带的能量和只与低频带内的音频信号相关。即,当待检测信号为语音帧信号时,低频带内的能量和与低频带内的语音信号相关;当待检测信号为非语音帧信号时,低频带内的能量和与低频带内的噪声信号相关。因此,可以基于低频带内的能量和确定待检测信号为语音帧信号还是非语音帧信号。在一个实施例中,为了便于描述,可以将低频带命名为第一频带,该第一频带内的频点小于第一频点阈值。第一频点阈值可以根据业务需求或者经验设置,例如,第一频点阈值可以为400赫兹(Hz)。
具体的,可以将待检测信号表示为x(t),那么待检测信号对应的频域信号的功率可以表示为X(f)。电子设备可以根据以下公式计算得到第一频带内的能量和:
其中,E用于表示第一频带内的能量和,f0用于表示第一频点阈值,X(f)用于表示待检测信号对应的频域信号的能量。
其中,由于语音帧信号中的语音能量通常高于非语音帧中的噪声能量,那么在第一频带内,语音帧信号的能量和通常高于非语音帧信号的能量和。因此可以设置一个能量阈值来区分语音帧信号和非语音帧信号。具体的,电子设备在得到第一频带的能量和之后,可以将第一频带的能量和与能量阈值作比较。当第一频带的能量和大于能量阈值时,电子设备可以确定待检测信号中存在语音,为语音帧信号;当第一频带的能量和,小于或等于能量阈值时,电子设备可以确定待检测信号中不包含语音,包含噪声,为非语音帧信号。其中,能量阈值可以是根据业务需求或者经验设置的,本申请对此不做限制。
S202:获取待检测信号的频域特征信息;
其中,待检测信号的频域特征信息与待检测信号的信号类型相关。即语音帧信号和非语音帧信号的频域特征信号不完全相同。
在一个实施例中,若待检测信号为语音帧信号,待检测信号的频域特征信息包括以下一种或多种:第一功率谱峰值、第一候选啸叫点的谐波功率比以及第一候选啸叫点的邻近峰值比。若待检测信号为非语音帧信号,待检测信号的频域特征信息包括以下一种或多种:谱平坦度、第二功率谱峰值、第二候选啸叫点的谐波功率比以及第二候选啸叫点的邻近峰值比。
其中,功率谱峰值是指待检测信号的功率谱中的功率最大值。具体的,电子设备可以计算待检测信号对应的功率谱,然后再利用峰值检测方法获取功率谱中的峰值。例如,可以利用矩阵实验室(Matlab)中自带的寻峰(findpeaks)函数寻找功率谱中的峰值。其中,功率谱峰值可以为语音帧信号中第一功率谱峰值或者为非语音帧信号中第二功率谱峰值。
其中,候选啸叫点的谐波功率比是指候选啸叫点的功率与候选啸叫点的阶次谐波功率的比值。其中,m的取值可以是0.5,1.5,2,3等等。候选啸叫点的谐波功率比也可以称为候选啸叫点的峰值-谐波功率比(Peak-to-Harmonic Power Ratio,PHPR),可以用以下表达式计算候选啸叫点的谐波功率比:
其中,当待检测信号为语音帧信号时,候选啸叫点的谐波功率比是指第一候选啸叫点的谐波功率比。当待检测信号为非语音帧信号时,候选啸叫点的谐波功率比是指第二候选啸叫点的谐波功率比。后面详细阐述第一啸叫点和第二啸叫点,这里不做赘述。
其中,候选啸叫点的邻近峰值比是指候选啸叫点的功率与其相邻频点功率的比值。候选啸叫点的邻近峰值比也可以称为候选啸叫点的峰值-邻值功率比(Peak-to-Neighboring Power Ratio,PNPR),可以用以下表达式计算候选啸叫点的邻近峰值比:
其中,PNPR用于表示候选啸叫点的邻近峰值比,Pf用于表示候选啸叫点的功率,Pf+nΔf用于表示候选啸叫点的第n个相邻频点的功率,Δf用于表示功率谱的分辨率。
其中,当待检测信号为语音帧信号时,候选啸叫点的邻近峰值比是指第一候选啸叫点的邻近峰值比。当待检测信号为非语音帧信号时,候选啸叫点的邻近峰值比是指第二候选啸叫点的邻近峰值比。后面详细阐述第一啸叫点和第二啸叫点,这里不做赘述。
其中,谱平坦度是指幅度谱的几何平均数与幅度谱的算术平均数的比值。
S203:当频域特征信息中各参数位于信号类型对应的预设参数范围内时,确定待检测信号中存在啸叫。
其中,语音帧信号和非语音帧的频域特征信息中所包括的参数不相同,并且当待检测信号为不同信号类型的信号时,预设参数范围也不相同。即当待检测信号为语音帧信号时,语音帧信号的频域特征信息中的各参数对应于语音帧信号的预设参数范围;当待检测信号为非语音帧信号时,非语音帧信号的频域特征信息中的各参数对应于非语音帧信号的预设参数范围。
其中,当待检测信号为语音帧信号时,语音帧信号的频域特征信息包括以下一种或多种:第一功率谱峰值、第一候选啸叫点的谐波功率比以及第一候选啸叫点的邻近峰值比。那么语音帧信号对应的预设参数范围可以由以下一种或多种预设参数确定:第一频点阈值、第一谐波功率比阈值以及第一邻近峰值比阈值。
其中,当待检测信号为非语音帧信号时,非语音帧信号的频域特征信息包括以下一种或多种:谱平坦度、第二功率谱峰值、第二候选啸叫点的谐波功率比以及第二候选啸叫点的邻近峰值比。那么非语音帧信号对应的预设参数范围可以由以下一种或多种预设参数确定:谱平坦度阈值、第二频点阈值、第二谐波功率比阈值以及第二邻近峰值比阈值。
在本申请实施例中,电子设备根据第一频带内的能量和确定待检测信号是语音帧信号还是非语音帧信号。然后获取待检测信号的信号类型对应的频域特征信息,并根据频域特征信息中各参数与信号类型对应的预设参数范围确定待检测信号是否存在啸叫。本申请利用第一频带内的能量和区分语音帧信号与非语音帧信号,对语音帧信号的频域特征信息与非语音帧信号的频域特征信息分别进行分析,考虑了语音帧信号的频域特征信息和非语音帧信号的频域特征信息的区别,使得电子设备可以更准确的检测语音帧信号中的啸叫与非语音帧信号中的啸叫。
为了更好的描述本申请实施例,下面分别对语音帧信号和非语音帧信号进行阐述。
在一种实施例中,语音帧信号的频域特征信息可以包括第一功率谱峰值。参见图3,图3示出了一种对语音帧信号进行啸叫检测的流程示意图。如图3所示,包括S301-S302。
S301:获取语音帧信号的第一功率谱峰值。
其中,由于啸叫的功率较高,所以啸叫点通常为功率谱峰值所在的频点,电子设备可以查找语音帧信号中功率最大值(即第一功率谱峰值)所在的频点,再判定第一功率谱峰值所在的频点是否为啸叫点。其中,电子设备可以从语音帧信号的功率谱中查找一个或多个第一功率谱峰值。
S302:若第一功率谱峰值所在的频点大于第二频点阈值,则语音帧信号中存在啸叫。
其中,由于啸叫不易发生在低频带,所以若第一功率谱峰值所在的频点处于低频带,该第一功率谱峰值所在的频点不可能是啸叫点。具体的,电子设备可以将第一功率谱峰值所在的频点与第二频点阈值作比较,当第一功率谱峰值所在的频点大于第二频点阈值时,该第一功率谱峰值所在的频点为啸叫点;当第一功率谱峰值所在的频点小于或等于第二频点阈值时,该第一功率谱峰值所在的频点不是啸叫点,电子设备进行语音段保护,其中,语音段保护可以是指不对该语音帧信号进行处理,例如不对该语音帧进行啸叫抑制处理。
需要说明的是,当语音帧信号中存在至少一个啸叫点时,即当至少一个第一功率谱峰值所在的频点大于第二频点阈值时,该语音帧中存在啸叫。当语音帧信号中不存在啸叫点时,即所有的第一功率谱峰值所在的频点均小于或等于第二频点阈值,该语音帧中不存在啸叫。
在本申请实施例中,电子设备根据第一功率谱峰值所在的频点判断语音帧信号中是否存在啸叫。可以准确检测出语音帧信号中的啸叫。
如图3所述,电子设备可以根据第一功率谱峰值所在的频点确定语音帧信号中的啸叫点。但是如果仅仅根据第一功率谱峰值所在的频点进行判断,可能会将一些语音信号所在频点误判为啸叫点。因此在另一种实施例中,为了更准确的检测出语音帧中的啸叫点,语音帧信号的频域特征信息中还可以包括第一候选啸叫点的谐波功率比和/或第一候选啸叫点的邻近峰值比。参见图4,图4示出了一种对语音帧信号进行啸叫检测的流程示意图。如图4所示,包括S401-S403。
S401:获取语音帧信号的第一功率谱峰值。
其中,S401的具体实现可参考S301中的相关描述,这里不做赘述。
S402:若第一功率谱峰值所在的频点大于第二频点阈值,则确定第一功率谱峰值所在的频点为第一候选啸叫点。
其中,第一候选啸叫点为第一功率谱峰值所在的频点中大于第二频点阈值的频点。具体的,电子设备可以将每个第一功率谱峰值所在的频点与第二频点阈值作比较,当第一功率谱峰值所在的频点大于第二频点阈值时,可以将该第一功率谱峰值所在的频点确定为第一候选啸叫点。当第一功率谱峰值所在的频点小于或等于第二频点阈值时,该第一功率谱峰值所在的频点不存在啸叫,该第一功率谱峰值所在的频点不是第一候选啸叫点,进行语音段保护。
S403:根据第一候选啸叫点的谐波功率比和/或第一候选啸叫点的邻近峰值比进行啸叫检测。
在一种实施例中,当电子设备根据第一候选啸叫点的谐波功率比进行啸叫检测时,电子设备可以获取第一谐波功率比阈值,将第一候选啸叫点的谐波功率比与该第一谐波功率比阈值作比较,若第一候选啸叫点的谐波功率比大于第一谐波功率比阈值,则语音帧信号中存在啸叫。若第一候选啸叫点的谐波功率比小于或等于第一谐波功率比阈值,则进行语音段保护。
其中,由于啸叫的谐波较少,所以啸叫点的谐波功率比较大,因此电子设备可以将第一候选啸叫点的谐波功率比与语音帧信号对应的第一谐波功率比阈值作比较,当第一候选啸叫点的谐波功率比小于或等于第一谐波功率比阈值时,第一候选啸叫点不是啸叫点,进行语音段保护;当第一候选啸叫点的谐波功率比大于第一谐波功率比阈值时,第一候选啸叫点为啸叫点。其中,第一谐波功率比阈值可以是根据经验或者业务需求设置的。
在另一种实施例中,当电子设备根据第一候选啸叫点的邻近峰值比进行啸叫检测时,电子设备可以获取第一邻近峰值比阈值,将第一候选啸叫点的邻近峰值比与该第一邻近峰值比阈值作比较,若第一候选啸叫点的邻近峰值比大于第一邻近峰值比阈值,则语音帧信号中存在啸叫。若第一候选啸叫点的邻近峰值比小于或等于第一邻近峰值比阈值,则进行语音段保护。
由于啸叫点的功率较大,啸叫点的相邻频点的功率较低,所以啸叫点的邻近峰值比较大,因此电子设备可以将第一候选啸叫点的邻近峰值比与语音帧信号对应的第一邻近峰值比阈值作比较,当第一候选啸叫点的邻近峰值比小于或等于第一邻近峰值比阈值时,第一候选啸叫点不是啸叫点;当第一候选啸叫点的邻近峰值比大于第一邻近峰值比阈值时,第一候选啸叫点为啸叫点。其中,第一邻近峰值比阈值可以是根据经验或者业务需求设置的。
其中,第一候选啸叫点的邻近峰值比为第一候选啸叫点功率与第一参考点功率的比值。第一参考点可以为以下任意一种:频带中功率最小的频点、高于第一候选啸叫点的频点中功率最小的频点以及高于第二频点阈值的频点中功率最小的频点。
在另一种实施例中,当电子设备根据第一候选啸叫点的谐波功率比和第一候选啸叫点的邻近峰值比进行啸叫检测时,可选的,可以先判断第一候选啸叫点的谐波功率比是否处于预设参数范围内,再判断第一候选啸叫点的邻近峰值比是否处于预设参数范围内。具体的,可包括以下步骤:
s11:根据第一候选啸叫点的谐波功率比以及第一谐波功率比阈值判断第一候选啸叫点是否为啸叫点。
可选的,若第一候选啸叫点的谐波功率比小于或等于第一谐波功率比阈值,则确定第一候选啸叫点不是啸叫点,进行语音段保护。若第一候选啸叫点的谐波功率比大于第一谐波功率比阈值,则执行s12。
s12:根据第一候选啸叫点的邻近峰值比以及第一邻近峰值比阈值判断第一候选啸叫点是否为啸叫点。
若第一候选啸叫点的邻近峰值比小于或等于第一邻近峰值比阈值,则确定第一候选啸叫点不是啸叫点,进行语音段保护。若第一候选啸叫点的邻近峰值比大于第一邻近峰值比阈值,则确定第一候选啸叫点为啸叫点,语音帧信号中存在啸叫。
可选的,可以先判断第一候选啸叫点的邻近峰值比是否处于预设参数范围内,再判断第一候选啸叫点的谐波功率比是否处于预设参数范围内。具体的,可包括以下步骤:
s21:根据第一候选啸叫点的邻近峰值比以及第一邻近峰值比阈值判断第一候选啸叫点是否为啸叫点。
可选的,若第一候选啸叫点的邻近峰值比小于或等于第一邻近峰值比阈值,则确定第一候选啸叫点不是啸叫点,进行语音段保护。若第一候选啸叫点的邻近峰值比大于第一邻近峰值比阈值,则执行s22。
s22:根据第一候选啸叫点的谐波功率比以及第一谐波功率比阈值判断第一候选啸叫点是否为啸叫点。
若第一候选啸叫点的谐波功率比小于或等于第一谐波功率比阈值,则确定第一候选啸叫点不是啸叫点,进行语音段保护。若第一候选啸叫点的谐波功率比大于第一谐波功率比阈值,则确定第一候选啸叫点为啸叫点,语音帧信号中存在啸叫。
需要说明的是,当语音帧信号中存在至少一个啸叫点时,该语音帧中存在啸叫。当语音帧信号中不存在啸叫点时,该语音帧中不存在啸叫。
在本申请实施例中,电子设备根据第一候选啸叫点的谐波功率比和/或第一候选啸叫点的邻近峰值比阈值确定语音帧信号中的啸叫。可以准确检测出语音帧信号中的啸叫。
由图3和图4所示的啸叫检测方法可以检测出语音帧信号中存在的啸叫点。当检测语音帧信号中存在至少一个啸叫点时,电子设备确定存在啸叫,并可以对语音帧信号进行啸叫抑制。请参见图5,图5示出了一种对语音帧信号进行啸叫抑制的流程示意图。具体可包括以下步骤:
S501:获取语音帧信号中的至少一个第一频点,并根据至少一个第一频点的幅度值确定第一幅度值。第一频点包括语音信号帧中小于或等于第二频点阈值的频点。
其中,由于低频带内不存在啸叫点,所以可以从语音帧信号的低频带中确定第一幅度值,该第一幅度值是语音帧信号啸叫抑制过程中的基准值。
S502:根据第一幅度值对语音帧信号进行啸叫抑制。
在一个实施例中,由于利用前述图3和图4所示的啸叫检测方法可以检测出语音帧信号中的啸叫点。因此电子设备可以直接利用第一幅度值对啸叫点进行抑制,即利用第一幅度值替换语音帧信号中的啸叫点的幅度值。
在另一个实施例中,由于检测啸叫点时会存在误差,语音帧信号中的啸叫点不能完全被检测出来,为了将语音帧信号中的啸叫抑制的更纯净,当确定语音帧信号中存在啸叫时,可以利用第一幅度值对语音帧信号中的每一个频点进行处理。具体的,可以获取语音帧信号中的任意一个频点(也可以称为一个频点),若任意一个频点的幅度值大于第一幅度值,则利用第一幅度值替换该任意一个频点的幅度值。若任意一个频点的幅度值小于或等于第一幅度值,则保持任意一个频点的幅度值。
在本申请实施例中,电子设备可以对语音帧信号进行啸叫抑制,啸叫抑制后的语音帧信号更纯净。
上面描述了对语音帧信号进行啸叫检测和啸叫抑制的方法。接下来详细描述对非语音帧信号进行啸叫检测和啸叫抑制的方法。
在一种实施例中,与语音帧信号类似,非语音帧信号的频域特征信息可以包括第二功率谱峰值。参见图6,图6示出了一种对非语音帧信号进行啸叫检测的流程示意图。如图6所示,包括S601-S602。
S601:获取非语音帧信号的第二功率谱峰值。
其中,由于啸叫的功率较高,所以啸叫点通常为功率谱峰值所在的频点,电子设备可以查找非语音帧信号中功率最大值(即第二功率谱峰值)所在的频点,再判定第二功率谱峰值所在的频点是否为啸叫点。其中,电子设备可以从非语音帧信号的功率谱中查找一个或多个第二功率谱峰值。
S602:若第二功率谱峰值所在的频点大于第三频点阈值,则非语音帧信号中存在啸叫。
具体的,电子设备可以将第二功率谱峰值所在的频点与第三频点阈值作比较,当第二功率谱峰值所在的频点大于第三频点阈值时,该第二功率谱峰值所在的频点为啸叫点;当第二功率谱峰值所在的频点小于或等于第三频点阈值时,该第二功率谱峰值所在的频点不是啸叫点,电子设备进行非语音段保护,非语音段保护可以是指不对该非语音帧进行处理,例如,不对该非语音帧进行啸叫抑制处理。
需要说明的是,当非语音帧信号中存在至少一个啸叫点时,该非语音帧中存在啸叫。当非语音帧信号中不存在啸叫点时,该非语音帧中不存在啸叫。
在本申请实施例中,电子设备根据第二功率谱峰值所在的频点判断非语音帧信号中是否存在啸叫。可以准确检测出非语音帧信号中的啸叫。
如图4所述,电子设备可以根据第一候选啸叫点的谐波功率比和/或第一候选啸叫点的邻近峰值比判断语音帧信号中是否存在啸叫。类似的,电子设备可以根据第二候选啸叫点的谐波功率比和/或第二候选啸叫点的邻近峰值比判断非语音帧信号中是否存在啸叫。参见图7,图7示出了一种对非语音帧信号进行啸叫检测的流程示意图。如图7所示,包括S701-S703。
S701:获取非语音帧信号的第二功率谱峰值。
其中,S701的具体实现可参考S601的相关描述,这里不做赘述。
S702:若第二功率谱峰值所在的频点大于第三频点阈值,则确定第二功率谱峰值所在的频点为第二候选啸叫点。
其中,第二候选啸叫点为第二功率谱峰值所在的频点中大于第三频点阈值的频点。具体的,电子设备可以将每个第二功率谱峰值所在的频点与第三频点阈值作比较,当第二功率谱峰值所在的频点大于第三频点阈值时,可以将该第二功率谱峰值所在的频点确定为第二候选啸叫点。当第二功率谱峰值所在的频点小于或等于第三频点阈值时,该第二功率谱峰值所在的频点不存在啸叫,该第二功率谱峰值所在的频点不是第二候选啸叫点,进行非语音段保护。
S703:根据第二候选啸叫点的谐波功率比和/或第二候选啸叫点的邻近峰值比进行啸叫检测。
在一种实施例中,当电子设备根据第二候选啸叫点的谐波功率比进行啸叫检测时,电子设备可以获取第二谐波功率比阈值,将第二候选啸叫点的谐波功率比与该第二谐波功率比阈值作比较,若第二候选啸叫点的谐波功率比大于第二谐波功率比阈值,则非语音帧信号中存在啸叫。若第二候选啸叫点的谐波功率比小于或等于第二谐波功率比阈值,则进行非语音段保护。
其中,由于啸叫的谐波较少,所以啸叫点的谐波功率比较大,因此电子设备可以将第二候选啸叫点的谐波功率比与非语音帧信号对应的第二谐波功率比阈值作比较,当第二候选啸叫点的谐波功率比小于或等于第二谐波功率比阈值时,第二候选啸叫点不是啸叫点,进行非语音段保护;当第二候选啸叫点的谐波功率比大于第二谐波功率比阈值时,第二候选啸叫点为啸叫点。其中,第二谐波功率比阈值可以是根据经验或者业务需求设置的。
在另一种实施例中,当电子设备根据第二候选啸叫点的邻近峰值比进行啸叫检测时,电子设备可以获取第二邻近峰值比阈值,将第二候选啸叫点的邻近峰值比与该第二邻近峰值比阈值作比较,若第二候选啸叫点的邻近峰值比大于第二邻近峰值比阈值,则非语音帧信号中存在啸叫。若第二候选啸叫点的邻近峰值比小于或等于第二邻近峰值比阈值,则进行非语音段保护。
由于啸叫点的功率较大,啸叫点的相邻频点的功率较低,所以啸叫点的邻近峰值比较大,因此电子设备可以将第二候选啸叫点的邻近峰值比与非语音帧信号对应的第二邻近峰值比阈值作比较,当第二候选啸叫点的邻近峰值比小于或等于第二邻近峰值比阈值时,第二候选啸叫点不是啸叫点;当第二候选啸叫点的邻近峰值比大于第二邻近峰值比阈值时,第二候选啸叫点为啸叫点。其中,第二邻近峰值比阈值可以是根据经验或者业务需求设置的。
其中,第二候选啸叫点的邻近峰值比为第二候选啸叫点功率与第二参考点功率的比值。第二参考点可以为以下任意一种:频带中功率最小的频点、高于第二候选啸叫点的频点中功率最小的频点以及高于第三频点阈值的频点中功率最小的频点。
在另一种实施例中,当电子设备根据第二候选啸叫点的谐波功率比和第二候选啸叫点的邻近峰值比进行啸叫检测时,可选的,可以先判断第二候选啸叫点的谐波功率比是否处于预设参数范围内,再判断第二候选啸叫点的邻近峰值比是否处于预设参数范围内。具体的,可包括以下步骤:
s31:根据第二候选啸叫点的谐波功率比以及第二谐波功率比阈值判断第二候选啸叫点是否为啸叫点。
可选的,若第二候选啸叫点的谐波功率比小于或等于第二谐波功率比阈值,则确定第二候选啸叫点不是啸叫点,进行非语音段保护。若第二候选啸叫点的谐波功率比大于第二谐波功率比阈值,则执行s32。
s32:根据第二候选啸叫点的邻近峰值比以及第二邻近峰值比阈值判断第二候选啸叫点是否为啸叫点。
若第二候选啸叫点的邻近峰值比小于或等于第二邻近峰值比阈值,则确定第二候选啸叫点不是啸叫点,进行非语音段保护。若第二候选啸叫点的邻近峰值比大于第二邻近峰值比阈值,则确定第二候选啸叫点为啸叫点,非语音帧信号中存在啸叫。
可选的,可以先判断第二候选啸叫点的邻近峰值比是否处于预设参数范围内,再判断第二候选啸叫点的谐波功率比是否处于预设参数范围内。具体的,可包括以下步骤:
s41:根据第二候选啸叫点的邻近峰值比以及第二邻近峰值比阈值判断第二候选啸叫点是否为啸叫点。
可选的,若第二候选啸叫点的邻近峰值比小于或等于第二邻近峰值比阈值,则确定第二候选啸叫点不是啸叫点,进行非语音段保护。若第二候选啸叫点的邻近峰值比大于第二邻近峰值比阈值,则执行s42。
s42:根据第二候选啸叫点的谐波功率比以及第二谐波功率比阈值判断第二候选啸叫点是否为啸叫点。
若第二候选啸叫点的谐波功率比小于或等于第二谐波功率比阈值,则确定第二候选啸叫点不是啸叫点,进行非语音段保护。若第二候选啸叫点的谐波功率比大于第二谐波功率比阈值,则确定第二候选啸叫点为啸叫点,非语音帧信号中存在啸叫。
需要说明的是,当非语音帧信号中存在至少一个啸叫点时,该非语音帧中存在啸叫。当非语音帧信号中不存在啸叫点时,该非语音帧中不存在啸叫。
在本申请实施例中,电子设备根据第二候选啸叫点的谐波功率比和/或第二候选啸叫点的邻近峰值比阈值确定非语音帧信号中的啸叫。可以准确检测出非语音帧信号中的啸叫。
由于,当非语音帧中不存在啸叫时,非语音帧中只包含噪声信号,噪声信号较平稳,此时的非语音帧信号的谱平坦度较大。当非语音帧中存在啸叫时,非语音帧中包含噪声信号和啸叫,啸叫的幅度大于噪声信号,幅度的变化较大,此时的非语音帧信号的谱平坦度较小。在另一种实施例中,非语音帧信号的频域特征信息可以包括谱平坦度。参见图8,图8示出了一种对非语音帧信号进行啸叫检测的流程示意图。如图8所示,包括S801-S802。
S801:获取非语音帧信号的幅度谱,并根据幅度谱计算该非语音帧信号的谱平坦度。
具体的,电子设备可以获取非语音帧信号的幅度谱,计算幅度谱的几何平均数和幅度谱的算术平均数,并根据幅度谱的几何平均数和幅度谱的算术平均数的比值确定该非语音帧信号的谱平坦度。
S802:若谱平坦度小于或等于谱平坦度阈值,则非语音帧信号中存在啸叫。
其中,可以将谱平坦度与谱平坦度阈值作比较,当谱平坦度大于谱平坦度阈值时,该非语音帧信号不存在啸叫,进行非语音段保护。当谱平坦度小于或等于谱平坦度阈值时,该非语音帧信号存在啸叫。
需要明白,本申请实施例还可以将图8中描述的啸叫检测方法与图6或图7、中的任一项实施例相结合。例如,与图6的啸叫检测方法结合,可以先根据谱平坦度对非语音帧进行啸叫检测,若谱平坦度大于谱平坦度阈值,则进行非语音段保护。若谱平坦度小于或等于谱平坦度阈值,则利用第二功率谱峰值所在的频点对非语音帧进行啸叫检测。又例如,与图7的啸叫检测方法结合,可以先根据谱平坦度对非语音帧进行啸叫检测,若谱平坦度大于谱平坦度阈值,则进行非语音段保护。若谱平坦度小于或等于谱平坦度阈值,则利用第二候选啸叫点的谐波功率比对非语音帧进行啸叫检测。等等,这里不做赘述。
在本申请实施例中,电子设备可以根据非语音帧信号的谱平坦度判断非语音帧信号中是否存在啸叫。可以准确检测出非语音帧信号中的啸叫。
由图6、图7以及图8所示的啸叫检测方法可以检测出非语音帧信号中存在啸叫。当检测非语音帧信号中存在至少一个啸叫点时,电子设备可以对非语音帧信号进行抑制。请参见图9,图9示出了一种对非语音帧信号进行啸叫抑制的流程示意图。具体可包括以下步骤:
S901:获取非语音帧信号中的至少一个第二频点,并根据至少一个第二频点的幅度值确定第二幅度值。第二频点包括非语音信号帧中小于或等于第三频点阈值的频点。
其中,由于低频带内不存在啸叫点,所以可以从非语音帧信号的低频带中确定第二幅度值,该第二幅度值是非语音帧信号啸叫抑制过程中的基准值。
S902:根据第二幅度值对非语音帧信号进行啸叫抑制。
在一个实施例中,由于利用前述图6和图7所示的啸叫检测方法可以检测出非语音帧信号中的啸叫点。因此电子设备可以直接利用第二幅度值对啸叫点进行抑制,即利用第二幅度值替换非语音帧信号中的啸叫点的幅度值。
在另一个实施例中,由于检测啸叫点时会存在误差,非语音帧信号中的啸叫点不能完全被检测出来,为了将非语音帧信号中的啸叫抑制的更纯净,当确定非语音帧信号中存在啸叫时,可以利用第二幅度值对非语音帧信号中的每一个频点进行处理。具体的,可以获取非语音帧信号中的任意一个频点(也可以称为一个频点),若任意一个频点的幅度值大于第二幅度值,则利用第二幅度值替换该任意一个频点的幅度值。若任意一个频点的幅度值小于或等于第二幅度值,则保持任意一个频点的幅度值。
在本申请实施例中,电子设备可以对非语音帧信号进行啸叫抑制,啸叫抑制后的非语音帧信号更纯净。结合图5可知,在图5中,从语音帧信号中获取第一幅度值,并根据第一幅度值对语音帧信号进行啸叫抑制。在图9中,从非语音帧信号中获取第二幅度值,并根据第二幅度值对非语音帧信号进行啸叫抑制。针对语音帧信号和非语音帧信号采用不同的抑制系数,可以减少语音失真。并且,由于在本申请实施例中,未根据功率谱峰值的持久性进行啸叫抑制,从而本申请实施例的啸叫抑制方法不存在时延。
请参见图10,图10是本申请实施例的一种啸叫检测装置的结构示意图。该装置可以是电子设备,也可以是电子设备中的装置,或者是能够和电子设备匹配使用的装置。图10所示的啸叫检测装置可以包括确定单元1001和获取单元1002。其中:
确定单元1001,用于根据待检测信号的第一频带的能量和,确定待检测信号的信号类型;该第一频带的频点小于第一频点阈值;该信号类型用于指示待检测信号为语音帧信号或者非语音帧信号;
获取单元1002,用于获取待检测信号的频域特征信息;
确定单元1001还用于当频域特征信息中各参数位于信号类型对应的预设参数范围内时,确定待检测信号中存在啸叫。
在一些可行的实施方式中,确定单元1001根据待检测信号的第一频带的能量和,确定待检测信号的信号类型,包括:
当第一频带的能量和,大于能量阈值时,确定待检测信号为语音帧信号;
当第一频带的能量和,小于或等于能量阈值时,确定待检测信号为非语音帧信号。
在一些可行的实施方式中,该待检测信号为语音帧信号;该频域特征信息包括:第一功率谱峰值;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:第一功率谱峰值所在的频点大于第二频点阈值。
在一些可行的实施方式中,该频域特征信息包括:第一候选啸叫点的谐波功率比,该第一候选啸叫点包括第一功率谱峰值所在的频点中大于第二频点阈值的频点;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:
第一候选啸叫点的谐波功率比,大于第一谐波功率比阈值。
在一些可行的实施方式中,该频域特征信息包括:第一候选啸叫点的邻近峰值比;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第一候选啸叫点的邻近峰值比,大于第一邻近峰值比阈值。
在一些可行的实施方式中,电子设备确定待检测信号中存在啸叫之后,获取单元1002还用于:
获取语音帧信号中的至少一个第一频点,该第一频点包括语音信号帧中小于或等于第二频点阈值的频点;
获取至少一个第一频点的幅度值,并确定第一幅度值,该第一幅度值为至少一个第一频点的幅度值中的最大值;
根据第一幅度值对语音帧信号进行啸叫抑制。
在一些可行的实施方式中,获取单元1002根据第一幅度值对语音帧信号进行啸叫抑制,包括:
若语音帧信号中的一个频点的幅度值大于第一幅度值,则利用第一幅度值替换语音帧信号中的一个频点的幅度值。
在一些可行的实施方式中,待检测信号为非语音帧信号;获取单元1002还用于:获取非语音帧信号的幅度谱,并计算幅度谱的几何平均数以及算术平均数;
根据幅度谱的几何平均数和幅度谱的算术平均数确定谱平坦度。
在一些可行的实施方式中,该频域特征信息包括:谱平坦度;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:谱平坦度小于或等于谱平坦度阈值。
在一些可行的实施方式中,待检测信号为非语音帧信号;该频域特征信息包括:第二功率谱峰值;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:第二功率谱峰值所在的频点大于第三频点阈值。
在一些可行的实施方式中,该频域特征信息包括:第二候选啸叫点的谐波功率比,该第二候选啸叫点包括第二功率谱峰值所在的频点中大于第三频点阈值的频点;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第二候选啸叫点的谐波功率比,大于第二谐波功率比阈值。
在一些可行的实施方式中,该频域特征信息包括:第二候选啸叫点的邻近峰值比;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第二候选啸叫点的邻近峰值比,大于第二邻近峰值比阈值。
在一些可行的实施方式中,电子设备确定待检测信号中存在啸叫之后,获取单元1002还用于:获取非语音帧信号中的至少一个第二频点;该第二频点包括小于或等于第三频点阈值的频点;
获取至少一个第二频点的幅度值,并确定第二幅度值,该第二幅度值为至少一个第二频点的幅度值中的最大值;
根据第二幅度值对非语音帧信号进行啸叫抑制。
在一些可行的实施方式中,获取单元1002根据第二幅度值对非语音帧信号进行啸叫抑制,包括:
若非语音帧信号中的一个频点的幅度值大于第二幅度值,则利用第二幅度值替换非语音帧信号中的一个频点的幅度值。
上述啸叫检测装置例如可以是:芯片、或者模组设备。关于上述实施例中描述的各个装置、产品包含的各个单元,其可以是软件单元,也可以是硬件单元,或者也可以部分是软件单元,部分是硬件单元。例如,对于应用于或集成于芯片的各个装置、产品,其包含的各个单元可以都采用电路等硬件的方式实现,或者,至少部分单元可以采用软件程序的方式实现,该软件程序运行于芯片内部集成的处理器,剩余的(如果有)部分单元可以采用电路等硬件方式实现;对于应用于或集成于模组设备的各个装置、产品,其包含的各个单元可以都采用电路等硬件的方式实现,不同的单元可以位于模组设备的同一组件(例如芯片、电路单元等)或者不同组件中,或者,至少部分单元可以采用软件程序的方式实现,该软件程序运行于模组设备内部集成的处理器,剩余的(如果有)部分单元可以采用电路等硬件方式实现;对于应用于或集成于电子设备的各个装置、产品,其包含的各个单元可以都采用电路等硬件的方式实现,不同的单元可以位于电子设备内同一组件(例如,芯片、电路单元等)或者不同组件中,或者,至少部分单元可以采用软件程序的方式实现,该软件程序运行于电子设备内部集成的处理器,剩余的(如果有)部分单元可以采用电路等硬件方式实现。
其中,该实施方式的相关内容可参见上述方法实施例的相关内容。此处不再详述。本申请实施例和上述方法实施例基于同一构思,其带来的技术效果也相同,具体原理请参照上述方法实施例的描述,在此不赘述。
请参见图11,图11为本申请实施例提供的一种电子设备的结构示意图。该电子设备包括:处理器1101、存储器1102,处理器1101和存储器1102通过一条或多条通信总线1103连接。
上述处理器1101可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。处理器1101被配置为支持电子设备执行前述啸叫检测方法中电子设备相应的功能。
上述存储器1102可以包括只读存储器和随机存取存储器,并向处理器1101提供计算机程序和数据。存储器1102的一部分还可以包括非易失性随机存取存储器。其中,所述处理器1101调用所述计算机程序时用于执行:
根据待检测信号的第一频带的能量和,确定待检测信号的信号类型;该第一频带的频点小于第一频点阈值;该信号类型用于指示待检测信号为语音帧信号或者非语音帧信号;
获取待检测信号的频域特征信息;
当频域特征信息中各参数位于信号类型对应的预设参数范围内时,确定待检测信号中存在啸叫。
在一些可行的实施方式中,处理器1101根据待检测信号的第一频带的能量和,确定待检测信号的信号类型,包括:
当第一频带的能量和,大于能量阈值时,确定待检测信号为语音帧信号;
当第一频带的能量和,小于或等于能量阈值时,确定待检测信号为非语音帧信号。
在一些可行的实施方式中,该待检测信号为语音帧信号;该频域特征信息包括:第一功率谱峰值;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:第一功率谱峰值所在的频点大于第二频点阈值。
在一些可行的实施方式中,该频域特征信息包括:第一候选啸叫点的谐波功率比,该第一候选啸叫点包括第一功率谱峰值所在的频点中大于第二频点阈值的频点;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:
第一候选啸叫点的谐波功率比,大于第一谐波功率比阈值。
在一些可行的实施方式中,该频域特征信息包括:第一候选啸叫点的邻近峰值比;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第一候选啸叫点的邻近峰值比,大于第一邻近峰值比阈值。
在一些可行的实施方式中,处理器1101确定待检测信号中存在啸叫之后,处理器1101还用于:
获取语音帧信号中的至少一个第一频点,该第一频点包括语音信号帧中小于或等于第二频点阈值的频点;
获取至少一个第一频点的幅度值,并确定第一幅度值,该第一幅度值为至少一个第一频点的幅度值中的最大值;
根据第一幅度值对语音帧信号进行啸叫抑制。
在一些可行的实施方式中,处理器1101根据第一幅度值对语音帧信号进行啸叫抑制,包括:
若语音帧信号中的一个频点的幅度值大于第一幅度值,则利用第一幅度值替换语音帧信号中的一个频点的幅度值。
在一些可行的实施方式中,待检测信号为非语音帧信号;处理器1101还用于:获取非语音帧信号的幅度谱,并计算幅度谱的几何平均数以及算术平均数;
根据幅度谱的几何平均数和幅度谱的算术平均数确定谱平坦度。
在一些可行的实施方式中,该频域特征信息包括:谱平坦度;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:谱平坦度小于或等于谱平坦度阈值。
在一些可行的实施方式中,待检测信号为非语音帧信号;该频域特征信息包括:第二功率谱峰值;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:第二功率谱峰值所在的频点大于第三频点阈值。
在一些可行的实施方式中,该频域特征信息包括:第二候选啸叫点的谐波功率比,该第二候选啸叫点包括第二功率谱峰值所在的频点中大于第三频点阈值的频点;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第二候选啸叫点的谐波功率比,大于第二谐波功率比阈值。
在一些可行的实施方式中,该频域特征信息包括:第二候选啸叫点的邻近峰值比;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第二候选啸叫点的邻近峰值比,大于第二邻近峰值比阈值。
在一些可行的实施方式中,处理器1101确定待检测信号中存在啸叫之后,处理器1101还用于:
获取非语音帧信号中的至少一个第二频点;该第二频点包括小于或等于第三频点阈值的频点;
获取至少一个第二频点的幅度值,并确定第二幅度值,该第二幅度值为至少一个第二频点的幅度值中的最大值;
根据第二幅度值对非语音帧信号进行啸叫抑制。
在一些可行的实施方式中,处理器1101根据第二幅度值对非语音帧信号进行啸叫抑制,包括:
若非语音帧信号中的一个频点的幅度值大于第二幅度值,则利用第二幅度值替换非语音帧信号中的一个频点的幅度值。
其中,该实施方式的相关内容可参见上述方法实施例的相关内容。此处不再详述。本申请实施例和上述方法实施例基于同一构思,其带来的技术效果也相同,具体原理请参照上述方法实施例的描述,在此不赘述。
本申请实施例提供一种芯片,该芯片可以执行前述方法实施例中电子设备的相关步骤。该芯片用于:
根据待检测信号的第一频带的能量和,确定待检测信号的信号类型;该第一频带的频点小于第一频点阈值;该信号类型用于指示待检测信号为语音帧信号或者非语音帧信号;
获取待检测信号的频域特征信息;
当频域特征信息中各参数位于信号类型对应的预设参数范围内时,确定待检测信号中存在啸叫。
在一些可行的实施方式中,该芯片根据待检测信号的第一频带的能量和,确定待检测信号的信号类型,包括:
当第一频带的能量和,大于能量阈值时,确定待检测信号为语音帧信号;
当第一频带的能量和,小于或等于能量阈值时,确定待检测信号为非语音帧信号。
在一些可行的实施方式中,该待检测信号为语音帧信号;该频域特征信息包括:第一功率谱峰值;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:第一功率谱峰值所在的频点大于第二频点阈值。
在一些可行的实施方式中,该频域特征信息包括:第一候选啸叫点的谐波功率比,该第一候选啸叫点包括第一功率谱峰值所在的频点中大于第二频点阈值的频点;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:
第一候选啸叫点的谐波功率比,大于第一谐波功率比阈值。
在一些可行的实施方式中,该频域特征信息包括:第一候选啸叫点的邻近峰值比;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第一候选啸叫点的邻近峰值比,大于第一邻近峰值比阈值。
在一些可行的实施方式中,该芯片确定待检测信号中存在啸叫之后,该芯片还用于:
获取语音帧信号中的至少一个第一频点,该第一频点包括语音信号帧中小于或等于第二频点阈值的频点;
获取至少一个第一频点的幅度值,并确定第一幅度值,该第一幅度值为至少一个第一频点的幅度值中的最大值;
根据第一幅度值对语音帧信号进行啸叫抑制。
在一些可行的实施方式中,该芯片根据第一幅度值对语音帧信号进行啸叫抑制,包括:
若语音帧信号中的一个频点的幅度值大于第一幅度值,则利用第一幅度值替换语音帧信号中的一个频点的幅度值。
在一些可行的实施方式中,待检测信号为非语音帧信号;该芯片还用于:获取非语音帧信号的幅度谱,并计算幅度谱的几何平均数以及算术平均数;
根据幅度谱的几何平均数和幅度谱的算术平均数确定谱平坦度。
在一些可行的实施方式中,该频域特征信息包括:谱平坦度;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:谱平坦度小于或等于谱平坦度阈值。
在一些可行的实施方式中,待检测信号为非语音帧信号;该频域特征信息包括:第二功率谱峰值;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:第二功率谱峰值所在的频点大于第三频点阈值。
在一些可行的实施方式中,该频域特征信息包括:第二候选啸叫点的谐波功率比,该第二候选啸叫点包括第二功率谱峰值所在的频点中大于第三频点阈值的频点;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第二候选啸叫点的谐波功率比,大于第二谐波功率比阈值。
在一些可行的实施方式中,该频域特征信息包括:第二候选啸叫点的邻近峰值比;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第二候选啸叫点的邻近峰值比,大于第二邻近峰值比阈值。
在一些可行的实施方式中,该芯片确定待检测信号中存在啸叫之后,该芯片还用于:
获取非语音帧信号中的至少一个第二频点;该第二频点包括小于或等于第三频点阈值的频点;
获取至少一个第二频点的幅度值,并确定第二幅度值,该第二幅度值为至少一个第二频点的幅度值中的最大值;
根据第二幅度值对非语音帧信号进行啸叫抑制。
在一些可行的实施方式中,该芯片根据第二幅度值对非语音帧信号进行啸叫抑制,包括:
若非语音帧信号中的一个频点的幅度值大于第二幅度值,则利用第二幅度值替换非语音帧信号中的一个频点的幅度值。
其中,该实施方式的相关内容可参见上述方法实施例的相关内容。此处不再详述。本申请实施例和上述方法实施例基于同一构思,其带来的技术效果也相同,具体原理请参照上述方法实施例的描述,在此不赘述。
本申请实施例还提供一种模组设备,模组设备包括处理器和通信接口,处理器与通信接口相连,通信接口用于收发信号,处理器用于:
根据待检测信号的第一频带的能量和,确定待检测信号的信号类型;该第一频带的频点小于第一频点阈值;该信号类型用于指示待检测信号为语音帧信号或者非语音帧信号;
获取待检测信号的频域特征信息;
当频域特征信息中各参数位于信号类型对应的预设参数范围内时,确定待检测信号中存在啸叫。
在一些可行的实施方式中,该处理器根据待检测信号的第一频带的能量和,确定待检测信号的信号类型,包括:
当第一频带的能量和,大于能量阈值时,确定待检测信号为语音帧信号;
当第一频带的能量和,小于或等于能量阈值时,确定待检测信号为非语音帧信号。
在一些可行的实施方式中,该待检测信号为语音帧信号;该频域特征信息包括:第一功率谱峰值;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:第一功率谱峰值所在的频点大于第二频点阈值。
在一些可行的实施方式中,该频域特征信息包括:第一候选啸叫点的谐波功率比,该第一候选啸叫点包括第一功率谱峰值所在的频点中大于第二频点阈值的频点;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:
第一候选啸叫点的谐波功率比,大于第一谐波功率比阈值。
在一些可行的实施方式中,该频域特征信息包括:第一候选啸叫点的邻近峰值比;
该频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第一候选啸叫点的邻近峰值比,大于第一邻近峰值比阈值。
在一些可行的实施方式中,该芯片确定待检测信号中存在啸叫之后,该芯片还用于:
获取语音帧信号中的至少一个第一频点,该第一频点包括语音信号帧中小于或等于第二频点阈值的频点;
获取至少一个第一频点的幅度值,并确定第一幅度值,该第一幅度值为至少一个第一频点的幅度值中的最大值;
根据第一幅度值对语音帧信号进行啸叫抑制。
在一些可行的实施方式中,根据第一幅度值对语音帧信号进行啸叫抑制,包括:
若语音帧信号中的一个频点的幅度值大于第一幅度值,则利用第一幅度值替换语音帧信号中的一个频点的幅度值。
在一些可行的实施方式中,待检测信号为非语音帧信号;该芯片还用于:获取非语音帧信号的幅度谱,并计算幅度谱的几何平均数以及算术平均数;
根据幅度谱的几何平均数和幅度谱的算术平均数确定谱平坦度。
在一些可行的实施方式中,该频域特征信息包括:谱平坦度;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:谱平坦度小于或等于谱平坦度阈值。
在一些可行的实施方式中,待检测信号为非语音帧信号;该频域特征信息包括:第二功率谱峰值;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:第二功率谱峰值所在的频点大于第三频点阈值。
在一些可行的实施方式中,该频域特征信息包括:第二候选啸叫点的谐波功率比,该第二候选啸叫点包括第二功率谱峰值所在的频点中大于第三频点阈值的频点;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第二候选啸叫点的谐波功率比,大于第二谐波功率比阈值。
在一些可行的实施方式中,该频域特征信息包括:第二候选啸叫点的邻近峰值比;
频域特征信息中各参数位于信号类型对应的预设参数范围包括:
该第二候选啸叫点的邻近峰值比,大于第二邻近峰值比阈值。
在一些可行的实施方式中,确定待检测信号中存在啸叫之后,还用于:
获取非语音帧信号中的至少一个第二频点;该第二频点包括小于或等于第三频点阈值的频点;
获取至少一个第二频点的幅度值,并确定第二幅度值,该第二幅度值为至少一个第二频点的幅度值中的最大值;
根据第二幅度值对非语音帧信号进行啸叫抑制。
在一些可行的实施方式中,根据第二幅度值对非语音帧信号进行啸叫抑制,包括:
若非语音帧信号中的一个频点的幅度值大于第二幅度值,则利用第二幅度值替换非语音帧信号中的一个频点的幅度值。
其中,该实施方式的相关内容可参见上述方法实施例的相关内容。此处不再详述。本申请实施例和上述方法实施例基于同一构思,其带来的技术效果也相同,具体原理请参照上述方法实施例的描述,在此不赘述。
本申请实施例还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,可以用于实现本申请实施例描述的啸叫检测方法,在此不再赘述。
计算机可读存储介质可以是前述任一实施例的电子设备的内部存储单元,例如设备的硬盘或内存。计算机可读存储介质也可以是电子设备的外部存储设备,例如设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,计算机可读存储介质还可以既包括电子设备的内部存储单元也包括外部存储设备。计算机可读存储介质用于存储计算机程序以及电子设备所需的其他程序和数据。计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于可读取存储介质中,所述程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。
Claims (19)
1.一种啸叫检测方法,其特征在于,所述方法包括:
根据待检测信号的第一频带的能量和,确定所述待检测信号的信号类型;所述第一频带的频点小于第一频点阈值;所述信号类型用于指示所述待检测信号为语音帧信号或者非语音帧信号;
获取所述待检测信号的频域特征信息;
当所述频域特征信息中各参数位于所述信号类型对应的预设参数范围内时,确定所述待检测信号中存在啸叫;
根据所述待检测信号的基准值对所述待检测信号进行啸叫抑制;所述基准值是由小于或等于所述信号类型对应的频点阈值的频点的幅度值确定的。
2.如权利要求1所述的方法,其特征在于,所述根据待检测信号的第一频带的能量和,确定所述待检测信号的信号类型,包括:
当所述第一频带的能量和,大于能量阈值时,确定所述待检测信号为语音帧信号;
当所述第一频带的能量和,小于或等于所述能量阈值时,确定所述待检测信号为非语音帧信号。
3.如权利要求1所述的方法,其特征在于,所述待检测信号为语音帧信号;所述频域特征信息包括:第一功率谱峰值;
所述频域特征信息中各参数位于所述信号类型对应的预设参数范围包括:所述第一功率谱峰值所在的频点大于第二频点阈值。
4.如权利要求3所述的方法,其特征在于,所述频域特征信息包括:第一候选啸叫点的谐波功率比,所述第一候选啸叫点包括所述第一功率谱峰值所在的频点中大于所述第二频点阈值的频点;
所述频域特征信息中各参数位于所述信号类型对应的预设参数范围包括:
所述第一候选啸叫点的谐波功率比,大于第一谐波功率比阈值。
5.如权利要求4所述的方法,其特征在于,所述频域特征信息包括:所述第一候选啸叫点的邻近峰值比;
所述频域特征信息中各参数位于所述信号类型对应的预设参数范围包括:
所述第一候选啸叫点的邻近峰值比,大于第一邻近峰值比阈值。
6.如权利要求3-5任一项所述的方法,其特征在于,所述方法还包括:
获取所述语音帧信号中的至少一个第一频点,所述第一频点包括所述语音帧信号中小于或等于所述第二频点阈值的频点;
获取所述至少一个第一频点的幅度值,并确定第一幅度值,所述第一幅度值为所述至少一个第一频点的幅度值中的最大值;
将所述第一幅度值确定为所述待检测信号的基准值。
7.如权利要求6所述的方法,其特征在于,所述根据所述待检测信号的基准值对所述待检测信号进行啸叫抑制,包括:
若所述语音帧信号中的一个频点的幅度值大于所述第一幅度值,则利用所述第一幅度值替换所述语音帧信号中的一个频点的幅度值。
8.如权利要求1所述的方法,其特征在于,所述待检测信号为非语音帧信号;所述方法还包括:
获取所述非语音帧信号的幅度谱,并计算所述幅度谱的几何平均数以及算术平均数;
根据所述幅度谱的几何平均数和所述幅度谱的算术平均数确定谱平坦度。
9.如权利要求8所述的方法,其特征在于,所述频域特征信息包括:所述谱平坦度;
所述频域特征信息中各参数位于所述信号类型对应的预设参数范围包括:所述谱平坦度小于或等于谱平坦度阈值。
10.如权利要求1所述的方法,其特征在于,所述待检测信号为非语音帧信号;所述频域特征信息包括:第二功率谱峰值;
所述频域特征信息中各参数位于所述信号类型对应的预设参数范围包括:所述第二功率谱峰值所在的频点大于第三频点阈值。
11.如权利要求10所述的方法,其特征在于,所述频域特征信息包括:第二候选啸叫点的谐波功率比,所述第二候选啸叫点包括所述第二功率谱峰值所在的频点中大于所述第三频点阈值的频点;
所述频域特征信息中各参数位于所述信号类型对应的预设参数范围包括:
所述第二候选啸叫点的谐波功率比,大于第二谐波功率比阈值。
12.如权利要求11所述的方法,其特征在于,所述频域特征信息包括:所述第二候选啸叫点的邻近峰值比;
所述频域特征信息中各参数位于所述信号类型对应的预设参数范围包括:
所述第二候选啸叫点的邻近峰值比,大于第二邻近峰值比阈值。
13.如权利要求10-12任一项所述的方法,其特征在于,所述方法还包括:
获取所述非语音帧信号中的至少一个第二频点;所述第二频点包括小于或等于所述第三频点阈值的频点;
获取所述至少一个第二频点的幅度值,并确定第二幅度值,所述第二幅度值为所述至少一个第二频点的幅度值中的最大值;
将所述第二幅度值确定为所述待检测信号的基准值。
14.如权利要求13所述的方法,其特征在于,所述根据所述待检测信号的基准值对所述待检测信号进行啸叫抑制,包括:
若所述非语音帧信号中的一个频点的幅度值大于所述第二幅度值,则利用所述第二幅度值替换所述非语音帧信号中的一个频点的幅度值。
15.一种啸叫检测装置,其特征在于,所述装置包括:
确定单元,用于根据待检测信号的第一频带的能量和,确定所述待检测信号的信号类型;所述第一频带的频点小于第一频点阈值;所述信号类型用于指示所述待检测信号为语音帧信号或者非语音帧信号;
获取单元,用于获取所述待检测信号的频域特征信息;
所述确定单元还用于当所述频域特征信息中各参数位于所述信号类型对应的预设参数范围内时,确定所述待检测信号中存在啸叫;
处理单元,用于根据所述待检测信号的基准值对所述待检测信号进行啸叫抑制;所述基准值是由小于或等于所述信号类型对应的频点阈值的频点的幅度值确定的。
16.一种电子设备,其特征在于,包括处理器和存储器,所述处理器和存储器相连,其中,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如权利要求1至14任一项所述的啸叫检测方法。
17.一种芯片,其特征在于,所述芯片包括处理器,所述处理器用于:
根据待检测信号的第一频带的能量和,确定所述待检测信号的信号类型;所述第一频带的频点小于第一频点阈值;所述信号类型用于指示所述待检测信号为语音帧信号或者非语音帧信号;
获取所述待检测信号的频域特征信息;
当所述频域特征信息中各参数位于所述信号类型对应的预设参数范围内时,确定所述待检测信号中存在啸叫;
根据所述待检测信号的基准值对所述待检测信号进行啸叫抑制;所述基准值是由小于或等于所述信号类型对应的频点阈值的频点的幅度值确定的。
18.一种模组设备,其特征在于,所述模组设备包括处理器和通信接口,所述处理器与所述通信接口相连,所述通信接口用于收发信号,所述处理器用于:
根据待检测信号的第一频带的能量和,确定所述待检测信号的信号类型;所述第一频带的频点小于第一频点阈值;所述信号类型用于指示所述待检测信号为语音帧信号或者非语音帧信号;
获取所述待检测信号的频域特征信息;
当所述频域特征信息中各参数位于所述信号类型对应的预设参数范围内时,确定所述待检测信号中存在啸叫;
根据所述待检测信号的基准值对所述待检测信号进行啸叫抑制;所述基准值是由小于或等于所述信号类型对应的频点阈值的频点的幅度值确定的。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述权利要求1至14任一项所述的啸叫检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110512494.1A CN113316075B (zh) | 2021-05-11 | 2021-05-11 | 一种啸叫检测方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110512494.1A CN113316075B (zh) | 2021-05-11 | 2021-05-11 | 一种啸叫检测方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113316075A CN113316075A (zh) | 2021-08-27 |
CN113316075B true CN113316075B (zh) | 2023-02-14 |
Family
ID=77372839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110512494.1A Active CN113316075B (zh) | 2021-05-11 | 2021-05-11 | 一种啸叫检测方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113316075B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114582371B (zh) * | 2022-04-29 | 2022-07-08 | 北京百瑞互联技术有限公司 | 基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06327088A (ja) * | 1993-05-14 | 1994-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 音響系設計・運用支援装置及び適応制御型イコライザ装置 |
US8891786B1 (en) * | 2010-05-17 | 2014-11-18 | Marvell International Ltd. | Selective notch filtering for howling suppression |
CN106453762A (zh) * | 2016-11-02 | 2017-02-22 | 上海数果科技有限公司 | 音频系统中语音啸叫的处理方法及系统 |
CN109102819A (zh) * | 2017-06-20 | 2018-12-28 | 中移(杭州)信息技术有限公司 | 一种啸叫检测方法及装置 |
CN110536215A (zh) * | 2019-09-09 | 2019-12-03 | 普联技术有限公司 | 音频信号处理的方法、装置、计算设置及存储介质 |
CN111477246A (zh) * | 2019-01-24 | 2020-07-31 | 腾讯科技(深圳)有限公司 | 语音处理方法、装置及智能终端 |
CN111800725A (zh) * | 2020-05-29 | 2020-10-20 | 展讯通信(上海)有限公司 | 啸叫检测方法及装置、存储介质、计算机设备 |
CN111883163A (zh) * | 2020-04-02 | 2020-11-03 | 珠海市杰理科技股份有限公司 | 音频啸叫抑制方法、设备和系统及神经网络训练方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106303878A (zh) * | 2015-05-22 | 2017-01-04 | 成都鼎桥通信技术有限公司 | 一种啸叫检测和抑制方法 |
CN107507621B (zh) * | 2017-07-28 | 2021-06-22 | 维沃移动通信有限公司 | 一种噪声抑制方法及移动终端 |
-
2021
- 2021-05-11 CN CN202110512494.1A patent/CN113316075B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06327088A (ja) * | 1993-05-14 | 1994-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 音響系設計・運用支援装置及び適応制御型イコライザ装置 |
US8891786B1 (en) * | 2010-05-17 | 2014-11-18 | Marvell International Ltd. | Selective notch filtering for howling suppression |
CN106453762A (zh) * | 2016-11-02 | 2017-02-22 | 上海数果科技有限公司 | 音频系统中语音啸叫的处理方法及系统 |
CN109102819A (zh) * | 2017-06-20 | 2018-12-28 | 中移(杭州)信息技术有限公司 | 一种啸叫检测方法及装置 |
CN111477246A (zh) * | 2019-01-24 | 2020-07-31 | 腾讯科技(深圳)有限公司 | 语音处理方法、装置及智能终端 |
CN110536215A (zh) * | 2019-09-09 | 2019-12-03 | 普联技术有限公司 | 音频信号处理的方法、装置、计算设置及存储介质 |
CN111883163A (zh) * | 2020-04-02 | 2020-11-03 | 珠海市杰理科技股份有限公司 | 音频啸叫抑制方法、设备和系统及神经网络训练方法 |
CN111800725A (zh) * | 2020-05-29 | 2020-10-20 | 展讯通信(上海)有限公司 | 啸叫检测方法及装置、存储介质、计算机设备 |
Non-Patent Citations (2)
Title |
---|
A robust howling detection algorithm based on a statistical approach;Cholet;《14th IWAENC》;20141231;第1-5页 * |
音频啸叫信号的快速识别与检测技术;张洪英;《电声技术》;20191231;第43卷(第12期);第73-77页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113316075A (zh) | 2021-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11011182B2 (en) | Audio processing system for speech enhancement | |
US8422696B2 (en) | Apparatus and method for removing noise | |
US20070136053A1 (en) | Music detector for echo cancellation and noise reduction | |
US20100161324A1 (en) | Noise detection apparatus, noise removal apparatus, and noise detection method | |
KR20080092404A (ko) | 음성 향상을 위해 마이크로폰 사이의 레벨 차이를 활용하는시스템 및 방법 | |
JP2010112996A (ja) | 音声処理装置、音声処理方法およびプログラム | |
CN109074814B (zh) | 一种噪声检测方法及终端设备 | |
US20100111290A1 (en) | Call Voice Processing Apparatus, Call Voice Processing Method and Program | |
US11437054B2 (en) | Sample-accurate delay identification in a frequency domain | |
CN110970051A (zh) | 语音数据采集方法、终端及可读存储介质 | |
CN110503973B (zh) | 音频信号瞬态噪音抑制方法、系统以及存储介质 | |
AU2024200622A1 (en) | Methods and apparatus to fingerprint an audio signal via exponential normalization | |
CN113316075B (zh) | 一种啸叫检测方法、装置及电子设备 | |
JP2016042613A (ja) | 目的音声区間検出装置、目的音声区間検出方法、目的音声区間検出プログラム、音声信号処理装置及びサーバ | |
US9351072B2 (en) | Multi-band harmonic discrimination for feedback suppression | |
CN106816157A (zh) | 语音识别方法及装置 | |
CN106847299B (zh) | 延时的估计方法及装置 | |
CN111477246B (zh) | 语音处理方法、装置及智能终端 | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
US20230352039A1 (en) | Audio signal processing method, electronic device and storage medium | |
CN113316074B (zh) | 一种啸叫检测方法、装置及电子设备 | |
CN114678038A (zh) | 音频噪声检测方法、计算机设备和计算机程序产品 | |
CN112581975A (zh) | 基于信号混叠和双声道相关性的超声波语音指令防御方法 | |
JP6763319B2 (ja) | 非目的音判定装置、プログラム及び方法 | |
US20210174820A1 (en) | Signal processing apparatus, voice speech communication terminal, signal processing method, and signal processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |