CN111800725B - 啸叫检测方法及装置、存储介质、计算机设备 - Google Patents

啸叫检测方法及装置、存储介质、计算机设备 Download PDF

Info

Publication number
CN111800725B
CN111800725B CN202010475966.6A CN202010475966A CN111800725B CN 111800725 B CN111800725 B CN 111800725B CN 202010475966 A CN202010475966 A CN 202010475966A CN 111800725 B CN111800725 B CN 111800725B
Authority
CN
China
Prior art keywords
frequency
detected
signal
howling
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010475966.6A
Other languages
English (en)
Other versions
CN111800725A (zh
Inventor
潘思伟
罗本彪
雍雅琴
陈皓
戚萌
董斐
林福辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Shanghai Co Ltd
Original Assignee
Spreadtrum Communications Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Shanghai Co Ltd filed Critical Spreadtrum Communications Shanghai Co Ltd
Priority to CN202010475966.6A priority Critical patent/CN111800725B/zh
Publication of CN111800725A publication Critical patent/CN111800725A/zh
Application granted granted Critical
Publication of CN111800725B publication Critical patent/CN111800725B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17813Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the acoustic paths, e.g. estimating, calibrating or testing of transfer functions or cross-terms
    • G10K11/17819Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the acoustic paths, e.g. estimating, calibrating or testing of transfer functions or cross-terms between the output signals and the reference signals, e.g. to prevent howling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17821Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only

Abstract

一种啸叫检测方法及装置、存储介质、计算机设备,其中,所述方法包括:对待检测信号的频域信号进行峰值检测,在所述频域信号中识别一个或多个频谱峰值对应的待检测频率;检测各个待检测频率的次谐波,并分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系;根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率。通过该方案,无需引入信号的时域特征,即可准确地检测啸叫。

Description

啸叫检测方法及装置、存储介质、计算机设备
技术领域
本发明涉及音频信号处理领域,尤其涉及一种啸叫检测方法及装置、存储介质、计算机设备。
背景技术
针对音频设备,如扩音系统、助听器、语音通信终端等在某些情况下(例如麦克风与扬声器距离较近时)出现啸叫的问题。例如,在扩声系统中,传声器的输入信号经功率放大器放大后由扬声器输出,输出信号经边界反射、折射,重新被传声器拾取,形成了一个闭环回路,称为声反馈。根据奈奎斯特稳定性判据,当某频点的开环传递函数的幅度大于等于1,且开环传递函数的相位为2π的整数倍时,系统是不稳定的,典型的不稳定现象是产生啸叫。啸叫限制了系统的最大稳定增益(Maximum Stable Gain,简称MSG),严重时可能会损坏系统。
针对啸叫抑制的研究已有50多年的历史,主要的方法有:陷波法,移频法,自适应反馈抵消法等。其中,陷波法因具有抑制效果明显、易于实现等特点而在实际中被广泛应用。陷波法主要由两部分组成,第一部分为啸叫检测,第二部分为陷波器设计。在陷波法中,能否设计出有效的啸叫检测方法,即实现快速准确的检测到啸叫发生及啸叫频点,是陷波法的关键,它直接决定着最终啸叫抑制的性能。因为啸叫的漏检会导致啸叫不能得到及时有效的抑制,而误检会导致语音信号的失真,影响扩声系统性能。
然而现有的啸叫检测方法仍易发生误检和漏检,由此,亟需一种啸叫检测方法,以提高啸叫检测的检测效果。
发明内容
本发明解决的技术问题如何降低啸叫检测的误检和漏检,提高检测效果。
为解决上述技术问题,本发明实施例提供一种啸叫检测方法,所述方法包括:对待检测信号的频域信号进行峰值检测,在所述频域信号中识别一个或多个频谱峰值对应的待检测频率;检测各个待检测频率的次谐波,并分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系;根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率。
可选的,所述分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系,包括:计算各个待检测频率的信号功率与其相邻频率的信号功率的比值,记作第一比值。
可选的,相邻频率的信号功率为多个频率的信号功率的均值。
可选的,所述检测各个待检测频率的次谐波,包括:获取各个待检测频率的信号功率与其
Figure GDA0002669591260000021
阶频率功率的比值,记作第二比值,其中,m为大于1的正整数。
可选的,所述根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率,包括:确定第一比值大于第一阈值且第二比值大于第二阈值对应的待检测频率为啸叫频率。
可选的,所述对待检测信号的频域信号进行峰值检测之前,还包括:获取待检测信号的时域信号,对所述时域信号进行分帧;对分帧后的时域信号进行时频转换,得到待检测信号的频域信号。
可选的,所述对所述时域信号进行分帧之后,还包括:按照预设的检测周期对分帧后的时域信号进行周期性抽取;所述对分帧后的时域信号进行时频转换,包括:对抽取的分帧后的时域信号进行时频转换。
可选的,所述在所述频域信号中识别一个或多个频谱峰值对应的待检测频率之后,所述方法还包括:去除频率低于预设值的待检测频率。
本发明实施例还提供一种啸叫检测装置,所述装置包括:峰值提取模块,用于对待检测信号的频域信号进行峰值检测,在所述频域信号中识别一个或多个频谱峰值对应的待检测频率;分析模块,用于检测各个待检测频率的次谐波,并分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系;啸叫判断模块,用于根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率。
本发明实施例还提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一项所述啸叫检测方法的步骤。
本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一项所述啸叫检测方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
本发明实施例提供的一种啸叫检测方法,包括:对待检测信号的频域信号进行峰值检测,在所述频域信号中识别一个或多个频谱峰值对应的待检测频率;检测各个待检测频率的次谐波,并分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系;根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率。较之现有技术,本发明实施例的啸叫检测方法,综合了啸叫频率处的声音信号成分通常无次谐波且为频谱的峰值的特点,形成联合的啸叫判定准则,能够有效提高啸叫检测的准确率,减少误检和漏检。另外,无需引入基于时域特征的检测方法(如IPMP或IMSD),全部在频域内实施,具有判决速度快,计算复杂度低的特点。
进一步地,利用啸叫通常发生在信号峰值的特点,通过统计功率谱峰值与其邻近频点功率的比值,也即PNPR来区分语音和啸叫。
进一步地,利用啸叫成分没有谐波分量的特点,通过统计功率谱峰值与其
Figure GDA0002669591260000031
阶谐波功率的比值,也即次谐波PHPR,来区分语音和啸叫。
进一步地,通过对时域信号的分帧处理,使得每帧时域信号的时间相对较短,对其转化后的频域信号的特性分析更为准确。
进一步地,可通过预设的检测周期对时域分帧后的时域信号进行周期性抽取,改变检测的频次。
进一步地,由于啸叫现象通常在中高频出现,可对提取的峰值经过频带控制后去除低频带(频率低于预设值的频带)内的峰值,然后将其余的峰值对应的频率作为待检测频率。
附图说明
图1是现有技术中一种典型的啸叫检测及抑制系统的示意图;
图2是本发明实施例一种啸叫检测方法的流程示意图;
图3是本发明实施例一种啸叫检测方法的部分示意图;
图4是本发明实施例一种啸叫检测装置的结构示意图;
图5是本发明实施例另一种啸叫检测装置的结构示意图。
具体实施方式
如背景技术中所述,现有的啸叫检测方法检测效果较差,易发生误检和漏检。
请参见图1,图1提供了现有技术中一种典型的啸叫检测及抑制系统示意图;在不考虑声反馈时,近端语音信号101被传声器102拾取得到输入信号103(105),经过功放的前向增益单元106作用后得到放大后的信号107,再经过扬声器108播放后得到放大后的语音信号109,从而更容易被人耳接收到。当考虑声反馈时,放大后的语音信号109经声反馈回路110形成反馈语音信号111,反馈语音信号111被传声器102拾取形成了一个闭环回路。
当功放的前向增益106和声反馈回路110满足奈奎斯特准则时,系统会趋向不稳定,产生啸叫。
啸叫检测单元112对传声器102的输入信号103进行检测,若检测到啸叫成分,则输出相关设计参数(也可称为指令)113给滤波系统104,输入信号103经滤波系统104滤波后输出啸叫抑制后的信号105,经前向增益单元106后得到放大信号107,再经扬声器108播放得到放大语音109,形成一个完整的啸叫检测及抑制系统。
若未检测到啸叫成分,则输出指令113给滤波系统104,不对输入信号103做滤波,此时前向增益106的输入信号就是传声器102的输入信号103。
图1中啸叫检测单元112目前所采用的啸叫检测方法主要是基于不同的检测特征,可分为频域特征和时域特征。
基于频域特征的检测方法包括峰值-阈值功率比(peak-to-threshold powerratio,简称PTPR),峰值-均值功率比(peak-to-average power ratio,简称PAPR),峰值-谐波功率比(peak-to-harmonic power ratio,简称PHPR),峰值-邻值功率比(peak-to-neighboring power ratio,简称PNPR)等。
基于时域特征的检测方法包括帧间峰值幅度保持(interframe peak magnitudepersistence,简称IPMP),帧间幅度斜率偏差(interframe magnitude slope deviation,简称IMSD)等。
在这些方法中,基于PTPR和PAPR的方法来判定是否产生啸叫,该方法简单且应用最为广泛,但存在误检率偏高的问题。基于IMSD的时域方法,依据啸叫成分的幅度谱近似呈对数增长的特点,通过在对数刻度下统计幅度谱的变化斜率在不同信号帧之间的偏差,以判定是否产生啸叫,该方法虽优于基于IPMP的时域方法,但误检率均高于基于PHPR和PNPR的频域方法,因此必须得与频域方法组合才能有效控制误检率,否则容易造成输出语音失真,影响扩音效果。
为解决上述问题,本发明实施例提供了一种啸叫检测方法及装置、存储介质、计算机设备,其中,啸叫检测方法包括:对待检测信号的频域信号进行峰值检测,在所述频域信号中识别一个或多个频谱峰值对应的待检测频率;检测各个待检测频率的次谐波,并分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系;根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率。
通过该方案,能够减少误检和漏检的发生,以提高啸叫检测的检测效果。从而,可为后续啸叫抑制提供输入。该啸叫检测系统能够及时而准确的检测出啸叫的发生,定位啸叫产生的频点,并对其他能量较高的频率成分有较强的防误检能力,从而为后续啸叫抑制的实施提供准确的设计输入。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
请参见图2,图2为本发明实施例的一种啸叫检测方法的流程示意图,该啸叫检测方法具体可以包括下述步骤S201至S203,其中:
步骤S201,对待检测信号的频域信号进行频谱检测,在所述频域信号中识别一个或多个频谱峰值对应的待检测频率;
在获取待检测信号的频域信号后,先对频域信号进行频谱分析以检测该频域信号的峰值,在频域信号的频谱中识别频谱的各个峰值,并获取各个峰值对应的频域信号的频率,记作待检测频率。
其中,获取频域信号的频谱的峰值的方法可以采用现有的频偏分析和峰值检测方法,例如,可以利用矩阵实验室(Matlab)中自带的寻峰(findpeaks)函数来寻找频域信号的频谱图的峰值和其对应的待检测频率。
步骤S202,检测各个待检测频率的次谐波,并分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系;
步骤S203,根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率。
对于发生啸叫现象的声音信号而言,该处的声音信号的成分通过无次谐波分类且为频谱的峰值,故可结合该两个特点,对步骤S201中得到的每一待检测频率进行次谐波检测以及峰值功率检测,以判断该待检测频率处是否发生啸叫,将判断发生啸叫的待检测频率记作啸叫频率。
通过上述啸叫检测方法,综合了啸叫频率处的声音信号成分通常无次谐波且为频谱的峰值的特点,形成联合的啸叫判定准则,能够有效提高啸叫检测的准确率,减少误检和漏检。另外,无需引入基于时域特征的检测方法(如IPMP或IMSD),全部在频域内实施,具有判决速度快,计算复杂度低的特点。
请参见图2和图3,图3为一实施例中啸叫检测方法的部分示意图,在执行图2中步骤S201后,将得到的包含一个或多个待检测频率的频域信号作为输入,也即图3所示的输入(Input)。
在一个实施例中,图2中步骤S202所述分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系,可以包括:计算各个待检测频率的信号功率与其相邻频率的信号功率的比值,记作第一比值。
其中,第一比值为各个待检测频率的信号功率与其相邻频率的信号功率的比值,也即峰值-邻值功率比(peak-to-neighboring power ratio,简称PNPR)。该实施例也即图3中的步骤S311,PNPR计算。
对于其中的一个待检测频率而言,PNPR的计算方式可表示为下述公式(1):
Figure GDA0002669591260000071
其中,PNPR为峰值-邻值功率比,单位为分贝(dB),
Figure GDA0002669591260000072
为待检测频率
Figure GDA0002669591260000073
的信号功率,
Figure GDA0002669591260000074
为待检测频率的第m个相邻频率的信号功率,Δf为频谱的频率分辨率,m取值为正整数。
可选的,相邻频率的信号功率为多个频率的信号功率的均值。
也即,对上述公式(1)中m可以取多个相邻频率,此时待检测频率的第m个相邻频率的信号功率为多个相邻频率处信号功率的平均值。
本实施例中,利用啸叫通常发生在信号峰值的特点,通过统计功率谱峰值与其邻近频点功率的比值,也即PNPR来区分语音和啸叫。
在一个实施例中,步骤S202中检测各个待检测频率的次谐波,可以包括:获取各个待检测频率的信号功率与其
Figure GDA0002669591260000075
阶频率功率的比值,记作第二比值;其中,m为大于1的正整数。
第二比值即为峰值-谐波功率比(peak-to-harmonic power ratio,简称PHPR),通常
Figure GDA0002669591260000076
本实施例,也即图3中步骤S321,PHPR计算。
对于每一待检测频率而言,PHPR的计算方式可以表示为公式(2):
Figure GDA0002669591260000077
其中,PHPR为峰值-谐波功率比,单位为分贝(dB),
Figure GDA0002669591260000078
为待检测频率
Figure GDA0002669591260000079
的信号功率,
Figure GDA00026695912600000710
为待检测频率的第
Figure GDA00026695912600000711
阶频率的功率,其中,m为大于1的正整数。
可选的,本实施例中的
Figure GDA0002669591260000081
的取值不超过0.5,也即利用PHPR计算峰值-次谐波功率比。
本实施例中,利用啸叫成分没有谐波分量的特点,通过统计功率谱峰值与其
Figure GDA0002669591260000082
阶次谐波功率的比值,也即次谐波PHPR,来区分语音和啸叫。
结合上述两个实施例,图2中步骤S203所述根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率,可以包括:确定第一比值大于第一阈值且第二比值大于第二阈值对应的待检测频率为啸叫频率。
第一阈值(定义为TPNPR)和第二阈值(定义为TPHPR)分别用于判断公式(1)和公式(2)中计算得到的PNPR和PHPR是否满足啸叫要求。
请继续参见图3,在分别执行步骤S311和步骤S321后,判断步骤S311计算得到的PNPR(也即第一比值)是(Y)/否(N)大于第一阈值TPNPR(步骤S312),并判断步骤S321计算得到的PHPR(也即第二比值)是(Y)/否(N)大于第二阈值TPHPR(步骤S322)。若第一比值大于第一阈值且第二比值大于第二阈值(图3中步骤S33的双Y情形),判断此时发生啸叫,将此时的频率记作啸叫频率并输出(Output)。
在一个实施例中,所述对待检测信号的频域信号进行峰值检测之前,还包括:获取待检测信号的时域信号,对所述时域信号进行分帧;对分帧后的时域信号进行时频转换,得到待检测信号的频域信号。
当待检测信号为时域信号时,需将其进行时-频转换,得到待检测信号的频域信号。可通过傅里叶变换,执行待检测信号的时-频转换。
可选的,在对待检测信号进行时-频转换之前,还可对其进行分帧处理,得到分帧后的时域信号。
可选的,分帧后的时域信号每秒不少于40帧。
本实施例中,通过对时域信号的分帧处理,使得每帧时域信号的时间相对较短,对其转化后的频域信号的特性分析更为准确。
上述公式(1)中可以表示为下述公式(3):
Figure GDA0002669591260000091
上述公式(2)中可以表示为下述公式(4):
Figure GDA0002669591260000092
其中,k为分帧标识。
在一个实施例中,上述对所述时域信号进行分帧之后,还可以包括:按照预设的检测周期对分帧后的时域信号进行周期性抽取;所述对分帧后的时域信号进行时频转换,包括:对抽取的分帧后的时域信号进行时频转换。
预设的检测周期为对分帧后的时域信号进行周期性抽取的周期划分依据。可将分帧后的时域信号按照预设的检测周期划分为多个周期的时域信号,每次对其中一个周期的时域信号进行时频转换得到对应的频域信号,并对其进行啸叫检测。其中,预设的检测周期可大于1帧,即至少每隔1帧做一次啸叫检测。
可选的,每次对其中一个周期的分帧后的时域信号进行啸叫检测时,若存在啸叫频率,则将本次检测到的啸叫频率作为输出。若本次未检测到啸叫频率,则继续保留上次检测到的啸叫频率作为输出。
本实施例中,可通过预设的检测周期对时域分帧后的时域信号进行周期性抽取,改变检测的频次。
在一个实施例中,图2中步骤S201所述在所述频域信号中识别一个或多个频谱峰值对应的待检测频率之后,还可以包括:去除频率低于预设值的待检测频率。
由于啸叫现象通常在中高频出现,可对提取的峰值经过频带控制后去除低频带(频率低于预设值的频带)内的峰值,然后将其余的峰值对应的频率作为待检测频率。其中,预设值可根据检测效果调整。
请参见图4,本发明实施例还提供一种啸叫检测装置,所述装置可以包括:
峰值提取模块401,用于对待检测信号的频域信号进行峰值检测,在所述频域信号中识别一个或多个频谱峰值对应的待检测频率;
分析模块402,用于检测各个待检测频率的次谐波,并分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系;
啸叫判断模块403,用于根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率。
在一个实施例中,所述分析模块402可以包括:
第一比值计算单元,用于计算各个待检测频率的信号功率与其相邻频率的信号功率的比值,记作第一比值。
可选的,相邻频率的信号功率为多个频率的信号功率的均值。
在一个实施例中,所述分析模块402还可以包括:
第二比值计算单元,用于获取各个待检测频率的信号功率与其
Figure GDA0002669591260000101
阶频率功率的比值,记作第二比值,其中,m为大于1的正整数。
在一个实施例中,所述啸叫判断模块403,还可以用于确定第一比值大于第一阈值且第二比值大于第二阈值对应的待检测频率为啸叫频率。
在一个实施例中,请参见图5,图5提供了另一种啸叫检测装置的结构示意图,其中,所述啸叫检测装置除了包括图4中的峰值提取模块401、分析模块402和啸叫判断模块403,还可以包括:
信号分帧模块501,用于获取待检测信号的时域信号,对所述时域信号进行分帧;
频域分析模块503,用于将分帧后的时域信号进行时频转换,得到待检测信号的频域信号。
可选的,啸叫检测装置还可以包括:
检测周期控制模块502,用于设置预设的检测周期,以按照预设的检测周期对分帧后的时域信号进行周期性抽取;
所述频域分析模块503,还用于对抽取的分帧后的时域信号进行时频转换。
在一个实施例中,所述峰值提取模块401,还可以用于去除频率低于预设值的待检测频率。
可选的,可将图4和图5所述的啸叫检测模块应用于图1中的啸叫检测单元112中,以对输入信号103中的啸叫成分进行检测,得到输出指令113,此时的输出指令113即为啸叫频率,滤波系统104可对啸叫频率滤波后输出啸叫抑制后的信号105。
关于图4和图5啸叫检测装置的工作原理、工作方式的更多内容,可以参照上述图2和图3中的关于啸叫检测方法的相关描述,这里不再赘述。
进一步地,本发明实施例还公开一种存储介质,其上存储有计算机指令,计算机指令运行时执行上述图2和图3所示实施例中的啸叫检测方法的技术方案。优选地,存储介质可以包括诸如非挥发性(non-volatile)存储器或者非瞬态(non-transitory)存储器等计算机可读存储介质。存储介质可以包括ROM、RAM、磁盘或光盘等。
进一步地,本发明实施例还公开一种计算机设备,包括存储器和处理器,存储器上存储有能够在处理器上运行的计算机指令,处理器运行计算机指令时执行上述图1和图2所示实施例中的啸叫检测方法的技术方案。该计算机设备可指手机、电脑、服务器等。
综上,本方面实施例提供一种基于频域多特征组合的长周期的啸叫检测方法及装置、存储介质、计算机设备,用于检测啸叫和输出啸叫抑制指令,并在检测到啸叫时输出啸叫频点,作为后续啸叫抑制的设计输入。该啸叫检测系统在设计一种次谐波PHPR的同时,控制啸叫检测的频带,并与PNPR方法组合形成联合的啸叫判定条件,可以改善误检情况;通过控制啸叫检测的周期,可进一步降低误检概率,在保证音质的同时,可以有效的抑制啸叫,有助于系统最大稳定增益的提高,综合检测性能更好,防止因啸叫而引起音质恶化、限制响度及系统损坏等问题。
在一个非限定性的具体实例中,利用陷波法对一段带有啸叫成分的语音信号进行啸叫抑制,其中啸叫检测采用的是本发明所提出的啸叫检测方法,在啸叫抑制前的语音信号,其采样率为8000赫兹(Hz),时长约3.5秒(s),啸叫频点接近3800Hz,几乎贯穿全时段,部分时段语音的谐波能量与啸叫频点相当。经过啸叫检测和啸叫抑制后的语音信号,其中啸叫抑制的目标频点为啸叫检测的输出结果。经过本发明实施例提供的啸叫检测方法对其中的啸叫进行抑制后,在0.1s后啸叫成分即被检测到,且在这之后的全时段内检测方法对啸叫频点的跟踪性非常好,既未出现漏检导致的啸叫成分,也未出现误检导致的其他频点处的语音损失。说明本发明中的啸叫检测方法同时具备较高的识别率和较低的误检率,检测速度快,有助于在抑制啸叫的同时保证音质。
具体地,在本发明实施例中,所述处理器可以为中央处理单元(centralprocessing unit,简称CPU),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,简称DSP)、专用集成电路(application specificintegrated circuit,简称ASIC)、现成可编程门阵列(field programmable gate array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
还应理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,简称ROM)、可编程只读存储器(programmable ROM,简称PROM)、可擦除可编程只读存储器(erasable PROM,简称EPROM)、电可擦除可编程只读存储器(electricallyEPROM,简称EEPROM)或闪存。易失性存储器可以是随机存取存储器(random accessmemory,简称RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的随机存取存储器(random access memory,简称RAM)可用,例如静态随机存取存储器(staticRAM,简称SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronousDRAM,简称SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,简称DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,简称ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,简称SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,简称DR RAM)。
应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,表示前后关联对象是一种“或”的关系。
本申请实施例中出现的“多个”是指两个或两个以上。
本申请实施例中出现的第一、第二等描述,仅作示意与区分描述对象之用,没有次序之分,也不表示本申请实施例中对设备个数的特别限定,不能构成对本申请实施例的任何限制。
本申请实施例中出现的“连接”是指直接连接或者间接连接等各种连接方式,以实现设备间的通信,本申请实施例对此不做任何限定。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (8)

1.一种啸叫检测方法,其特征在于,所述方法包括:
对待检测信号的频域信号进行峰值检测,在所述频域信号中识别一个或多个频谱峰值对应的待检测频率;
检测各个待检测频率的次谐波,并分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系;
根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率;
其中,所述分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系,包括:计算各个待检测频率的信号功率与其相邻频率的信号功率的比值,记作第一比值;
所述检测各个待检测频率的次谐波,包括:获取各个待检测频率的信号功率与其
Figure FDA0003202337400000011
阶频率功率的比值,记作第二比值,其中,m为大于1的正整数;
所述根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率,包括:确定第一比值大于第一阈值且第二比值大于第二阈值对应的待检测频率为啸叫频率。
2.根据权利要求1所述的方法,其特征在于,相邻频率的信号功率为多个频率的信号功率的均值。
3.根据权利要求1所述的方法,其特征在于,所述对待检测信号的频域信号进行峰值检测之前,还包括:
获取待检测信号的时域信号,对所述时域信号进行分帧;
对分帧后的时域信号进行时频转换,得到待检测信号的频域信号。
4.根据权利要求3所述的方法,其特征在于,所述对所述时域信号进行分帧之后,还包括:
按照预设的检测周期对分帧后的时域信号进行周期性抽取;
所述对分帧后的时域信号进行时频转换,包括:
对抽取的分帧后的时域信号进行时频转换。
5.根据权利要求1所述的方法,其特征在于,所述在所述频域信号中识别一个或多个频谱峰值对应的待检测频率之后,还包括:
去除频率低于预设值的待检测频率。
6.一种啸叫检测装置,其特征在于,所述装置包括:
峰值提取模块,用于对待检测信号的频域信号进行峰值检测,在所述频域信号中识别一个或多个频谱峰值对应的待检测频率;
分析模块,用于检测各个待检测频率的次谐波,并分析各个待检测频率处的信号功率与其相邻频率的信号功率的功率关系;
啸叫判断模块,用于根据各个待检测频率的次谐波检测结果和功率关系的分析结果,确定啸叫频率;
其中,所述分析模块包括:第一比值计算单元,用于计算各个待检测频率的信号功率与其相邻频率的信号功率的比值,记作第一比值;
第二比值计算单元,用于获取各个待检测频率的信号功率与其
Figure FDA0003202337400000021
阶频率功率的比值,记作第二比值,其中,m为大于1的正整数;
所述啸叫判断模块,还用于确定第一比值大于第一阈值且第二比值大于第二阈值对应的待检测频率为啸叫频率。
7.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至5任一项所述方法的步骤。
8.一种计算机设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至5中任一项所述方法的步骤。
CN202010475966.6A 2020-05-29 2020-05-29 啸叫检测方法及装置、存储介质、计算机设备 Active CN111800725B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010475966.6A CN111800725B (zh) 2020-05-29 2020-05-29 啸叫检测方法及装置、存储介质、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010475966.6A CN111800725B (zh) 2020-05-29 2020-05-29 啸叫检测方法及装置、存储介质、计算机设备

Publications (2)

Publication Number Publication Date
CN111800725A CN111800725A (zh) 2020-10-20
CN111800725B true CN111800725B (zh) 2021-10-29

Family

ID=72806010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010475966.6A Active CN111800725B (zh) 2020-05-29 2020-05-29 啸叫检测方法及装置、存储介质、计算机设备

Country Status (1)

Country Link
CN (1) CN111800725B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112565981B (zh) * 2021-02-20 2021-06-15 深圳市智听科技有限公司 啸叫抑制方法、装置、助听器及存储介质
CN112802492B (zh) * 2021-04-14 2021-07-27 展讯通信(上海)有限公司 一种抑制啸叫的方法、装置、芯片及模组设备
CN113316074B (zh) * 2021-05-11 2022-07-05 紫光展锐(重庆)科技有限公司 一种啸叫检测方法、装置及电子设备
CN113316075B (zh) * 2021-05-11 2023-02-14 紫光展锐(重庆)科技有限公司 一种啸叫检测方法、装置及电子设备
CN114724575A (zh) * 2022-06-09 2022-07-08 广州市保伦电子有限公司 一种啸叫检测方法、装置以及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104464752A (zh) * 2014-12-24 2015-03-25 海能达通信股份有限公司 一种声反馈检测方法和装置
CN106558316A (zh) * 2016-11-09 2017-04-05 天津大学 一种基于长时信号特定频带变化率的啸叫检测方法
CN107919134A (zh) * 2016-10-10 2018-04-17 杭州海康威视数字技术股份有限公司 啸叫检测方法及装置和啸叫抑制方法及装置
EP3348047A1 (en) * 2015-10-12 2018-07-18 Microsoft Technology Licensing, LLC Audio signal processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104464752A (zh) * 2014-12-24 2015-03-25 海能达通信股份有限公司 一种声反馈检测方法和装置
EP3348047A1 (en) * 2015-10-12 2018-07-18 Microsoft Technology Licensing, LLC Audio signal processing
CN107919134A (zh) * 2016-10-10 2018-04-17 杭州海康威视数字技术股份有限公司 啸叫检测方法及装置和啸叫抑制方法及装置
CN106558316A (zh) * 2016-11-09 2017-04-05 天津大学 一种基于长时信号特定频带变化率的啸叫检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
会议系统啸叫抑制算法研究与实现;江波;《信息科技辑》;20190115;第15-17页 *

Also Published As

Publication number Publication date
CN111800725A (zh) 2020-10-20

Similar Documents

Publication Publication Date Title
CN111800725B (zh) 啸叫检测方法及装置、存储介质、计算机设备
US11064296B2 (en) Voice denoising method and apparatus, server and storage medium
US9318125B2 (en) Noise reduction devices and noise reduction methods
US11677879B2 (en) Howl detection in conference systems
CN108831500A (zh) 语音增强方法、装置、计算机设备及存储介质
US20150221322A1 (en) Threshold adaptation in two-channel noise estimation and voice activity detection
US10755728B1 (en) Multichannel noise cancellation using frequency domain spectrum masking
CN112004177B (zh) 一种啸叫检测方法、麦克风音量调节方法及存储介质
JP5752324B2 (ja) 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制
CN112242147A (zh) 一种语音增益控制方法及计算机存储介质
KR20200128687A (ko) 하울링 억제 방법, 장치 및 전자 설비
CN110503973B (zh) 音频信号瞬态噪音抑制方法、系统以及存储介质
WO2022218254A1 (zh) 语音信号增强方法、装置及电子设备
US20190019527A1 (en) Pop noise control
CN108093356B (zh) 一种啸叫检测方法及装置
US10070219B2 (en) Sound feedback detection method and device
EP4021012B1 (en) Method and apparatus for recognizing wind noise of earphone
US10388298B1 (en) Methods for detecting double talk
CN112802492B (zh) 一种抑制啸叫的方法、装置、芯片及模组设备
CN113660578B (zh) 拾音角度范围可调的双麦克风定向拾音方法和装置
CN112349295B (zh) 啸叫检测方法及装置
CN113611319A (zh) 基于语音成分实现的风噪抑制方法、装置、设备及系统
US10600432B1 (en) Methods for voice enhancement
CN111986694A (zh) 基于瞬态噪声抑制的音频处理方法、装置、设备及介质
CN113409812B (zh) 一种语音降噪训练数据的处理方法及其装置、训练方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant