CN112037816B - 语音信号频域频率的校正、啸叫检测、抑制方法及装置 - Google Patents
语音信号频域频率的校正、啸叫检测、抑制方法及装置 Download PDFInfo
- Publication number
- CN112037816B CN112037816B CN202010373268.5A CN202010373268A CN112037816B CN 112037816 B CN112037816 B CN 112037816B CN 202010373268 A CN202010373268 A CN 202010373268A CN 112037816 B CN112037816 B CN 112037816B
- Authority
- CN
- China
- Prior art keywords
- frequency
- howling
- signal
- amplitude
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012937 correction Methods 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000001514 detection method Methods 0.000 title claims description 16
- 230000001629 suppression Effects 0.000 title claims description 7
- 230000009466 transformation Effects 0.000 claims abstract description 11
- 238000012795 verification Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000001228 spectrum Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Abstract
本发明提供了语音信号频域频率的校正、啸叫检测、抑制方法及装置,其中,校正方法包括如下步骤:将语音信号划分为多个时域帧信号;对多个时域帧信号分别进行傅里叶变换得到多个频域帧信号;在每个频域帧信号中,根据每个频率对应的实部与虚部的比值计算每个频率的相位;计算当前频域帧信号中每个频率的相位与上一频域帧信号相同频率的相位之差得到相位差;对于当前频域帧信号的每个频率,根据相位差通过取整、比特位逻辑与运算确定对应的补偿系数,对每个频率分别加上对应的补偿系数与傅里叶变换的分辨率之积得到校正频率,获得当前校正频域帧信号。本发明可以使从当前校正频域帧信号检测的啸叫频率与语音信号中实际的啸叫频率之间的误差较小。
Description
技术领域
本发明涉及语音信号处理,尤其涉及语音信号频域频率的校正、啸叫检测、抑制方法及装置。
背景技术
在K歌系统、会议系统等扩声设备,由播放设备播放的语音信号又采集到麦克风,麦克风采集的语音信号又经过播放设备播放出来,形成增益回路。如果同时满足:(1)|F(z)G(z)|≥1(2)∠F(z)G(z)=2nπ;则会破坏回路系统的稳定,其中F(z)为反馈增益函数;G(z)为前向增益函数。此时会在满足上述两个条件的频率点时就会发生刺耳的啸叫,如图1所示。啸叫的现象不仅影响了扩声系统的增益量,使得放大的音频信号混杂刺耳的声音,还减少了扩声设备的使用寿命。因此在扩声设备中需要抑制啸叫的发生。在实际使用扩声设备的场景中,由于反馈增益函数是不断变化,所以啸叫的频率点也是不断的变化。因此,在抑制啸叫方法中需要能自适应的跟踪啸叫频点的不断变化,否则将会出现啸叫。
现有技术中检测得到的啸叫频率与实际啸叫频率之间的误差较大,为了抑制啸叫,现有技术往往将陷波器的陷波带宽设置较大,因此啸叫信号附近的语音信号也被抑制,信号失真较大,用户体验较差。
另外,现有技术中,检测到候选啸叫频率点后,在验证候选啸叫频率点是否为啸叫频率点时,直接将获取的候选啸叫频率点的幅度与预设幅度阈值进行比较,这种验证候选啸叫频率点的方法误差较大,往往将正常语音信号的频率点错误判断为啸叫频率点,并进行陷波器抑制,进而造成语音信号失真。
发明内容
基于上述现状,本发明的主要目的在于提供一种语音信号频域频率的校正、啸叫检测、抑制方法及装置,以减小检测得到的啸叫频率与实际啸叫频率之间的误差,另外进一步提高啸叫频率检测的准确率。
为实现上述目的,本发明采用的技术方案如下:
一种语音信号频域频率的校正方法,包括如下步骤:将语音信号划分为多个时域帧信号;对多个时域帧信号分别进行傅里叶变换得到多个频域帧信号;在每个频域帧信号中,根据每个频率对应的实部与虚部的比值计算每个频率的相位;计算当前频域帧信号中每个频率的相位与上一频域帧信号相同频率的相位之差得到相位差;对于当前频域帧信号的每个频率,根据所述相位差通过取整、比特位逻辑与运算确定对应的补偿系数,对每个频率分别加上对应的补偿系数与傅里叶变换的分辨率之积得到校正频率,从而获得当前校正频域帧信号。
在优选的方案中,根据所述相位差通过取整、比特位逻辑与运算确定对应的补偿系数具体为:计算所述相位差与π的比值得到校正相位差γ;对所述矫正相位差γ进行取整,得到取整结果α;按照下式计算补偿系数λ:
当α>0时,λ=γ-(α+(α&1)),
当α<0时,λ=γ-(α-(α&1)),
当α=0时,λ=γ,
其中,α&1表示将构成α的每个比特位分别与构成整数1的相应比特位进行逻辑与运算。
在优选的方案中,若当前频域帧信号的某频率对应的补偿系数与傅里叶变换的分辨率之积大于(-β/2)、且不大于β/2时,对当前频域帧信号的所述某频率加上所述补偿系数与傅里叶变换的分辨率之积得到校正频率;其中,β表示所述傅里叶变换的分辨率;若当前频域帧信号的某频率对应的补偿系数与傅里叶变换的分辨率之积不大于(-β/2)、或者大于β/2时,对当前频域帧信号的所述某频率不进行校正。
本发明还提供了一种语音信号啸叫频率的检测方法,包括任一所述的语音信号频域频率的校正方法,还包括如下步骤:若当前校正频域信号的某频率的幅值大于相邻的前一个频率的幅值、且大于相邻的后一个频率的幅值,则选择所述某频率为候选啸叫频率;计算候选啸叫频率的幅值与所述候选啸叫频率附近频率的平均幅值的幅值差,若所述幅值差大于第一预设幅值a且小于第二预设幅值b,则计算当前帧之前连续设定数量帧的校正频域信号中与所述候选啸叫频率相同的频率被选择为候选啸叫频率的次数,若所述次数大于预设次数阈值,则确定所述候选啸叫频率为啸叫频率;其中所述第一预设幅值a小于第二预设幅值b。
在优选的方案中,检测方法还包括如下步骤:若所述幅值差大于所述第二预设幅值b,则确定所述候选啸叫频率为啸叫频率。
在优选的方案中,检测方法还包括如下步骤:若所述幅值差小于所述第一预设幅值a,则确定所述候选啸叫频率不是啸叫频率。
在优选的方案中,所述候选啸叫频率附近频率不包括所述候选啸叫频率相邻的前一个频率和后一个频率。
本发明还提供了一种语音信号啸叫频率的检测方法,包括任一所述的校正方法,还包括如下步骤:按照幅值从大到小的顺序对所述当前校正频域信号中的频率进行排序;从幅值最大的频率开始对所述当前校正频域信号进行啸叫频率检测以获得啸叫频率。
本发明还提供了一种语音信号啸叫的抑制方法,包括任一所述的语音信号啸叫频率的检测方法,还包括如下步骤:根据检测到的啸叫频率设置陷波器的中心频率;利用所述陷波器对所述语音信号进行处理,得到抑制啸叫后的语音信号。
本发明还提供了一种语音信号频域频率的校正装置,包括:划分模块,用于将语音信号划分为多个时域帧信号;变换模块,用于对多个时域帧信号分别进行傅里叶变换得到多个频域帧信号;第一计算模块,用于在每个频域帧信号中,根据每个频率对应的实部与虚部的比值计算每个频率的相位;第二计算模块,用于计算当前频域帧信号中每个频率的相位与上一频域帧信号相同频率的相位之差得到相位差;校正模块,用于对于当前频域帧信号的每个频率,根据所述相位差通过取整、比特位逻辑与运算确定对应的补偿系数,对每个频率分别加上对应的补偿系数与傅里叶变换的分辨率之积得到校正频率,从而获得当前校正频域帧信号。
在优选的方案中,根据所述相位差通过取整、比特位逻辑与运算确定对应的补偿系数具体为:计算所述相位差与π的比值得到校正相位差γ;对所述矫正相位差γ进行取整,得到取整结果α;按照下式计算补偿系数λ:
当α>0时,λ=γ-(α+(α&1)),
当α<0时,λ=γ-(α-(α&1)),
当α=0时,λ=γ,
其中,α&1表示将构成α的每个比特位分别与构成整数1的相应比特位进行逻辑与运算。
在优选的方案中,若当前频域帧信号的某频率对应的补偿系数与傅里叶变换的分辨率之积大于(-β/2)、且不大于β/2时,对当前频域帧信号的所述某频率加上所述补偿系数与傅里叶变换的分辨率之积得到校正频率;其中,β表示所述傅里叶变换的分辨率;若当前频域帧信号的某频率对应的补偿系数与傅里叶变换的分辨率之积不大于(-β/2)、或者大于β/2时,对当前频域帧信号的所述某频率不进行校正。
本发明还提供了一种语音信号啸叫频率的检测装置,包括任一所述的语音信号频域频率的校正装置,还包括:候选单元,用于若当前校正频域信号的某频率的幅值大于相邻的前一个频率的幅值、且大于相邻的后一个频率的幅值,则选择所述某频率为候选啸叫频率;验证单元,用于计算候选啸叫频率的幅值与所述候选啸叫频率附近频率的平均幅值的幅值差,若所述幅值差大于第一预设幅值a且小于第二预设幅值b,则计算当前帧之前连续设定数量帧的校正频域信号中与所述候选啸叫频率相同的频率被选择为候选啸叫频率的次数,若所述次数大于预设次数阈值,则确定所述候选啸叫频率为啸叫频率;其中所述第一预设幅值a小于第二预设幅值b。
在优选的方案中,所述验证单元还用于,若所述幅值差大于所述第二预设幅值b,则确定所述候选啸叫频率为啸叫频率。
在优选的方案中,所述验证单元还用于,若所述幅值差小于所述第一预设幅值a,则确定所述候选啸叫频率不是啸叫频率。
在优选的方案中,所述候选啸叫频率附近频率不包括所述候选啸叫频率相邻的前一个频率和后一个频率。
本发明还提供了一种语音信号啸叫频率的检测装置,包括任一所述的校正装置,还包括:排序单元,用于按照幅值从大到小的顺序对所述当前校正频域信号中的频率进行排序;检测单元,用于从幅值最大的频率开始对所述当前校正频域信号进行啸叫频率检测以获得啸叫频率。
本发明还提供了一种语音信号啸叫的抑制装置,包括任一所述的语音信号啸叫频率的检测装置,还包括:设置单元,用于根据检测到的啸叫频率设置陷波器的中心频率;抑制单元,用于利用所述陷波器对所述语音信号进行处理,得到抑制啸叫后的语音信号。
【有益效果】
根据所述相位差通过取整、比特位逻辑与运算确定对应的补偿系数,对每个频率分别加上对应的补偿系数与傅里叶变换的分辨率之积得到校正频率,从而获得当前校正频域帧信号,可以使从当前校正频域帧信号检测的啸叫频率与语音信号中实际的啸叫频率之间的误差较小。
另外,计算候选啸叫频率的幅值与所述候选啸叫频率附近频率的平均幅值的幅值差,比较幅值差与第一预设幅值a和第二预设幅值b的大小关系,可以降低将正常频率判定为啸叫频率的概率。
本发明的其他有益效果,将在具体实施方式中通过具体技术特征和技术方案的介绍来阐述,本领域技术人员通过这些技术特征和技术方案的介绍,应能理解所述技术特征和技术方案带来的有益技术效果。
附图说明
以下将参照附图对根据本发明的优选实施方式进行描述。图中:
图1是啸叫现象产生示意图
图2为根据本发明的一种优选实施方式的语音信号啸叫的抑制方法的示意图
图3为根据本发明的一种优选实施方式的语音信号啸叫的抑制系统的示意图
具体实施方式
图2为本发明语音信号啸叫的抑制方法一种实施例的流程图,该方法包括如下步骤。
S1、拾音装置(例如麦克风)采集获取语音信号,然后将语音信号划分为多个时域帧信号,即通常所谓的分帧。通常,相邻的时域帧信号之间在时域上要有相互重叠的部分,即通常所谓的帧移。可选的,为了使得后续进行傅里叶变换的效果更好,可以对时域帧信号进行加窗运算。
S2、对上述多个时域帧信号分别进行傅里叶变换(例如快速傅里叶变换)得到多个频域帧信号。第u帧频域帧信号中频域频点w的频域信号可以表示如下:
Y(u,w)=S(u,w)+X(u,w);
其中,Y(u,w)是指第u帧频域帧信号中频域频点w的频域信号(频域频点w对应的频率为w*β,β为傅里叶变换的分辨率,β=fs/FFT_N;fs为采样率,FFT_N为快速傅里叶变换的点数,其中,频域频点w表示对应的频率w*β在时域帧信号的位置点);X(u,w)是经过反馈路径之后,由麦克风采集到的语音信号(即由扬声器发出的语音信号)的频域信号,S(u,w)是近端(用户端发声)语音信号(即非由扬声器发出的语音信号)的频域信号。
S3、在频域里计算频域帧信号的幅值,例如幅度谱或者功率谱,可以表示如下:
其中,real表示取实部,imag表示取虚部;p为指数,p=1表示幅度谱;p=2表示功率谱。
S4、在每个频域帧信号中,根据每个频率对应的实部与虚部的比值计算每个频率的相位。具体而言,对每个频率对应的实部与虚部的比值采用反正切函数,即可以获得该频率的相位值。
phase(u,w)=atan2(imag(Y(u,w)),imag(Y(u,w)));
其中atan2是反正切函数,其值在[-π,π]之间。
S5、计算当前频域帧信号中每个频率的相位与相邻的上一频域帧信号相同频率的相位之差得到相位差Δphase;例如,当前帧(第u帧)频域帧信号中频域频点w的相位phase(u,w)与相邻的上一帧(第u-1帧)频域帧信号中频域频点w的相位phase(u-1,w)之差Δphase可以表示如下:
Δphase=phase(u,w)-phase(u-1,w)。
S6、对于当前频域帧信号的每个频率,根据所述相位差通过取整、比特位逻辑与运算确定对应的补偿系数,对每个频率分别加上对应的补偿系数与傅里叶变换的分辨率之积得到校正频率,从而获得当前校正频域帧信号。经过校正后,当前帧(第u帧)频域帧信号中频域频点w的频域信号freq(u,w)可以表示如下:
freq(u,w)=freq0(u,w)+λ(u,w)*β
其中,freq0(u,w)指校正之前,当前帧(第u帧)频域帧信号中频域频点w的频域信号,freq0(u,w)=w*β,w为频域频点,λ(u,w)为当前帧(第u帧)频域帧信号中频域频点w的补偿系数,β为傅里叶变换的分辨率,β=fs/FFT_N,fs为采样率,FFT_N为快速傅里叶变换的点数。
在更优的实施例中,步骤S6中的根据相位差通过取整、比特位逻辑与运算确定对应的补偿系数的具体方式如下。
S61、计算所述相位差与π的比值得到校正相位差γ。具体而言,当前帧(第u帧)频域帧信号中频域频点w的补偿系数λ(u,w)可以表示如下:
λ(u,w)=(phase(u,w)-phase(u-1,w))*β/π。
S62、对所述矫正相位差γ进行取整,得到取整结果α;
S63、按照下式γ计算补偿系数λ:
当α>0时,λ=γ-(α+(α&1)),
当α<0时,λ=γ-(α-(α&1)),
当α=0时,λ=γ,
其中,α&1表示将构成α的每个比特位分别与构成整数“1”的相应比特位进行逻辑与运算。对于负数而言,构成该负数的最高位比特位为比特“1”,对于正数而言,构成该正数的最高位比特位为比特“0”。例如,以8位比特位表示上述数值为例,整数“1”表示为00000001,若α=1,则α表示为0000 0001,此时,α&1=0000 0001&0000 0001=0000 0001,因此α&1的数值为整数“1”;若α=2,则α表示为0000 0010,此时,α&1=0000 0010&0000 0001=0000 0000,因此α&1的数值为整数“0”;若α=-1,则α表示为1000 0001,此时,α&1=10000001&0000 0001=0000 0001,因此α&1的数值为整数“1”。
具体而言,当前帧(第u帧)频域帧信号中频域频点w的补偿系数λ(u,w)可以表示如下:
当α>0时,λ(u,w)=γ(u,w)-(α+(α&1)),
当α<0时,λ(u,w)=γ(u,w)-(α-(α&1)),
当α=0时,λ(u,w)=γ(u,w)。
实验验证,上述方案可以使从当前校正频域帧信号检测的啸叫频率与语音信号中实际的啸叫频率之间的误差很小,例如在一些实施例中该误差可以达到10Hz左右,为后续准确检测啸叫频率提供基础。
在更优的实施例中,若当前频域帧信号的某频率对应的补偿系数与傅里叶变换的分辨率之积大于(-β/2)、且不大于β/2时,对当前频域帧信号的所述某频率加上所述补偿系数与傅里叶变换的分辨率之积得到校正频率;其中,β表示所述傅里叶变换的分辨率;若当前频域帧信号的某频率对应的补偿系数与傅里叶变换的分辨率之积不大于(-β/2)、或者大于β/2时,对当前频域帧信号的所述某频率不进行校正。在本实施例中,经过校正后,当前帧(第u帧)频域帧信号中频域频点w的频域信号freq(u,w)可以表示如下:
即
这样可以防止由于出现的噪声导致频域频点w校正后的频域信号freq(u,w)可能与前一个频域频点w-1校正后的频域信号freq(u,w-1)重叠(或者与后一个频域频点w+1校正后的频域信号freq(u,w+1)重叠)。
在经过校正后的当前帧(第u帧)频域帧信号的基础上,进一步检测啸叫频率。
S7、以3个频域频率点为一个观察窗(w-1、w、w+1为一个观察窗),如果频域频率点w(对应频率w*β)的幅值大于相邻的前一个频域频率点w-1(对应前一个频率(w-1)*β)的幅值,且大于相邻的后一个频域频率点w+1(对应后一个频率(w+1)*β)的幅值,则将频域频率点w选择为候选啸叫频率,并更新候选啸叫频率(也可以称为候选啸叫频率点)的总个数N。这里的幅值可以为频域频率的幅度,或者功率值,或者对该幅度或功率值取对数得到的数值等,例如,当该幅值选择为频域频率的幅度时,可以表示如下:
当|Y(u,w-1)|<|Y(u,w)|且|Y(u,w)|>|Y(u,w+1)|,则选择频域频率点w所对应的频率为候选啸叫频率。
S8、向右滑动观察窗(w、w+1、w+2为一个观察窗),与步骤S7中类似,比较观察窗内频域频率的幅值之间的关系,如果频域频率点w+1的幅值大于相邻的前一个频域频率点w的幅值,且大于相邻的后一个频域频率点w+2的幅值,则将频域频率点w+1所对应的频率选择为候选啸叫频率,更新当前候选啸叫频率的个数N。以此类推,直至到达当前帧(第u帧)频域帧信号最后一个观察窗。
当候选啸叫频率个数N达到了预设个数M时,进入步骤S9,验证候选啸叫频率;
当候选啸叫频率个数N未达到预设个数M时,且依次检测完所有频率,进入进入步骤S9,验证候选啸叫频率;
在一个优选实施例中,在步骤S7之前,按照幅值从大到小的顺序对所述当前校正频域信号中的频率进行排序。例如,在排序之前,当前校正频域信号的频率点排序如下:1、2、3…w-2、w-1、w、w+1、w+2…,按照幅值从大到小排序后,前校正频域信号的频率点排序如下:3、2、1…w-2、w+1、w-1、w、w+2…。之后再进行步骤S7,那么第一个观察窗为(2、3、4),第二个观察窗为(1、2、3),依次类推。
S9、计算候选啸叫频率附近频率的平均幅值,例如,计算候选啸叫频率附近频率的功率谱或者幅度谱的平均值,或者对功率谱或者幅度谱取对数再取平均值,以候选啸叫频率点w附近频率的对数平均值为例,可以表示如下:
p为指数,p=1表示幅度谱;p=2表示功率谱,avrgp表示平均值,在本例子中,附近的频率不包括候选啸叫频率点w相邻的前一个频率点w-1和相邻的后一个频率点w+1,这样的平均幅值更能够反映实际啸叫频率附近多数频率的平均幅值,原因是,通常啸叫频率相邻的前一个频率和后一个频率的幅值也会较大,如果将这两者的幅值纳入计算得到的平均幅值值与附近多数频率的平均幅值不相符。
S10、判断候选啸叫频率的幅值与附近频率的平均幅值的幅值差,与第一预设幅值a和第二预设幅值b的关系,
若所述幅值差大于所述第二预设幅值b,表明候选啸叫频率的幅值异常突出,因此确定所述候选啸叫频率为啸叫频率;
若所述幅值差大于第一预设幅值a且小于第二预设幅值b(可以认为当前候选啸叫频率为单峰凸起),则计算当前帧之前连续设定数量帧的校正频域信号中与所述候选啸叫频率相同的频率被选择为候选啸叫频率的次数,若所述次数大于预设次数阈值,表明候选啸叫频率持续长时间单峰凸起,不满足语音信号特性,因此确定所述候选啸叫频率为啸叫频率;若所述幅值差大于所述第二预设幅值b,则确定所述候选啸叫频率为啸叫频率。
以幅值为对功率谱或者幅度谱取对数,平均幅值为对功率谱或者幅度谱取对数再取平均值为例,可以表示如下:
如果(log(|Y(u,w)|p)-avrgp)>b,则确定当前候选频率点w为啸叫频率点;
如果a<(log(|Y(u,w)|p)-avrgp)<b,则计算当前帧之前连续设定数量帧(例如4-8帧)的校正频域信号中与所述候选啸叫频率相同的频率被选择为候选啸叫频率的次数,若所述次数大于预设次数阈值ε,则确定所述候选啸叫频率点w为啸叫频率点;
如果次数未达到预设的阈值ε,则确定候选啸叫频率点w不是啸叫频率点,并对次数清零;
如果(log(|Y(u,w)|p)-avrgp)<a,则确定候选啸叫频率点w不是啸叫频率点;其中a、b、ε为常量,且b>a。
S11、根据检测到的啸叫频率设置陷波器参数,例如陷波器的中心频率,以及设置陷波器的带宽,从而完成对陷波器的自适应更新设置。
S12、利用所述陷波器对拾音装置采集到的语音信号进行处理,得到抑制啸叫后的语音信号,并把该语音信号输送至扬声装置。
本发明还提供了一种语音信号频域频率的校正装置,包括:
划分模块,用于将语音信号划分为多个时域帧信号;
变换模块,用于对多个时域帧信号分别进行傅里叶变换得到多个频域帧信号;
第一计算模块,用于在每个频域帧信号中,根据每个频率对应的实部与虚部的比值计算每个频率的相位;
第二计算模块,用于计算当前频域帧信号中每个频率的相位与上一频域帧信号相同频率的相位之差得到相位差;
校正模块,用于对于当前频域帧信号的每个频率,根据所述相位差通过取整、比特位逻辑与运算确定对应的补偿系数,对每个频率分别加上对应的补偿系数与傅里叶变换的分辨率之积得到校正频率,从而获得当前校正频域帧信号。
本发明还提供了一种语音啸叫频率的检测装置,包括前述任一所述的语音信号频域频率的校正装置,还包括:
候选单元,用于若当前校正频域信号的某频率的幅值大于相邻的前一个频率的幅值、且大于相邻的后一个频率的幅值,则选择所述某频率为候选啸叫频率;
验证单元,用于计算候选啸叫频率的幅值与所述候选啸叫频率附近频率的平均幅值的幅值差,若所述幅值差大于第一预设幅值a且小于第二预设幅值b,则计算当前帧之前连续设定数量帧的校正频域信号中与所述候选啸叫频率相同的频率被选择为候选啸叫频率的次数,若所述次数大于预设次数阈值,则确定所述候选啸叫频率为啸叫频率;其中所述第一预设幅值a小于第二预设幅值b。
若所述幅值差大于所述第二预设幅值b,则确定所述候选啸叫频率为啸叫频率;
若所述幅值差小于所述第一预设幅值a,则确定所述候选啸叫频率不是啸叫频率。
所述候选啸叫频率附近频率不包括所述候选啸叫频率相邻的前一个频率和后一个频率。
本发明还提供了一种语音啸叫频率的检测装置,包括前述任一所述的校正装置,还包括:
排序单元,用于按照幅值从大到小的顺序对所述当前校正频域信号中的频率进行排序;
检测单元,用于从幅值最大的频率开始对所述当前校正频域信号进行啸叫频率检测以获得啸叫频率。
本发明还提供了一种语音啸叫的抑制装置,其特征是,包括前述任一所述的语音啸叫频率的检测装置,还包括:
设置单元,用于根据检测到的啸叫频率设置陷波器的中心频率;
抑制单元,用于利用所述陷波器对所述语音信号进行处理,得到抑制啸叫后的语音信号。
图3是本发明拾音装置和扬声装置构成的系统图。拾音装置包括依次连接的拾音单元、频率校正单元、检测候选啸叫频率单元、验证单元、陷波器参数配置单元和陷波器,另外拾音单元还与陷波器连接,扬声装置包括依次连接的音频放大单元和音频输出单元,频率校正单元、检测候选啸叫频率单元、验证单元和陷波器参数配置单元共同作用实现对陷波器的参数设置,拾音单元输出语音信号至陷波器,陷波器对拾音装置采集到的语音信号进行处理,得到抑制啸叫后的语音信号,并把该语音信号输送至扬声装置的音频放大单元,放大后的语音信号经由音频输出单元而产生声音。
拾音单元可以执行上述实施例的步骤S1,频率校正单元可以执行步骤S2-S6,检测候选啸叫频率单元可以执行步骤S7和S8,验证单元可以执行步骤S9-S11,陷波器参数配置单元可以执行步骤S11。
本领域的技术人员能够理解的是,在不冲突的前提下,上述各优选方案可以自由地组合、叠加。
应当理解,上述的实施方式仅是示例性的,而非限制性的,在不偏离本发明的基本原理的情况下,本领域的技术人员可以针对上述细节做出的各种明显的或等同的修改或替换,都将包含于本发明的权利要求范围内。
Claims (18)
1.一种语音信号频域频率的校正方法,其特征是,包括如下步骤:
将语音信号划分为多个时域帧信号;
对多个时域帧信号分别进行傅里叶变换得到多个频域帧信号;
在每个频域帧信号中,根据每个频率对应的实部与虚部的比值计算每个频率的相位;
计算当前频域帧信号中每个频率的相位与上一频域帧信号相同频率的相位之差得到相位差;
对于当前频域帧信号的每个频率,根据所述相位差通过取整、比特位逻辑与运算确定对应的补偿系数,对每个频率分别加上对应的补偿系数与傅里叶变换的分辨率之积得到校正频率,从而获得当前校正频域帧信号。
2.如权利要求1所述的校正方法,其特征是,
根据所述相位差通过取整、比特位逻辑与运算确定对应的补偿系数具体为:
计算所述相位差与π的比值得到校正相位差γ;
对所述校正相位差γ进行取整,得到取整结果α;
按照下式计算补偿系数λ:
当α>0时,λ=γ-(α+(α&1)),
当α<0时,λ=γ-(α-(α&1)),
当α=0时,λ=γ,
其中,α&1表示将构成α的每个比特位分别与构成整数1的相应比特位进行逻辑与运算。
3.如权利要求2所述的校正方法,其特征是,
若当前频域帧信号的某频率对应的补偿系数与傅里叶变换的分辨率之积大于(-β/2)、且不大于β/2时,对当前频域帧信号的所述某频率加上所述补偿系数与傅里叶变换的分辨率之积得到校正频率;其中,β表示所述傅里叶变换的分辨率;
若当前频域帧信号的某频率对应的补偿系数与傅里叶变换的分辨率之积不大于(-β/2)、或者大于β/2时,对当前频域帧信号的所述某频率不进行校正。
4.一种语音信号啸叫频率的检测方法,其特征是,包括如权利要求1-3任一所述的语音信号频域频率的校正方法,还包括如下步骤:
若当前校正频域信号的某频率的幅值大于相邻的前一个频率的幅值、且大于相邻的后一个频率的幅值,则选择所述某频率为候选啸叫频率;
计算候选啸叫频率的幅值与所述候选啸叫频率附近频率的平均幅值的幅值差,
若所述幅值差大于第一预设幅值a且小于第二预设幅值b,则计算当前帧之前连续设定数量帧的校正频域信号中与所述候选啸叫频率相同的频率被选择为候选啸叫频率的次数,若所述次数大于预设次数阈值,则确定所述候选啸叫频率为啸叫频率;
其中所述第一预设幅值a小于第二预设幅值b。
5.如权利要求4所述的检测方法,其特征是,还包括如下步骤:
若所述幅值差大于所述第二预设幅值b,则确定所述候选啸叫频率为啸叫频率。
6.如权利要求4所述的检测方法,其特征是,还包括如下步骤:
若所述幅值差小于所述第一预设幅值a,则确定所述候选啸叫频率不是啸叫频率。
7.如权利要求4所述的检测方法,其特征是,
所述候选啸叫频率附近频率不包括所述候选啸叫频率相邻的前一个频率和后一个频率。
8.一种语音信号啸叫频率的检测方法,其特征是,包括如权利要求1-3任一所述的校正方法,还包括如下步骤:
按照幅值从大到小的顺序对所述当前校正频域信号中的频率进行排序;
从幅值最大的频率开始对所述当前校正频域信号进行啸叫频率检测以获得啸叫频率。
9.一种语音信号啸叫的抑制方法,其特征是,包括如权利要求4-8任一所述的语音信号啸叫频率的检测方法,还包括如下步骤:
根据检测到的啸叫频率设置陷波器的中心频率;
利用所述陷波器对所述语音信号进行处理,得到抑制啸叫后的语音信号。
10.一种语音信号频域频率的校正装置,其特征是,包括:
划分模块,用于将语音信号划分为多个时域帧信号;
变换模块,用于对多个时域帧信号分别进行傅里叶变换得到多个频域帧信号;
第一计算模块,用于在每个频域帧信号中,根据每个频率对应的实部与虚部的比值计算每个频率的相位;
第二计算模块,用于计算当前频域帧信号中每个频率的相位与上一频域帧信号相同频率的相位之差得到相位差;
校正模块,用于对于当前频域帧信号的每个频率,根据所述相位差通过取整、比特位逻辑与运算确定对应的补偿系数,对每个频率分别加上对应的补偿系数与傅里叶变换的分辨率之积得到校正频率,从而获得当前校正频域帧信号。
11.如权利要求10所述的校正装置,其特征是,
根据所述相位差通过取整、比特位逻辑与运算确定对应的补偿系数具体为:
计算所述相位差与π的比值得到校正相位差γ;
对所述校正相位差γ进行取整,得到取整结果α;
按照下式计算补偿系数λ:
当α>0时,λ=γ-(α+(α&1)),
当α<0时,λ=γ-(α-(α&1)),
当α=0时,λ=γ,
其中,α&1表示将构成α的每个比特位分别与构成整数1的相应比特位进行逻辑与运算。
12.如权利要求11所述的校正装置,其特征是,
若当前频域帧信号的某频率对应的补偿系数与傅里叶变换的分辨率之积大于(-β/2)、且不大于β/2时,对当前频域帧信号的所述某频率加上所述补偿系数与傅里叶变换的分辨率之积得到校正频率;其中,β表示所述傅里叶变换的分辨率;
若当前频域帧信号的某频率对应的补偿系数与傅里叶变换的分辨率之积不大于(-β/2)、或者大于β/2时,对当前频域帧信号的所述某频率不进行校正。
13.一种语音信号啸叫频率的检测装置,其特征是,包括如权利要求9-12任一所述的语音信号频域频率的校正装置,还包括:
候选单元,用于若当前校正频域信号的某频率的幅值大于相邻的前一个频率的幅值、且大于相邻的后一个频率的幅值,则选择所述某频率为候选啸叫频率;
验证单元,用于计算候选啸叫频率的幅值与所述候选啸叫频率附近频率的平均幅值的幅值差,若所述幅值差大于第一预设幅值a且小于第二预设幅值b,则计算当前帧之前连续设定数量帧的校正频域信号中与所述候选啸叫频率相同的频率被选择为候选啸叫频率的次数,若所述次数大于预设次数阈值,则确定所述候选啸叫频率为啸叫频率;其中所述第一预设幅值a小于第二预设幅值b。
14.如权利要求13所述的检测装置,其特征是,
所述验证单元还用于,
若所述幅值差大于所述第二预设幅值b,则确定所述候选啸叫频率为啸叫频率。
15.如权利要求13所述的检测装置,其特征是,
所述验证单元还用于,
若所述幅值差小于所述第一预设幅值a,则确定所述候选啸叫频率不是啸叫频率。
16.如权利要求13所述的检测装置,其特征是,
所述候选啸叫频率附近频率不包括所述候选啸叫频率相邻的前一个频率和后一个频率。
17.一种语音信号啸叫频率的检测装置,其特征是,包括如权利要求9-12任一所述的校正装置,还包括:
排序单元,用于按照幅值从大到小的顺序对所述当前校正频域信号中的频率进行排序;
检测单元,用于从幅值最大的频率开始对所述当前校正频域信号进行啸叫频率检测以获得啸叫频率。
18.一种语音信号啸叫的抑制装置,其特征是,包括如权利要求12-17任一所述的语音信号啸叫频率的检测装置,还包括:
设置单元,用于根据检测到的啸叫频率设置陷波器的中心频率;
抑制单元,用于利用所述陷波器对所述语音信号进行处理,得到抑制啸叫后的语音信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010373268.5A CN112037816B (zh) | 2020-05-06 | 2020-05-06 | 语音信号频域频率的校正、啸叫检测、抑制方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010373268.5A CN112037816B (zh) | 2020-05-06 | 2020-05-06 | 语音信号频域频率的校正、啸叫检测、抑制方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112037816A CN112037816A (zh) | 2020-12-04 |
CN112037816B true CN112037816B (zh) | 2023-11-28 |
Family
ID=73579423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010373268.5A Active CN112037816B (zh) | 2020-05-06 | 2020-05-06 | 语音信号频域频率的校正、啸叫检测、抑制方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112037816B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112565981B (zh) * | 2021-02-20 | 2021-06-15 | 深圳市智听科技有限公司 | 啸叫抑制方法、装置、助听器及存储介质 |
CN112802492B (zh) * | 2021-04-14 | 2021-07-27 | 展讯通信(上海)有限公司 | 一种抑制啸叫的方法、装置、芯片及模组设备 |
CN113299304B (zh) * | 2021-05-11 | 2023-09-12 | 泰凌微电子(上海)股份有限公司 | 抑制麦克风啸叫的方法、装置和麦克风 |
CN114757229A (zh) * | 2022-04-11 | 2022-07-15 | 维沃移动通信有限公司 | 信号处理方法、装置、电子设备及介质 |
CN114841218A (zh) * | 2022-06-02 | 2022-08-02 | 北京工业大学 | 一种语音啸叫检测算法 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09146561A (ja) * | 1995-11-24 | 1997-06-06 | Fuji Heavy Ind Ltd | 車室内騒音低減装置 |
JP2000075883A (ja) * | 1997-11-28 | 2000-03-14 | Matsushita Electric Ind Co Ltd | 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体 |
CN1420261A (zh) * | 2001-09-19 | 2003-05-28 | 通用电气公司 | 采用校正信号抑制压力波的系统和方法 |
EP1363200A2 (en) * | 2002-05-13 | 2003-11-19 | Knowledgenetica Corporation | Multi-dimensional method and apparatus for automated language interpretation |
TW201040942A (en) * | 2009-05-13 | 2010-11-16 | Richwave Technology Corp | Method and apparatus for multiplex signal decoding |
CN101989426A (zh) * | 2009-08-05 | 2011-03-23 | 立积电子股份有限公司 | 立体音频解码器以及多工信号解码方法 |
CN103250208A (zh) * | 2010-11-24 | 2013-08-14 | 日本电气株式会社 | 信号处理装置、信号处理方法和信号处理程序 |
CN103528634A (zh) * | 2013-10-23 | 2014-01-22 | 山东大学 | 一种科里奥利质量流量计云传输数字信号处理装置及方法 |
EP2933992A1 (en) * | 2014-04-15 | 2015-10-21 | Nokia Technologies OY | Method, apparatus and computer program for selecting an audio track |
CN105812993A (zh) * | 2014-12-29 | 2016-07-27 | 联芯科技有限公司 | 啸叫检测和抑制方法及其装置 |
CN106373587A (zh) * | 2016-08-31 | 2017-02-01 | 北京容联易通信息技术有限公司 | 一种实时通信系统中的自动声反馈检测与消除方法 |
CN106558316A (zh) * | 2016-11-09 | 2017-04-05 | 天津大学 | 一种基于长时信号特定频带变化率的啸叫检测方法 |
CN110536215A (zh) * | 2019-09-09 | 2019-12-03 | 普联技术有限公司 | 音频信号处理的方法、装置、计算设置及存储介质 |
CN110782910A (zh) * | 2019-11-06 | 2020-02-11 | 大连理工大学 | 一种高检出率的啸叫音频检测系统 |
-
2020
- 2020-05-06 CN CN202010373268.5A patent/CN112037816B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09146561A (ja) * | 1995-11-24 | 1997-06-06 | Fuji Heavy Ind Ltd | 車室内騒音低減装置 |
JP2000075883A (ja) * | 1997-11-28 | 2000-03-14 | Matsushita Electric Ind Co Ltd | 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体 |
CN1420261A (zh) * | 2001-09-19 | 2003-05-28 | 通用电气公司 | 采用校正信号抑制压力波的系统和方法 |
EP1363200A2 (en) * | 2002-05-13 | 2003-11-19 | Knowledgenetica Corporation | Multi-dimensional method and apparatus for automated language interpretation |
TW201040942A (en) * | 2009-05-13 | 2010-11-16 | Richwave Technology Corp | Method and apparatus for multiplex signal decoding |
CN101989426A (zh) * | 2009-08-05 | 2011-03-23 | 立积电子股份有限公司 | 立体音频解码器以及多工信号解码方法 |
CN103250208A (zh) * | 2010-11-24 | 2013-08-14 | 日本电气株式会社 | 信号处理装置、信号处理方法和信号处理程序 |
CN103528634A (zh) * | 2013-10-23 | 2014-01-22 | 山东大学 | 一种科里奥利质量流量计云传输数字信号处理装置及方法 |
EP2933992A1 (en) * | 2014-04-15 | 2015-10-21 | Nokia Technologies OY | Method, apparatus and computer program for selecting an audio track |
CN105812993A (zh) * | 2014-12-29 | 2016-07-27 | 联芯科技有限公司 | 啸叫检测和抑制方法及其装置 |
CN106373587A (zh) * | 2016-08-31 | 2017-02-01 | 北京容联易通信息技术有限公司 | 一种实时通信系统中的自动声反馈检测与消除方法 |
CN106558316A (zh) * | 2016-11-09 | 2017-04-05 | 天津大学 | 一种基于长时信号特定频带变化率的啸叫检测方法 |
CN110536215A (zh) * | 2019-09-09 | 2019-12-03 | 普联技术有限公司 | 音频信号处理的方法、装置、计算设置及存储介质 |
CN110782910A (zh) * | 2019-11-06 | 2020-02-11 | 大连理工大学 | 一种高检出率的啸叫音频检测系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112037816A (zh) | 2020-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112037816B (zh) | 语音信号频域频率的校正、啸叫检测、抑制方法及装置 | |
US8509451B2 (en) | Noise suppressing device, noise suppressing controller, noise suppressing method and recording medium | |
EP1887831B1 (en) | Method, apparatus and program for estimating the direction of a sound source | |
US8265295B2 (en) | Method and apparatus for identifying feedback in a circuit | |
US9113241B2 (en) | Noise removing apparatus and noise removing method | |
US8170879B2 (en) | Periodic signal enhancement system | |
US8989403B2 (en) | Noise suppression device | |
US8818805B2 (en) | Sound processing apparatus, sound processing method and program | |
JP2004507141A (ja) | 音声強調システム | |
US20100232620A1 (en) | Sound processing device, correcting device, correcting method and recording medium | |
US8885839B2 (en) | Signal processing method and apparatus | |
CN110248300B (zh) | 一种基于自主学习的啸叫抑制方法及扩声系统 | |
US8259961B2 (en) | Audio processing apparatus and program | |
CN104919525A (zh) | 用于评估退化语音信号的可理解性的方法和装置 | |
CN113452855A (zh) | 啸叫处理方法、装置、电子设备及存储介质 | |
US6674863B2 (en) | Microphone-speaker apparatus | |
CN114268531B (zh) | 一种单音干扰检测和消除方法 | |
US8155327B2 (en) | Tone detector and method used in a robot for detecting a tone | |
US7542577B2 (en) | Input sound processor | |
JP5459220B2 (ja) | 発話音声検出装置 | |
US8243953B2 (en) | Method and apparatus for identifying a feedback frequency in a signal | |
US8615075B2 (en) | Method and apparatus for removing noise signal from input signal | |
JP4367328B2 (ja) | ハウリングキャンセラ | |
JP2005157086A (ja) | 音声認識装置 | |
CN113316075A (zh) | 一种啸叫检测方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 519075 No. 333, Kexing Road, Xiangzhou District, Zhuhai City, Guangdong Province Applicant after: ZHUHAI JIELI TECHNOLOGY Co.,Ltd. Address before: Floor 1-107, building 904, ShiJiHua Road, Zhuhai City, Guangdong Province Applicant before: ZHUHAI JIELI TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |