CN104835502A - 音频信号处理方法、装置及电子设备 - Google Patents

音频信号处理方法、装置及电子设备 Download PDF

Info

Publication number
CN104835502A
CN104835502A CN201510259913.XA CN201510259913A CN104835502A CN 104835502 A CN104835502 A CN 104835502A CN 201510259913 A CN201510259913 A CN 201510259913A CN 104835502 A CN104835502 A CN 104835502A
Authority
CN
China
Prior art keywords
audio block
pending audio
described pending
ramp
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510259913.XA
Other languages
English (en)
Other versions
CN104835502B (zh
Inventor
王珂
禹业茂
吴泽贤
温斌
纪红
皮慧斌
李曦
王金宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Czech Surway Technology (beijing) Co Ltd
Original Assignee
Czech Surway Technology (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Czech Surway Technology (beijing) Co Ltd filed Critical Czech Surway Technology (beijing) Co Ltd
Priority to CN201510259913.XA priority Critical patent/CN104835502B/zh
Publication of CN104835502A publication Critical patent/CN104835502A/zh
Application granted granted Critical
Publication of CN104835502B publication Critical patent/CN104835502B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施例公开了一种音频信号处理方法、装置及电子设备,根据待处理音频块中是否携带语音信号获取非线性增益值,基于获取的非线性增益值对待处理音频块进行第一次回声处理,得到第一处理结果,若判断结果为所述待处理音频块中携带有语音信号,则对第一处理结果做进一步的处理,即将所述第一处理结果减去所述待处理音频块的残余回声信号,得到去除残余回声信号的音频信号,从而降低近端信号中的回声残留。

Description

音频信号处理方法、装置及电子设备
技术领域
本发明涉及信号处理技术领域,更具体地说,涉及一种音频信号处理方法、装置及电子设备。
背景技术
当两个电子设备进行语音通信时,第一电子设备扬声器中播放的声音通过第一电子设备的麦克风再次被录入,然后回传至第二电子设备,这样会使第二电子设备用户听到自己的声音(类似对着山谷大喊产生的回声),这就是回声,影响通话质量。
因此,需要对电子设备采集的音频信号(即近端音频信号)进行处理,以消除近端音频信号中夹杂的回声。
然而,发明人在实现本发明的过程中发现,传统的回声消除方法回声消除不彻底,进行回声消除后近端信号中还是会有较多的回声残留。因此,如何降低近端信号中的回声残留成为亟待解决的问题。
发明内容
本发明的目的是提供一种音频信号信号处理方法、装置及电子设备,以降低近端信号中的回声残留。
为实现上述目的,本发明提供了如下技术方案:
一种音频信号处理方法,应用于电子设备,所述方法包括:
获取待处理音频块的估计回声信号;
判断所述待处理音频块中是否携带有语音信号;
依据判断结果获取与所述待处理音频块对应的非线性增益值;
基于所述非线性增益值对所述待处理音频块进行第一次回声处理,得到第一处理结果,第一次回声处理基于第一公式实现,所述第一公式为:
Y=ramp1*(X*H)+(1-ramp1)c
其中,Y为第一处理结果;ramp1为与所述待处理音频块对应的非线性增益值;X为所述待处理音频块;H为滤波器参数;c为预设的舒适噪声信号;
若所述判断结果为所述待处理音频块中携带有语音信号,则将所述第一处理结果减去所述待处理音频块的残余回声信号,得到去除残余回声信号的音频信号;其中,所述待处理音频块的残余回声信号为所述待处理音频块的估计回声信号与确定所述待处理音频块之前最后确定的一个未携带语音信号的音频块的残余回声信号与估计回声信号的比值的乘积。
上述方法,优选的,所述判断所述待处理音频块中是否携带有语音信号包括:
获取所述待处理音频块的估计回声信号与所述待处理音频块的比值;
若所述待处理音频块的估计回声信号与所述待处理音频块的比值大于或等于预设阈值,则确定所述待处理音频块中未携带语音信号;
若所述待处理音频块的估计回声信号与所述待处理音频块的比值小于预设阈值,则确定所述待处理音频块中携带有语音信号。
上述方法,优选的,所述预设阈值为0.8。
上述方法,优选的,若判断结果为所述待处理音频块中未携带语音信号,则所述依据判断结果获取与所述待处理音频块对应的非线性增益值包括:依据第二公式确定与所述待处理音频块对应的非线性增益值,所述第二公式为:
ramp 1 = ramp 0 - step 1 ramp 0 > 0 0 ramp 0 ≤ 0
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step1为第一过渡步长。
上述方法,优选的,所述若判断结果为所述待处理音频块中携带语音信号,则所述依据判断结果获取与所述待处理音频块对应的非线性增益值包括:依据第三公式确定与所述待处理音频块对应的非线性增益值,所述第三公式为:
ramp 1 = ramp 0 + step 2 ramp 0 < 1 1 ramp 0 &GreaterEqual; 1
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step2为第二过渡步长,所述第二过渡步长大于所述第一过渡步长。
一种音频信号处理装置,应用于电子设备,所述装置包括:
第一获取模块,用于获取待处理音频块的估计回声信号;
判断模块,用于判断所述待处理音频块中是否携带有语音信号;
第二获取模块,用于依据所述判断模块的判断结果获取与所述待处理音频块对应的非线性增益值;
第一处理模块,用于基于所述非线性增益值对所述待处理音频块进行第一次回声处理,得到第一处理结果,第一次回声处理基于第一公式实现,所述第一公式为:
Y=ramp1*(X*H)+(1-ramp1)c
其中,Y为第一处理结果;ramp1为与所述待处理音频块对应的非线性增益值;X为所述待处理音频块;H为滤波器参数;c为预设的舒适噪声信号;
第二处理模块,用于若所述判断模块的判断结果为所述待处理音频块中携带有语音信号,则将所述第一处理结果减去所述待处理音频块的残余回声信号,得到去除残余回声信号的音频信号;其中,所述待处理音频块的残余回声信号为所述待处理音频块的估计回声信号与确定所述待处理音频块之前最后确定的一个未携带语音信号的音频块的残余回声信号与估计回声信号的比值的乘积。
上述装置,优选的,所述判断模块包括:
第一获取单元,用于获取所述待处理音频块的估计回声信号与所述待处理音频块的比值;
判断单元,用于若所述待处理音频块的估计回声信号与所述待处理音频块的比值大于或等于预设阈值,则确定所述待处理音频块中未携带语音信号;若所述待处理音频块的估计回声信号与所述待处理音频块的比值小于预设阈值,则确定所述待处理音频块中携带有语音信号。
上述装置,优选的,所述第二获取模块包括:
第二获取单元,用于若所述判断模块的判断结果为所述待处理音频块中未携带语音信号,则依据第二公式确定与所述待处理音频块对应的非线性增益值,所述第二公式为:
ramp 1 = ramp 0 - step 1 ramp 0 > 0 0 ramp 0 &le; 0
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step1为第一过渡步长。
上述装置,优选的,所述第二获取模块包括:
第三获取单元,用于若所述判断模块的判断结果为所述待处理音频块中携带语音信号,则依据第三公式确定与所述待处理音频块对应的非线性增益值,所述第三公式为:
ramp 1 = ramp 0 + step 2 ramp 0 < 1 1 ramp 0 &GreaterEqual; 1
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step2为第二过渡步长,所述第二过渡步长大于所述第一过渡步长。
一种电子设备,包括如上任意一项所述的信号处理装置。
通过以上方案可知,本申请提供的一种音频信号处理方法、装置及电子设备,根据待处理音频块中是否携带语音信号获取非线性增益值,基于获取的非线性增益值对待处理音频块进行第一次回声处理,得到第一处理结果,若判断结果为所述待处理音频块中携带有语音信号,则对第一处理结果做进一步的处理,即将所述第一处理结果减去所述待处理音频块的残余回声信号,得到去除残余回声信号的音频信号,从而降低近端信号中的回声残留。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的音频信号处理方法的一种实现流程图;
图2为本申请实施例提供的判断待处理音频块中是否携带有语音信号的一种实现流程图;
图3为本申请实施例提供的音频信号处理装置的一种结构示意图;
图4为本申请实施例提供的判断模块的一种结构示意图;
图5为本申请实施例提供的第二获取模块的一种结构示意图;
图6为本申请实施例提供的第二获取模块的另一种结构示意图。
说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的部分,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示的以外的顺序实施。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的音频信号处理方法及装置应用于电子设备,该电子设备可以采集音频信号。
请参阅图1,图1为本申请实施例提供的音频信号处理方法的一种实现流程图,可以包括:
步骤S11:获取待处理音频块的估计回声信号;
在对音频信号(即近端信号)进行处理时,通常会把音频信号按时间划分为多个音频块,然后依次对每个音频块进行处理。例如,如果音频信号的持续时长为1s,一个音频块的持续时长为8ms,那么,该音频信号被划分为125个音频块。
本发明实施例中,可以将待处理的音频信号抽样后进行分块,逐音频块进行处理。待处理音频块即为按顺序获取的一个未进行处理的音频块。可以将音频块进行FFT变换得到音频块的频域信号,在频域对待处理音频块进行处理,即后续各个步骤均在频域执行。
步骤S12:判断所述待处理音频块中是否携带有语音信号;
本发明实施例中,可以基于待处理音频块的能量来判断待处理音频块中是否携带有语音信号。具体的,若待处理音频块的能量大于预设门限值,则确定待处理音频块中携带有语音信号,若待处理音频块的能量小于或等于所述预设门限值,则确定待处理音频块中未携带语音信号。
也可以基于待处理音频块的估计回声信号判断待处理音频块中是否携带有语音信号。
步骤S13:依据判断结果获取与所述待处理音频块对应的非线性增益值;
本发明实施例中,对于不同的音频块,若具有相同的判断结果,非线性增益值可以相同。例如,若判断结果为待处理音频块中携带有语音信号,则确定非线性增益值为1,若判断结果为待处理音频块中未携带有语音信号,则确定非线性增益值为0。
当然,本发明实施例中,对于不同的音频块,若具有相同的判断结果,非线性增益值也可以不同。
步骤S14:基于所述非线性增益值对所述待处理音频块进行第一次回声处理,得到第一处理结果,第一次回声处理基于第一公式实现,所述第一公式为:
Y=ramp1*(X*H)+(1-ramp1)c
其中,Y为第一处理结果;ramp1为与所述待处理音频块对应的非线性增益值;X为所述待处理音频块;H为滤波器参数;c为预设的舒适噪声信号;
本发明实施例中,X*H表示对待处理音频块进行滤波,以滤除回声信号。
若在频域进行处理,则第一公式具体为:
Y(k)=ramp1*(X(k)*H(k))+(1-ramp1)c(k)
其中,Y(k)为第一处理结果的频谱;ramp1为与所述待处理音频块对应的非线性增益值;X(k)为所述待处理音频块的频谱;H(k)为与待处理音频块的频点k对应的滤波器参数;c(k)为预设的舒适噪声信号的频谱;
若判断出待处理音频块中未携带有语音信号,则第一处理结果为待输出信号,该待输出信号可能为预设的舒适噪声信号,也可能为预设的舒适噪声信号与滤除回声信号后的信号的混合信号。
步骤S15:若所述判断结果为所述待处理音频块中携带有语音信号,则将所述第一处理结果减去所述待处理音频块的残余回声信号,得到去除残余回声信号的音频信号;其中,所述待处理音频块的残余回声信号为所述待处理音频块的估计回声信号与确定所述待处理音频块之前最后确定的一个未携带语音信号的音频块的残余回声信号与估计回声信号的比值的乘积。
本发明实施例中,未携带语音信号的音频块的残余回声信号为:该未携带语音信号的音频块与该未携带语音信号的音频块的估计回声信号的差值。
若将未携带语音信号的音频块的残余回声信号的残余回声信号与该未携带语音信号的音频块的估计回声信号的比值记为第一比值,则待处理音频块的残余回声信号为所述待处理音频块的估计回声信号与确定所述待处理音频块之前最后确定的一个未携带语音信号的音频块的第一比值的乘积。
本发明实施例中,若判断出待处理音频块中携带有语音信号,则对第一处理结果做进一步的回声处理,即对待处理音频块进行两次回声消除处理,第一次通过滤波消除大部分回声信号,然后将第一处理结果减去残余回声信号得到去除残余回声信号的音频信号。
本发明实施例提供的音频信号处理方法,根据待处理音频块中是否携带语音信号获取非线性增益值,基于获取的非线性增益值对待处理音频块进行第一次回声处理,得到第一处理结果,若判断结果为所述待处理音频块中携带有语音信号,则对第一处理结果做进一步的处理,即将所述第一处理结果减去所述待处理音频块的残余回声信号,得到去除残余回声信号的音频信号,从而降低近端信号中的回声残留。
上述实施例中,可选的,所述判断所述待处理音频块中是否携带有语音信号的一种实现流程图如图2所示,可以包括:
步骤S21:获取所述待处理音频块的估计回声信号与所述待处理音频块的比值;
若在频域处理,则待处理音频块的估计回声信号与所述待处理音频块的比值为待处理音频块的估计回声信号与待处理音频块在频谱上各个对应频点的幅度的比值。
步骤S22:将所述待处理音频块的估计回声信号与所述待处理音频块的比值与预设阈值进行比较,若比较结果为所述待处理音频块的估计回声信号与所述待处理音频块的比值大于或等于所述预设阈值,则执行步骤S23;若比较结果为所述待处理音频块的估计回声信号与所述待处理音频块的比值小于所述预设阈值,则执行步骤S24;
若在频域处理,则只要有一个频点处的比值小于所述预设阈值,则确定所述待处理音频块中携带有语音信号,否则可以确定所述待处理音频块中未携带语音信号。
可选的,为了避免噪声的影响,本发明实施例中,所述预设阈值可以为0.8。
步骤S23:确定所述待处理音频块中未携带语音信号;
步骤S24:确定所述待处理音频块中携带有语音信号。
本发明实施例中,基于待处理音频块的估计回声信号与所述待处理音频块的比值判断待处理语音块中是否携带语音信号,判断结果更准确,避免了因为噪声过大而导致判断判断错误的现象,不会因为待处理音频块中语音声音过小而导致判断错误。还可以避免回声比较大导致回声和语音判断混淆的情况。
本发明实施例中,对于不同的音频块,若具有相同的判断结果,非线性增益值也可以不同。
可选的,若判断结果为所述待处理音频块中未携带语音信号,则所述依据判断结果获取与所述待处理音频块对应的非线性增益值可以包括:依据第二公式确定与所述待处理音频块对应的非线性增益值,所述第二公式为:
ramp 1 = ramp 0 - step 1 ramp 0 > 0 0 ramp 0 &le; 0
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step1为第一过渡步长。
可选的,step1取值可以为0.2。
若所述待处理音频块中未携带语音信号,且与所述待处理音频块相邻的前一音频块携带有语音信号,则将ramp0初始化为1,即若判断结果为所述待处理音频块中未携带语音信号,且与所述待处理音频块相邻的前一音频块携带有语音信号,则在依据第二公式确定与所述待处理音频块对应的非线性增益值时,与所述待处理音频块相邻的前一音频块对应的第二非线性增益值为1。
本发明实施例中,若所述待处理音频块中未携带语音信号,且与所述待处理音频块相邻的前一音频块携带有语音信号,不输出预设舒适噪声信号,而是基于第一过渡步长输出,从而可以在连续若干个音频块之后输出舒适噪声信号(该若干个音频块均未携带语音信号),即从输出语音信号平滑过渡到输出舒适噪声信号,避免频繁切换输出,从而降低系统处理的复杂度,还能进一步降低噪声干扰。
可选的,若判断结果为所述待处理音频块中携带语音信号,则所述依据判断结果获取与所述待处理音频块对应的非线性增益值可以包括:依据第三公式确定与所述待处理音频块对应的非线性增益值,所述第三公式为:
ramp 1 = ramp 0 + step 2 ramp 0 < 1 1 ramp 0 &GreaterEqual; 1
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step2为第二过渡步长,所述第二过渡步长大于所述第一过渡步长。
可选的,step2取值可以为0.5。
若所述待处理音频块中携带语音信号,且与所述待处理音频块相邻的前一音频块未携带语音信号,则将ramp0初始化为0,即若判断结果为所述待处理音频块中携带有语音信号,且与所述待处理音频块相邻的前一音频块未携带语音信号,则在依据第三公式确定与所述待处理音频块对应的非线性增益值时,与所述待处理音频块相邻的前一音频块对应的第二非线性增益值为0。
本发明实施例中,若所述待处理音频块中携带语音信号,且与所述待处理音频块相邻的前一音频块未携带语音信号,基于第二过渡步长输出语音信号,该语音信号中携带有舒适噪声,从而可以在连续若干个语音块(该若干个语音块均携带语音信号)之后获得对所述若干个语音块之后的待处理音频块滤波得到的信号,从而可以避免待处理音频块出现“截断失真”,即待处理音频块出现语音缺失。
综上,本发明实施例中,当音频信号从有语音信号切换到无语音信号时,过渡时间比较长,从而可以避免频繁切换输出,进而降低系统处理的复杂度,还能进一步降低噪声干扰。当音频信号从无语音信号切换到有语音信号时,过渡时间比较短,防止语音信号出现语音缺失。
与方法实施例相对应,本发明实施例还提供一种音频信号处理装置,本发明实施例提供的音频信号处理装置的一种结构示意图如图3所示,可以包括:
第一获取模块31,判断模块32,第二获取模块33,第一处理模块34和第二处理模块35;其中,
第一获取模块31用于获取待处理音频块的估计回声信号;
在对音频信号进行处理时,通常会把音频信号按时间划分为多个音频块,然后依次对每个音频块进行处理。例如,如果音频信号的持续时长为1s,一个音频块的持续时长为8ms,那么,该音频信号被划分为125个音频块。
本发明实施例中,可以将待处理的音频信号抽样后进行分块,逐音频块进行处理。待处理音频块即为按顺序获取的未进行处理的一个音频块。可以将音频块进行FFT变换得到音频块的频域信号,在频域对待处理音频块进行处理,即后续各个步骤均在频域执行。
判断模块32用于判断所述待处理音频块中是否携带有语音信号;
本发明实施例中,可以基于待处理音频块的能量来判断待处理音频块中是否携带有语音信号。具体的,若待处理音频块的能量大于预设门限值,则确定待处理音频块中携带有语音信号,若待处理音频块的能量小于或等于所述预设门限值,则确定待处理音频块中未携带语音信号。
也可以基于待处理音频块的估计回声信号判断待处理音频块中是否携带有语音信号。
第二获取模块33用于依据所述判断模块的判断结果获取与所述待处理音频块对应的非线性增益值;
本发明实施例中,对于不同的音频块,若具有相同的判断结果,非线性增益值可以相同。例如,若判断结果为待处理音频块中携带有语音信号,则确定非线性增益值为1,若判断结果为待处理音频块中未携带有语音信号,则确定非线性增益值为0。
当然,本发明实施例中,对于不同的音频块,若具有相同的判断结果,非线性增益值也可以不同。
第一处理模块34用于基于所述非线性增益值对所述待处理音频块进行第一次回声处理,得到第一处理结果,第一次回声处理基于第一公式实现,所述第一公式为:
Y=ramp1*(X*H)+(1-ramp1)c
其中,Y为第一处理结果;ramp1为与所述待处理音频块对应的非线性增益值;X为所述待处理音频块;H为滤波器参数;c为预设的舒适噪声信号;
本发明实施例中,X*H表示对待处理音频块进行滤波,以滤除回声信号。
若在频域进行处理,则第一公式具体为:
Y(k)=ramp1*(X(k)*H(k))+(1-ramp1)c(k)
其中,Y(k)为第一处理结果的频谱;ramp1为与所述待处理音频块对应的非线性增益值;X(k)为所述待处理音频块的频谱;H(k)为与待处理音频块的频点k对应的滤波器参数;c(k)为预设的舒适噪声信号的频谱;
若判断出待处理音频块中未携带有语音信号,则第一处理结果为待输出信号,该待输出信号可能为预设的舒适噪声信号,也可能为预设的舒适噪声信号与滤除回声信号后的信号的混合信号。
第二处理模块35用于若所述判断模块的判断结果为所述待处理音频块中携带有语音信号,则将所述第一处理结果减去所述待处理音频块的残余回声信号,得到去除残余回声信号的音频信号;其中,所述待处理音频块的残余回声信号为所述待处理音频块的估计回声信号与确定所述待处理音频块之前最后确定的一个未携带语音信号的音频块的残余回声信号与估计回声信号的比值的乘积。
本发明实施例中,未携带语音信号的音频块的残余回声信号为:该未携带语音信号的音频块与该未携带语音信号的音频块的估计回声信号的差值。
若将未携带语音信号的音频块的残余回声信号的残余回声信号与该未携带语音信号的音频块的估计回声信号的比值记为第一比值,则待处理音频块的残余回声信号为所述待处理音频块的估计回声信号与确定所述待处理音频块之前最后确定的一个未携带语音信号的音频块的第一比值的乘积。
本发明实施例中,若判断出待处理音频块中携带有语音信号,则对第一处理结果做进一步的回声处理,即对待处理音频块进行两次回声消除处理,第一次通过滤波消除大部分回声信号,然后将第一处理结果减去残余回声信号得到去除残余回声信号的音频信号。
本发明实施例提供的音频信号处理装置,第二获取模块根据待处理音频块中是否携带语音信号获取非线性增益值,第一处理模块基于获取的非线性增益值对待处理音频块进行第一次回声处理,得到第一处理结果,若待处理音频块中携带有语音信号,则第二处理模块对第一处理结果做进一步的处理,即将所述第一处理结果减去所述待处理音频块的残余回声信号,得到去除残余回声信号的音频信号,从而降低近端信号中的回声残留。
上述实施例中,可选的,判断模块32的一种结构示意图如图4所示,可以包括:
第一获取单元41和判断单元42;其中,
第一获取单元41用于获取所述待处理音频块的估计回声信号与所述待处理音频块的比值;
若在频域处理,则待处理音频块的估计回声信号与所述待处理音频块的比值为待处理音频块的估计回声信号与待处理音频块在频谱上各个对应频点的幅度的比值。
判断单元42用于若所述待处理音频块的估计回声信号与所述待处理音频块的比值大于或等于预设阈值,则确定所述待处理音频块中未携带语音信号;若所述待处理音频块的估计回声信号与所述待处理音频块的比值小于预设阈值,则确定所述待处理音频块中携带有语音信号。
若在频域处理,则只要有一个频点处的比值小于所述预设阈值,则确定所述待处理音频块中携带有语音信号,否则可以确定所述待处理音频块中未携带语音信号。
可选的,为了避免噪声的影响,本发明实施例中,所述预设阈值可以为0.8。
本发明实施例中,基于待处理音频块的估计回声信号与所述待处理音频块的比值判断待处理语音块中是否携带语音信号,判断结果更准确,避免了因为噪声过大而导致判断判断错误的现象,不会因为待处理音频块中语音声音过小而导致判断错误。还可以避免回声比较大导致回声和语音判断混淆的情况。
本发明实施例中,对于不同的音频块,若具有相同的判断结果,非线性增益值也可以不同。
可选的,第二获取模块33的一种结构示意图如图5所示,可以包括:
第二获取单元51,用于若所述判断模块的判断结果为所述待处理音频块中未携带语音信号,则依据第二公式确定与所述待处理音频块对应的非线性增益值,所述第二公式为:
ramp 1 = ramp 0 - step 1 ramp 0 > 0 0 ramp 0 &le; 0
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step1为第一过渡步长。
可选的,step1取值可以为0.2。
若所述待处理音频块中未携带语音信号,且与所述待处理音频块相邻的前一音频块携带有语音信号,则将ramp0初始化为1,即若判断结果为所述待处理音频块中未携带语音信号,且与所述待处理音频块相邻的前一音频块携带有语音信号,则在依据第二公式确定与所述待处理音频块对应的非线性增益值时,与所述待处理音频块相邻的前一音频块对应的第二非线性增益值为1。
本发明实施例中,若所述待处理音频块中未携带语音信号,且与所述待处理音频块相邻的前一音频块携带有语音信号,不输出预设舒适噪声信号,而是基于第一过渡步长输出,从而可以在连续若干个音频块之后输出舒适噪声信号(该若干个音频块均未携带语音信号),即从输出语音信号平滑过渡到输出舒适噪声信号,避免频繁切换输出,从而降低系统处理的复杂度,还能进一步降低噪声干扰。
可选的,第二获取模块33的另一种结构示意图如图6所示,可以包括:
第三获取单元61,用于若所述判断模块的判断结果为所述待处理音频块中携带语音信号,则依据第三公式确定与所述待处理音频块对应的非线性增益值,所述第三公式为:
ramp 1 = ramp 0 + step 2 ramp 0 < 1 1 ramp 0 &GreaterEqual; 1
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step2为第二过渡步长,所述第二过渡步长大于所述第一过渡步长。
可选的,step2取值可以为0.5。
若所述待处理音频块中携带语音信号,且与所述待处理音频块相邻的前一音频块未携带语音信号,则将ramp0初始化为0,即若判断结果为所述待处理音频块中携带有语音信号,且与所述待处理音频块相邻的前一音频块未携带语音信号,则在依据第三公式确定与所述待处理音频块对应的非线性增益值时,与所述待处理音频块相邻的前一音频块对应的第二非线性增益值为0。
本发明实施例中,若所述待处理音频块中携带语音信号,且与所述待处理音频块相邻的前一音频块未携带语音信号,基于第二过渡步长输出语音信号,该语音信号中携带有舒适噪声,从而可以在连续若干个语音块(该若干个语音块均携带语音信号)之后获得对所述若干个语音块之后的待处理音频块滤波得到的信号,从而可以避免待处理音频块出现“截断失真”,即待处理音频块出现语音缺失。
综上,本发明实施例中,当音频信号从有语音信号切换到无语音信号时,过渡时间比较长,从而可以避免频繁切换输出,进而降低系统处理的复杂度,还能进一步降低噪声干扰。当音频信号从无语音信号切换到有语音信号时,过渡时间比较短,防止语音信号出现语音缺失。
本发明实施例还提供一种电子设备,该电子设备具有如上任意一装置实施例所述的音频信号处理装置。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统(若存在)、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统(若存在)、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种音频信号处理方法,应用于电子设备,其特征在于,所述方法包括:
获取待处理音频块的估计回声信号;
判断所述待处理音频块中是否携带有语音信号;
依据判断结果获取与所述待处理音频块对应的非线性增益值;
基于所述非线性增益值对所述待处理音频块进行第一次回声处理,得到第一处理结果,第一次回声处理基于第一公式实现,所述第一公式为:
Y=ramp1*(X*H)+(1-ramp1)c
其中,Y为第一处理结果;ramp1为与所述待处理音频块对应的非线性增益值;X为所述待处理音频块;H为滤波器参数;c为预设的舒适噪声信号;
若所述判断结果为所述待处理音频块中携带有语音信号,则将所述第一处理结果减去所述待处理音频块的残余回声信号,得到去除残余回声信号的音频信号;其中,所述待处理音频块的残余回声信号为所述待处理音频块的估计回声信号与确定所述待处理音频块之前最后确定的一个未携带语音信号的音频块的残余回声信号与估计回声信号的比值的乘积。
2.根据权利要求1所述的方法,其特征在于,所述判断所述待处理音频块中是否携带有语音信号包括:
获取所述待处理音频块的估计回声信号与所述待处理音频块的比值;
若所述待处理音频块的估计回声信号与所述待处理音频块的比值大于或等于预设阈值,则确定所述待处理音频块中未携带语音信号;
若所述待处理音频块的估计回声信号与所述待处理音频块的比值小于预设阈值,则确定所述待处理音频块中携带有语音信号。
3.根据权利要求2所述的方法,其特征在于,所述预设阈值为0.8。
4.根据权利要求1所述的方法,其特征在于,若判断结果为所述待处理音频块中未携带语音信号,则所述依据判断结果获取与所述待处理音频块对应的非线性增益值包括:依据第二公式确定与所述待处理音频块对应的非线性增益值,所述第二公式为:
ramp 1 = ramp 0 - step 1 ramp 0 > 0 0 ramp 0 &le; 0
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step1为第一过渡步长。
5.根据权利要求1所述的方法,其特征在于,所述若判断结果为所述待处理音频块中携带语音信号,则所述依据判断结果获取与所述待处理音频块对应的非线性增益值包括:依据第三公式确定与所述待处理音频块对应的非线性增益值,所述第三公式为:
ramp 1 = ramp 0 + step 2 ramp 0 < 1 1 ramp 0 &GreaterEqual; 1
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step2为第二过渡步长,所述第二过渡步长大于所述第一过渡步长。
6.一种音频信号处理装置,应用于电子设备,其特征在于,所述装置包括:
第一获取模块,用于获取待处理音频块的估计回声信号;
判断模块,用于判断所述待处理音频块中是否携带有语音信号;
第二获取模块,用于依据所述判断模块的判断结果获取与所述待处理音频块对应的非线性增益值;
第一处理模块,用于基于所述非线性增益值对所述待处理音频块进行第一次回声处理,得到第一处理结果,第一次回声处理基于第一公式实现,所述第一公式为:
Y=ramp1*(X*H)+(1-ramp1)c
其中,Y为第一处理结果;ramp1为与所述待处理音频块对应的非线性增益值;X为所述待处理音频块;H为滤波器参数;c为预设的舒适噪声信号;
第二处理模块,用于若所述判断模块的判断结果为所述待处理音频块中携带有语音信号,则将所述第一处理结果减去所述待处理音频块的残余回声信号,得到去除残余回声信号的音频信号;其中,所述待处理音频块的残余回声信号为所述待处理音频块的估计回声信号与确定所述待处理音频块之前最后确定的一个未携带语音信号的音频块的残余回声信号与估计回声信号的比值的乘积。
7.根据权利要求6所述的装置,其特征在于,所述判断模块包括:
第一获取单元,用于获取所述待处理音频块的估计回声信号与所述待处理音频块的比值;
判断单元,用于若所述待处理音频块的估计回声信号与所述待处理音频块的比值大于或等于预设阈值,则确定所述待处理音频块中未携带语音信号;若所述待处理音频块的估计回声信号与所述待处理音频块的比值小于预设阈值,则确定所述待处理音频块中携带有语音信号。
8.根据权利要求6所述的装置,其特征在于,所述第二获取模块包括:
第二获取单元,用于若所述判断模块的判断结果为所述待处理音频块中未携带语音信号,则依据第二公式确定与所述待处理音频块对应的非线性增益值,所述第二公式为:
ramp 1 = ramp 0 - step 1 ramp 0 > 0 0 ramp 0 &le; 0
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step1为第一过渡步长。
9.根据权利要求6所述的装置,其特征在于,所述第二获取模块包括:
第三获取单元,用于若所述判断模块的判断结果为所述待处理音频块中携带语音信号,则依据第三公式确定与所述待处理音频块对应的非线性增益值,所述第三公式为:
ramp 1 = ramp 0 + step 2 ramp 0 < 1 1 ramp 0 &GreaterEqual; 1
其中,ramp1为与所述待处理音频块对应的第一非线性增益值;ramp0为与所述待处理音频块相邻的前一音频块对应的第二非线性增益值;step2为第二过渡步长,所述第二过渡步长大于所述第一过渡步长。
10.一种电子设备,其特征在于,包括如权利要求6-9任意一项所述的信号处理装置。
CN201510259913.XA 2015-05-20 2015-05-20 音频信号处理方法、装置及电子设备 Active CN104835502B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510259913.XA CN104835502B (zh) 2015-05-20 2015-05-20 音频信号处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510259913.XA CN104835502B (zh) 2015-05-20 2015-05-20 音频信号处理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN104835502A true CN104835502A (zh) 2015-08-12
CN104835502B CN104835502B (zh) 2018-04-10

Family

ID=53813341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510259913.XA Active CN104835502B (zh) 2015-05-20 2015-05-20 音频信号处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN104835502B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108831497A (zh) * 2018-05-22 2018-11-16 出门问问信息科技有限公司 一种回声压缩方法及装置、存储介质、电子设备
CN109040498A (zh) * 2018-08-12 2018-12-18 瑞声科技(南京)有限公司 一种提升回声抵消效果的方法及其系统
WO2019223603A1 (zh) * 2018-05-22 2019-11-28 出门问问信息科技有限公司 一种语音处理方法、装置及电子设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030059056A1 (en) * 2001-09-25 2003-03-27 D.S.P.C. Technologies Ltd Method and apparatus for determining a nonlinear response function for a loudspeaker
CN1756109A (zh) * 2004-09-28 2006-04-05 北京信威通信技术股份有限公司 一种抵消公共电话网电路回声的方法
CN1956480A (zh) * 2005-10-28 2007-05-02 上海贝岭股份有限公司 一种声学回声消除方法
EP1584177B1 (en) * 2003-01-08 2007-11-07 Nxp B.V. Non-linear acoustic echo canceller
CN101297354A (zh) * 2005-10-28 2008-10-29 索尼英国有限公司 音频处理
WO2009029605A1 (en) * 2007-08-31 2009-03-05 Motorola, Inc. Acoustic echo cancellation based on noise environment
CN101562669A (zh) * 2009-03-11 2009-10-21 屈国良 自适应全双工全频段回声消除的方法
US20120207325A1 (en) * 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation Multi-Channel Wind Noise Suppression System and Method
CN102655005A (zh) * 2011-03-01 2012-09-05 华为技术有限公司 一种语音增强处理方法和装置
CN103905656A (zh) * 2012-12-27 2014-07-02 联芯科技有限公司 残留回声的检测方法及装置
WO2014181330A1 (en) * 2013-05-06 2014-11-13 Waves Audio Ltd. A method and apparatus for suppression of unwanted audio signals
CN104506747A (zh) * 2015-01-21 2015-04-08 捷思锐科技(北京)有限公司 一种回声消除的方法及装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030059056A1 (en) * 2001-09-25 2003-03-27 D.S.P.C. Technologies Ltd Method and apparatus for determining a nonlinear response function for a loudspeaker
EP1584177B1 (en) * 2003-01-08 2007-11-07 Nxp B.V. Non-linear acoustic echo canceller
CN1756109A (zh) * 2004-09-28 2006-04-05 北京信威通信技术股份有限公司 一种抵消公共电话网电路回声的方法
CN1956480A (zh) * 2005-10-28 2007-05-02 上海贝岭股份有限公司 一种声学回声消除方法
CN101297354A (zh) * 2005-10-28 2008-10-29 索尼英国有限公司 音频处理
WO2009029605A1 (en) * 2007-08-31 2009-03-05 Motorola, Inc. Acoustic echo cancellation based on noise environment
CN101562669A (zh) * 2009-03-11 2009-10-21 屈国良 自适应全双工全频段回声消除的方法
US20120207325A1 (en) * 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation Multi-Channel Wind Noise Suppression System and Method
CN102655005A (zh) * 2011-03-01 2012-09-05 华为技术有限公司 一种语音增强处理方法和装置
CN103905656A (zh) * 2012-12-27 2014-07-02 联芯科技有限公司 残留回声的检测方法及装置
WO2014181330A1 (en) * 2013-05-06 2014-11-13 Waves Audio Ltd. A method and apparatus for suppression of unwanted audio signals
CN104506747A (zh) * 2015-01-21 2015-04-08 捷思锐科技(北京)有限公司 一种回声消除的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
O.HOSHUYAMA,A.SUGIYAMA: ""An Acoustic ECHO Suppressor Based on a Frequency-Domain Model of Highly Nonlinear Residual ECHO"", 《ACOUSTIC,SPEECH AND SIGNAL PROCESSING,2006》 *
幸斌: ""基于WebRTC的电话回声消除的研究与实现"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108831497A (zh) * 2018-05-22 2018-11-16 出门问问信息科技有限公司 一种回声压缩方法及装置、存储介质、电子设备
WO2019223603A1 (zh) * 2018-05-22 2019-11-28 出门问问信息科技有限公司 一种语音处理方法、装置及电子设备
CN109040498A (zh) * 2018-08-12 2018-12-18 瑞声科技(南京)有限公司 一种提升回声抵消效果的方法及其系统

Also Published As

Publication number Publication date
CN104835502B (zh) 2018-04-10

Similar Documents

Publication Publication Date Title
CN101040512B (zh) 回波抵消设备与方法
US10477031B2 (en) System and method for suppression of non-linear acoustic echoes
RU2391778C2 (ru) Способ улучшения качества речи и устройство для его осуществления
CN104685563A (zh) 用于嘈杂环境噪里的回放的音频信号整形
CN105096961A (zh) 语音分离方法和装置
CN104835502A (zh) 音频信号处理方法、装置及电子设备
CN104269178A (zh) 对语音信号进行自适应谱减和小波包消噪处理的方法和装置
KR101961998B1 (ko) 즉각적인 바람 잡음을 감소시키는 것
EP2689419B1 (en) Method and arrangement for damping dominant frequencies in an audio signal
CN112017679B (zh) 用于自适应滤波器系数更新的方法及装置、设备
CN106558314A (zh) 一种混音处理方法和装置及设备
CN103827967A (zh) 语音信号复原装置以及语音信号复原方法
CN101958122B (zh) 一种回声消除的方法和装置
CN104200811A (zh) 对语音信号进行自适应谱减消噪处理的方法和装置
CN104506747A (zh) 一种回声消除的方法及装置
CN102883244B (zh) 声震防护的装置及方法
EP2230664B1 (en) Method and apparatus for attenuating noise in an input signal
US20120243706A1 (en) Method and Arrangement for Processing of Audio Signals
CN104867498A (zh) 一种移动通讯终端及其语音增强方法和模块
CN108053834A (zh) 音频数据处理方法、装置、终端及系统
CN102984103B (zh) 扩频系统中的信号处理方法及装置
CN101458950B (zh) 一种消除模数转换器噪声对数字录音干扰的方法
CN113593599A (zh) 一种去除语音信号中噪声信号的方法
KR101936242B1 (ko) 잡음 제거 장치 및 방법, 기록 매체
Manikandan Speech enhancement based on wavelet denoising

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100080, Beijing, Haidian Haidian District Road, 21, Zhongguancun intellectual property building, block B, 6

Applicant after: BEIJING ZED-3 TECHNOLOGY CO., LTD.

Address before: 100080, Beijing, Haidian Haidian District Road, 21, Zhongguancun intellectual property building, block B, 6

Applicant before: Czech surway Technology (Beijing) Co. Ltd.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 1110-08, 10th floor, No.8, Haidian North 2nd Street, Haidian District, Beijing 100080

Patentee after: BEIJING JIESIRUI TECHNOLOGY Co.,Ltd.

Address before: 100080, Beijing, Haidian Haidian District Road, 21, Zhongguancun intellectual property building, block B, 6

Patentee before: BEIJING JIESIRUI TECHNOLOGY Co.,Ltd.