CN105575397B - 语音降噪方法及语音采集设备 - Google Patents
语音降噪方法及语音采集设备 Download PDFInfo
- Publication number
- CN105575397B CN105575397B CN201410525618.XA CN201410525618A CN105575397B CN 105575397 B CN105575397 B CN 105575397B CN 201410525618 A CN201410525618 A CN 201410525618A CN 105575397 B CN105575397 B CN 105575397B
- Authority
- CN
- China
- Prior art keywords
- noise
- signal
- time
- filter
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 230000009467 reduction Effects 0.000 title claims abstract description 65
- 238000001914 filtration Methods 0.000 claims abstract description 141
- 230000003044 adaptive effect Effects 0.000 claims abstract description 56
- 238000006243 chemical reaction Methods 0.000 claims abstract description 28
- 230000000694 effects Effects 0.000 claims abstract description 15
- 238000001228 spectrum Methods 0.000 claims description 97
- 230000004044 response Effects 0.000 claims description 59
- 239000011159 matrix material Substances 0.000 claims description 54
- 238000005070 sampling Methods 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 14
- 230000021615 conjugation Effects 0.000 claims description 12
- 230000017105 transposition Effects 0.000 claims description 12
- 230000003111 delayed effect Effects 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 238000009499 grossing Methods 0.000 claims description 4
- 230000011664 signaling Effects 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011295 pitch Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Landscapes
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Filters That Use Time-Delay Elements (AREA)
Abstract
本发明提供一种语音降噪方法及语音采集设备,其中,通过一滤波组件,对一滤波形成的消噪语音信号,以及一滤波形成的参考噪声信号进行频域转换并滤波,以滤波输出、对应所述参考噪声信号的原始噪声信号、以及对应所述消噪语音信号的含噪语音信号,分别控制形成所述参考噪声信号的第一抗串扰滤波单元,以及形成所述消噪语音信号的第二抗串扰滤波单元进行滤波系数更新。其技术方案的有益效果是:通过仅使用一对自适应滤波器,并通过后滤波器控制该一对自适应滤波器的滤波系数更新,从而简化了的结构;通过对语音信号和噪声信号的滤波系数更新权重分别进行有针对性的调整,实现优秀的抗串扰和降噪效果。
Description
技术领域
本发明涉及通讯领域,尤其涉及语音降噪方法及语音采集设备。
背景技术
随着通讯技术的革新,人们对于语音通讯的质量要求不断提高。其中,移动通讯终端的抗噪性能是语音通讯质量的重要关注点。在经历了单麦克风系统通过单通道语音增强方案降低噪声,提高语音质量的阶段以后,越来越多的移动通讯终端开始配置双麦克风(Dual Mic)系统。这种双麦克风系统通常采用主次麦克风的结构,它将一个主麦克风放置在手机下端,靠近嘴的位置,用于接收含噪语音信号,另一个次麦克风放置在手机上端的背部或顶部,靠近耳朵的位置,用于接收以噪声为主的参考噪声信号,如图1所示。
基于这种物理结构,自适应噪声消除(Adaptive Noise Cancellation,ANC)可以利用含噪语音信号和参考噪声信号这两个信号来进行分析和计算,得到干净的语音。但是,采用目前的技术方案在实际应用中起到的降噪效果并不是很理想,输出的语音还是有存在较大的失真。
因此,如何进一步提高通话质量一直为本领域技术人员所致力研究的方向。
发明内容
针对现有的自适应噪声消除技术中存在的上述问题,本发明旨在提供一种结构简单,并可有效实现有效的抗串扰以及提高语音质量的语音降噪方法及语音采集设备。
具体技术方案如下:
一种语音降噪方法,其中,
滤波组件,对一滤波形成的消噪语音信号以及一滤波形成的参考噪声信号进行频域转换并滤波,随后滤波输出对应所述参考噪声信号的原始噪声信号以及对应所述消噪语音信号的含噪语音信号,根据输出的所述原始噪声信号控制形成所述参考噪声信号的第一抗串扰滤波单元进行滤波系数更新,以及根据输出的所述含噪语音信号控制形成所述消噪语音信号的第二抗串扰滤波单元进行滤波系数更新;
所述滤波组件提供一后滤波器,所述后滤波器为具有M点冲激响应的频域维纳滤波器,通过下式计算所述频域维纳滤波器的解:
其中,G[k]t为t时刻的所述维纳滤波器的解,Psl[k]t为t时刻的所述消噪语音信号的自功率谱,Pn[k]t为t时刻的噪声的自功率谱;或者
所述滤波组件提供一后滤波器,所述后滤波器为具有M点冲激响应的频域维纳滤波器,通过下式计算所述频域维纳滤波器的解:
SNR[k]t=αG[k]t-1 2SNRP[k]t-1+(1-α)max(SNRP[k]t-1,0)
其中,G[k]t为t时刻的所述维纳滤波器的解,G[k]t-1为t-1时刻的所述维纳滤波器的解,SNR[k]t为t时刻的信噪比,SNRp[k]t为t时刻的先验信噪比,SNRp[k]t-1为t-1时刻的先验信噪比,Psl[k]t为t时刻的所述消噪语音信号的自功率谱,Pn[k]t为t时刻的噪声的自功率谱,0<α<1。
优选的,所述滤波组件采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对所述消噪语音信号进行频域转换得到第一幅度谱;和/或
所述滤波组件采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对所述参考噪声信号进行频域转换得到第二幅度谱。
优选的,采用离散傅立叶变换得到所述第一幅度谱的公式为:
其中,Ea1[k]t为t时刻的所述第一幅度谱,e1(t)为t时刻的所述参考噪声信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度;和/或
采用离散傅立叶变换得到所述第二幅度谱的公式为:
其中,Ea2[k]t为t时刻的第二幅度谱,e2(t)为t时刻的所述消噪语音信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度。
优选的,所述窗函数wana(n)为矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。
优选的,M的取值范围为fs/100/2<M<0.4fs,其中fs为采样频率。
优选的,Psl[k]t通过下式计算:
Ps1[k]t=|Ea1[k]t|2,
其中,Psl[k]t为t时刻的所述消噪语音信号的自功率谱;
Ea1[k]t为t时刻的所述消噪语音信号经频域转换后获得的第一幅度谱。
优选的,Pn[k]t通过下式进行估计:
其中,η1,η2,η3为平滑因子,0<η1,η2,η3<1;
Pn[k]t为t时刻的所述噪声的自功率谱;
Ps[k]t为t时刻的所述消噪语音信号的自功率谱,Ps[k]t-1为t-1时刻的所述消噪语音信号的自功率谱,或者
Ps[k]t为t时刻的所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值,Ps[k]t-1为t-1时刻的所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值。
优选的,Ps[k]t通过下式计算:
Ps[k]t=|Ea1[k]t|2;
其中,Ps[k]t为t时刻的所述消噪语音信号的自功率谱;
Ea1[k]t为t时刻的所述消噪语音信号经频域转换后获得的第一幅度谱。
优选的,Ps[k]t通过下式计算:
Ps[k]t=min(|Ea1[k]t|2,|Ea2[k]t|2);
其中,Ps[k]t为t时刻的所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值;
Ea1[k]t为t时刻的所述消噪语音信号经频域转换后获得的第一幅度谱;
Ea2[k]t为t时刻的所述参考噪音信号经频域转换后获得的第二幅度谱。
优选的,提供一语音激活检测单元,所述语音激活检测单元连接所述滤波组件;
所述语音激活检测单元根据所述含噪语音信号,或者所述含噪语音信号和所述原始噪声信号,判断是否采集到语音信号,并向所述滤波组件输出判断结果。
优选的,Ps通过下式计算:
其中,VAD为所述语音激活检测单元的输出值,true为采集到语音信号,false为未采集到语音信号;
Ea1[k]t为t时刻的所述消噪语音信号经频域转换后获得的第一幅度谱;
Ea2[k]t为t时刻的所述参考噪音信号经频域转换后获得的第二幅度谱;
β为控制因子,1<β<5。
优选的,所述滤波组件提供一第一自适应滤波器,及一第二自适应滤波器;
所述第一自适应滤波器根据所述频域维纳滤波器的解G[k]t和G[k]t-1、所述参考噪声信号以及所述含噪语音信号计算所述第一抗串扰滤波单元在t时刻的滤波系数更新项并通过所述滤波系数更新项更新所述第一抗串扰滤波单元在t+1时刻的滤波系数g1[k]t+1;
所述第二自适应滤波器根据所述频域维纳滤波器的解G[k]t和G[k]t-1、所述消噪语音信号以及所述噪声信号,计算所述第二抗串扰滤波单元在t时刻的滤波系数更新项并采用所述滤波系数更新项更新所述第二抗串扰滤波单元在t+1时刻的滤波系数g2[k]t+1。
优选的,所述第一抗串扰滤波单元通过下式更新t+1时刻的滤波系数g1[k]t+1:
和/或
所述第二抗串扰滤波单元通过下式更新t+1时刻的滤波系数g2[k]t+1:
其中,G1=Gλ;
λ为大于0的非线性控制因子;
μ为更新步长,且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
S1,t为所述含噪语音信号s1(t)的M点傅立叶变换;
E2,t为所述参考噪声信号e2(t)的M点傅立叶变换;
F-为反傅立叶变换矩阵;
E[|S1,t|2]为|S1,t|2在t时刻的短期数学期望。
优选的,S1,t通过下式计算:
S1,t=F[s1(t-M+1),s1(t-M+2),…,s1(t)]T,
其中,上标T为转置操作;和/或
E2,t通过下式计算:
E2,t=F{[0,0,…,0]1×N[e2(t-(M-N)+1),e2(t-(M-N)+2),…,e2(t)]}T,
其中,上标T为转置操作;和/或
E[|S1,t|2]通过自回归法进行获取,具体算式如下:
E[|S1,t|2]=γE[|S1,t-1|2]+(1-γ)|S1,t|2,0<γ<1。
其中,G2=1–Gλ或G2=(1–G)λ;
λ为大于0的非线性控制因子;
μ为更新步长,且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
S2,t为噪声信号s2(t)的M点傅立叶变换;
E1,t为消噪语音信号e1(t)的M点傅立叶变换;
F-为反傅立叶变换矩阵;
E[|S2,t|2]为|S2,t|2在t时刻的短期数学期望。
优选的,S2,t通过下式计算:
S2,t=F[s2(t-M+1),s2(t-M+2),…,s2(t)]T,
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E1,t通过下式计算:
E1,t=F{[0,0,…,0]1×N[e1(t-(M-N)+1),e1(t-(M-N)+2),…,e1(t)]}T,
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E[|S2,t|2]通过自回归法进行获取,具体算式如下:
E[|S2,t|2]=γE[|S2,t-1|2]+(1-γ)|S2,t|2,0<γ<1。
其中,G1=Gλ;
λ为大于0的非线性控制因子;
μ为更新步长且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
Sw1,t为含噪语音信号s1(t)的M点窗傅立叶变换;
Ew2,t为参考噪声信号e2(t)的M点窗傅立叶变换;
F-为反傅立叶变换矩阵;
E[|Sw1,t|2]为|Sw1,t|2在t时刻的短期数学期望。
优选的,Sw1,t通过下式计算:
Sw1,t=F[wadf(t-M+1)s1(t-M+1),wadf(t-M+2)s1(t-M+2),…,wadf(t)s1(t)]T,
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M,M为频域分析的时间窗长度;和/或
Ew2,t通过下式计算:
Ew2,t=F[wadf(t-M+1)e2(t-M+1),wadf(t-M+2)e2(t-M+2),…,wadf(t)e2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M,M为频域分析的时间窗长度;和/或
E[|Sw1,t|2]通过自回归法进行获取,具体算式如下:
E[|Sw1,t|2]=γE[|Sw1,t-1|2]+(1-γ)|Sw1,t|2,0<γ<1。
其中,G2=1–Gλ或G2=(1–G)λ;
λ为大于0的非线性控制因子;
μ为更新步长且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
Sw2,t为噪声信号s2(t)的M点窗傅立叶变换;
Ew1,t为消噪语音信号e1(t)的M点窗傅立叶变换;
F-为反傅立叶变换矩阵;
E[|Sw2,t|2]为|Sw2,t|2在t时刻的短期数学期望。
优选的,Sw2,t通过下式计算:
Sw2,t=F[wadf(t-M+1)s2(t-M+1),wadf(t-M+2)s2(t-M+2),…,wadf(t)s2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M,M为频域分析的时间窗长度;和/或
Ew1,t通过下式计算:
Ew1,t=F[wadf(t-M+1)e1(t-M+1),wadf(t-M+2)e1(t-M+2),…,wadf(t)e1(t)]T,
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
E[|Sw2,t|2]通过自回归法进行获取,具体算式如下:
E[|Sw2,t|2]=γE[|Sw2,t-1|2]+(1-γ)|Sw2,t|2,0<γ<1。
优选的,所述窗函数wadf为矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。
优选的,所述第一抗串扰滤波单元包括第一有限冲激响应滤波器,所述第一有限冲激响应滤波器通过下式对所述含噪语音信号进行滤波以获取第一滤波信号:
其中,k为自然序列,g1[k]t为t时刻的所述第一有限冲激响应滤波器的滤波系数,N为所述第一有限冲激响应滤波器的冲激响应长度,p1(t)为所述第一滤波信号,s1(t-k+1)为(t-k+1)时刻的所述含噪语音信号,t为采样时刻的序号,下标t表示变量所处的采样时刻;和/或
所述第二抗串扰滤波单元包括第二有限冲激响应滤波器,所述第二有限冲激响应滤波器通过下式对所述原始噪声信号进行滤波以获取所述第二滤波信号:
其中,k为自然序列,g2[k]t为t时刻的所述第二有限冲激响应滤波器的滤波系数,N为所述第二有限冲激响应滤波器的冲激响应长度,p2(t)为所述第二滤波信号,s2(t-k+1)为(t-k+1)时刻的所述原始噪声信号,t为采样时刻序号,下标t表示变量所处的采样时刻。
优选的,所述N的取值范围为fs/100/2<N<0.2fs,其中fs为采样频率;或者
当fs=8000Hz时N=256,其中fs为采样频率。
优选的,第二抗串扰滤波单元还包括一第一减法器,所述第一减法器用以将所述含噪语音信号减去所述第二滤波信号以获得所述消噪语音信号;和/或
第一抗串扰滤波单元还包括一第二减法器,所述第二减法器用以将所述原始噪声信号减去所述第一滤波信号以获得所述参考噪声信号。
优选的,第一抗串扰滤波单元还包括一第一延迟单元,所述第一延迟单元用以将所述含噪语音信号延迟后提供至所述第一减法器;和/或
第二抗串扰滤波单元还包括一第二延迟单元,所述第二延迟单元用以将所述原始噪声信号延迟后提供至所述第二减法器。
还包括一种语音采集设备,其中,采用如上述语音降噪方法。
上述技术方案的有益效果为:
1、通过仅使用一对自适应滤波器(ADF),通过后滤波器控制该一对自适应滤波器的滤波系数更新,从而简化了的结构。
2、通过对语音信号和噪声信号的滤波系数更新权重分别进行有针对性的调整,实现优秀的抗串扰和降噪效果。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明及其特征、外形和优点将会变得更明显。在全部附图中相同的标记指示相同的部分。并未刻意按照比例绘制附图,重点在于示出本发明的主旨。
图1为现有技术中在无串扰的理想情况的自适应噪声消除原理图;
图2为现有技术中在有串扰的实际情况的自适应噪声消除原理;
图3为现有技术中双自适应滤波器结构的抗串扰自适应噪声消除原理图;
图4为现有技术中多级自适应滤波器结构的抗串扰自适应噪声消除原理图;
图5为现有技术中语音激活检测控制的多级自适应滤波器结构的抗串扰自适应噪声消除原理图;
图6为本发明提供的一种语音降噪方法的实施例的原理示意图;
图7为本发明提供的一种语音降噪方法的滤波组件的一种实施例的结构示意图;
图8为本发明提供的一种语音降噪方法的一种实施例的结构示意图;
图9为本发明提供的一种语音降噪方法的实施例在单噪声源环境下降噪前后的语谱演示对比图;
图10为本发明提供的一种语音降噪方法的实施例在单噪声源环境下降噪前后的波形演示对比图;
图11为在本发明提供的一种语音降噪方法的实施例在扩散噪声场降噪前主麦克风和次麦克风的语谱演示图;
图12为在本发明提供的一种语音降噪方法的实施例在扩散噪声场降噪后主麦克风和次麦克风的语谱演示图;
图13为本发明提供的一种语音降噪方法的实施例在扩散噪声场主麦克风降噪前后的波形演示图;
图14为本发明提供的一种语音降噪方法的实施例在扩散噪声场次麦克风降噪前后的波形演示图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员而言显而易见的是,本发明可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述。
应当理解的是,本发明能够以不同形式实施,而不应当解释为局限于这里提出的实施例。相反地,提供这些实施例将使公开彻底和完全,并且将本发明的范围完全地传递给本领域技术人员。在附图中,为了清楚,层和区的尺寸以及相对尺寸可能被夸大。自始至终相同附图标记表示相同的元件。
在此使用的术语的目的仅在于描述具体实施例并且不作为本发明的限制。在此使用时,单数形式的“一”、“一个”和“所述/该”也意图包括复数形式,除非上下文清楚指出另外的方式。还应明白术语“组成”和/或“包括”,当在该说明书中使用时,确定所述特征、整数、步骤、操作、元件和/或部件的存在,但不排除一个或更多其它的特征、整数、步骤、操作、元件、部件和/或组的存在或添加。在此使用时,术语“和/或”包括相关所列项目的任何及所有组合。
需要指出的是,本发明技术方案中的实施方式和/或技术特征在不冲突于本发明主旨的前提下可相互组合。
为了彻底理解本发明,将在下列的描述中提出详细的步骤以及详细的结构,以便阐释本发明的技术方案。本发明的较佳实施例详细描述如下,然而除了这些详细描述外,本发明还可以具有其他实施方式。
本发明基于如下发现,在一个理想的无串扰的情况下,ANC技术的实现过程如图1所示,语音信号ss经过传输途径h1到达主麦克风1;噪声信号sn经过传输途径h2到达次麦克风2,与此同时噪声信号sn经过传输途径h4到达麦克风1。
那么主麦克风1收到了含噪语音信号s1,次麦克风2收到了噪音信号s2;
其中代表信号和传递函数的卷积或滤波。图1所示的ANC实现过程使用一个滤波系数为g1的自适应滤波器,它利用主麦克风1收到的含噪语音信号s1和次麦克风2收到的噪声信号s2进行滤波和更新,滤波过程以下式体现:
滤波信号sf1和主麦克风1收到的含噪语音信号s1相减得到误差信号se1,其获得过程以下式体现:
误差信号se1反馈给自适应滤波器进行滤波器系数更新。显然,当自适应滤波器收敛到时,就能够将主麦克风1收到的含噪语音信号s1中的噪声分量全部消除,达到了消噪的目的。
然而,理想的情况实际上并不会出现,在真实的使用环境中,如图2所示,总存在着一个串扰路径h3,使语音信号ss泄漏到次麦克风2。这个串扰将严重干扰自适应滤波器的更新。如果没有很好地解决串扰问题,ANC技术将不会带来有益效果,反而会损害语音质量。
为了能够解决串扰问题,很多改进的结构得到推出,它们一般称为抗串扰自适应噪声消除(Cross-talk Resistant ANC,CR-ANC)技术。
参照图3所示,图3中展示了现有技术中的一种对实时性要求很高的CR-ANC结构,它用一对自适应滤波器实现,并且要用互相的滤波误差作为滤波输入,对延迟要求很高,因此几乎难以实现。见文献[1]。
现有技术中还有一种级联的CR-ANC结构,如图4所示,在第一级自适应滤波器1输出得到相对有所降噪的语音之后,作为第二级自适应滤波器2的输入来估计次麦克风2采集到的信号中的串扰成分并将其削弱,第二级自适应滤波器2的输出中串扰成分得到降低以后,再用它作为噪声参考输入到第三级自适应滤波器3,并在最后一级得到降噪的语音输出。见文献[2]。
在现有技术的某些实施例中,通过在图4所示结构的基础上,通过增加一个语音激活检测模块用于控制3个自适应滤波器的开启和更新,如图5所示,它进一步提高了工作稳定性。见文献[3]。
尽管现有技术有多种CR-ANC的方案被提出,但是ANC的性能有限,因为语音串扰的传递途径是实时发生改变的,例如当说话人或者设备移动,其传递途径就会发生变化,若说话人更迭,则信号也会产生突变。上述CR-ANC方案在实际运作时,有时不能降低串扰,反而会引入更大的串扰,导致ANC的性能急剧下降。
因此,现有技术存在有诸多缺陷,从而导致降噪效果并不理想,而本发明是针对现有技术进行的改进,从而可实现改善语音质量的效果。
本发明的技术方案中提供一种语音降噪方法,如图6所示,其主旨是,
通过一滤波组件,对一滤波形成的消噪语音信号以及一滤波形成的参考噪声信号进行频域转换并滤波,随后滤波输出对应参考噪声信号的原始噪声信号以及对应消噪语音信号的含噪语音信号,根据输出的原始噪声信号控制形成参考噪声信号的第一抗串扰滤波单元进行滤波系数更新,以及根据输出的含噪语音信号控制形成消噪语音信号的第二抗串扰滤波单元进行滤波系数更新。
于一种较优的实施方式中,滤波组件提供一后滤波器,后滤波器为具有M点冲激响应的频域维纳滤波器,可通过下式计算频域维纳滤波器的解:
其中,G[k]t为维纳滤波器的解,Psl[k]t为消噪语音信号的自功率谱,Pn[k]t为噪声的自功率谱;或者
于可选的实施方式中,基于获取更优性能的考虑,M点冲激响应的频域维纳滤波器的解也可以通过下式进行计算:
SNR[k]t=αG[k]t-1 2SNRP[k]t-1+(1-α)max(SNRP[k]t-1,0)
其中,G[k]t为t时刻的所述维纳滤波器的解,G[k]t-1为t-1时刻的维纳滤波器的解,SNR[k]t为信噪比,SNRp[k]t为t时刻的先验信噪比,SNRp[k]t-1为t-1时刻的先验信噪比,Psl[k]t为消噪语音信号的自功率谱,Pn[k]t为噪声的自功率谱,0<α<1,优选的α=0.5。
上述技术方案的主要目的是,通过一滤波组件对一对实施语音降噪的抗串扰滤波单元进行滤波系数更新。其中,
第一抗串扰滤波单元g1对含噪语音信号进行滤波,以滤除由于串扰作用进入含噪语音信号的噪音成分,然后通过将滤除噪音成分的语音信号与原始噪声信号比较,以期获得一不含有语音成分的参考噪音信号输出。
第二抗串扰滤波单元g2对原始噪声信号进行滤波,以滤除由于串扰作用进入原始噪声信号的语音成分,然后通过将滤除语音成分的噪音信号与含噪语音信号比较,以期获得一不含有噪音成分的消噪语音信号输出。
需要说明的是,上述第一抗串扰滤波单元与第二抗串扰滤波单元的具体结构在本发明的技术方案中并不被具体的限定,本领域技术人员完全可以在不付出创造性劳动的前提下,以现有的手段,获得多种可实现上述第一抗串扰滤波单元与第二抗串扰滤波单元的结构,因此,不可以下文中为体现上述技术方案可行性而描述的具体实施例作为对本发明保护范围的限定。
滤波组件根据消噪语音信号,以及参考噪声信号形成滤波输出,使滤波组件的滤波输出实时的根据消噪语音信号,以及参考噪声信号产生变化,从而使第一抗串扰滤波单元g1与第二抗串扰滤波单元g2的滤波系数可根据消噪语音信号,以及参考噪声信号的变化进行更新,从而可实现有效的语音降噪,进而提高语音质量,同时由于通过一额外的滤波组件控制第一抗串扰滤波单元g1与第二抗串扰滤波单元g2的滤波系数进行更新,使系统的实时性要求降低,结构也得到了简化。
于一种较优的实施方式中,滤波组件可采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对消噪语音信号进行频域转换得到第一幅度谱;和/或
滤波组件可采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对参考噪声信号进行频域转换得到第二幅度谱。
由于离散余弦变换及改进余弦变换均为本领域公知的方法,因此不再展开叙述,以下以离散傅里叶变换来说明上述技术方案的可行性。
于可选的实施方式中,采用离散傅立叶变换得到第一幅度谱的公式为:
其中,Ea1[k]t为t时刻的第一幅度谱,e1(t)为参考噪声信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度。
于可选的实施方式中,采用离散傅立叶变换得到第二幅度谱的公式为:
其中,Ea2[k]t为t时刻的第二幅度谱,e2(t)为消噪语音信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度。
在进一步的实施方式中,窗函数wana(n)可采用矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。由于上述窗函数均为本领域技术人员公知的方法,因此不再展开叙述。
在进一步的实施方式中,由于M的大小对应着频域分析的时间窗长度,并决定频域的分辨率,基于频域分辨率大于100Hz,时间窗小于0.4秒的要求,因此,M的取值范围可以是fs/100/2<M<0.4fs,其中fs为采样频率。优选的,当fs=8000Hz时,可令M=512。
在进一步的实施方式中,消噪语音信号的自功率谱Psl[k]t通过下式计算:
Ps1[k]t=|Ea1[k]t|2,
其中,Psl[k]t为t时刻的消噪语音信号的自功率谱;
Ea1[k]t为t时刻的消噪语音信号经频域转换后获得的第一幅度谱。
噪声的自功率谱Pn[k]t需要通过估计获得,其估计方法有跟踪信号频谱短时最小值,时间递归平均等方法,在进一步的实施方式中,可采用G.Doblinger噪声估计法(见文献[4])实现噪声自功率谱Pn[k]t的估计,G.Doblinger噪声估计法为频谱短时最小值和时间递归平均方法的一种结合,具体的估计方法见下式:
其中,η1,η2,η3为平滑因子,0<η1,η2,η3<1;优选的,平滑因子η1=0.99,η2=0.99,η3=0.8;
Pn[k]t为t时刻的所述噪声的自功率谱;
Ps[k]t为t时刻的消噪语音信号的自功率谱,Ps[k]t-1为t-1时刻的所述消噪语音信号的自功率谱,或者
Ps[k]t为t时刻的消噪语音信号的自功率谱与参考噪声信号的自功率谱两者之间的较小值,Ps[k]t-1为t-1时刻的所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值。
基于上述实施方式,当Ps[k]t为消噪语音信号的自功率谱时,Ps[k]t可通过下式计算:
Ps[k]t=|Ea1[k]t|2;
其中,Ea1[k]t为t时刻的消噪语音信号经频域转换后获得的第一幅度谱。
在可选的实施方式中,当Ps[k]t为消噪语音信号的自功率谱与参考噪声信号的自功率谱两者之间的较小值时,Ps[k]t可通过下式计算:
Ps[k]t=min(|Ea1[k]t|2,|Ea2[k]t|2);
其中,
Ea1[k]t为t时刻的消噪语音信号经频域转换后获得的第一幅度谱;
Ea2[k]t为t时刻的参考噪音信号经频域转换后获得的第二幅度谱。
基于上述技术方案,在一种可选的实施方式中,可提供一语音激活检测单元(未于图中示出),语音激活检测单元连接滤波组件;
语音激活检测单元根据含噪语音信号,或者含噪语音信号和原始噪声信号,判断是否采集到语音信号,并向滤波组件输出判断结果。
进一步的,基于语音激活检测单元的输出结果,Ps可通过下式计算:
其中,VAD为语音激活检测单元的输出值,true为采集到语音信号,false为未采集到语音信号;
Ea1[k]t为t时刻的消噪语音信号经频域转换后获得的第一幅度谱;
Ea2[k]t为t时刻的参考噪音信号经频域转换后获得的第二幅度谱;
β为控制因子,1<β<5,优选的,β=2。
第一自适应滤波器根据频域维纳滤波器的解G[k]t和G[k]t+1、参考噪声信号以及含噪语音信号计算第一抗串扰滤波单元的滤波系数更新项并通过滤波系数更新项更新第一抗串扰滤波单元的滤波系数g1[k]t+1;
第二自适应滤波器根据频域维纳滤波器的解G[k]t和G[k]t+1、消噪语音信号以及噪声信号,计算第二抗串扰滤波单元的滤波系数更新项并采用滤波系数更新项更新第二抗串扰滤波单元的滤波系数g2[k]t+1。
于一种优选的实施方式中,第一抗串扰滤波单元通过下式更新滤波系数g1[k]t+1:
和/或
于进一步的实施方式中第二抗串扰滤波单元通过下式更新滤波系数g2[k]t+1:
滤波系数更新项和须由自适应滤波器计算得到。由于语音能量大的频段对应着后滤波器G的值较大的频段,第一抗串扰滤波单元g1及第二抗串扰滤波单元g2可以通过后滤波器G来控制更新权重,使第一抗串扰滤波单元g1的滤波系数更新项提高语音能量大的频段的更新权重,从而使第一抗串扰滤波单元g1可有效的滤除含噪语音信号中的噪音成分;同时使第二抗串扰滤波单元g2的滤波系数更新项降低语音能量大的频段的更新权重,从而使第二抗串扰滤波单元g2可有效的滤除原始噪声信号中的语音成分。
滤波系数更新项的算法包括最小均方算法(LMS)、归一化最小均方算法(NLMS)、最小二乘算法(RLS)、仿射投影算法(AP)见文献[5]、快速仿射投影算法(FAP)见文献[6]、块最小均方算法(BLMS)见文献[7-8]、频域最小均方算法(FDAF)见文献[9]、加窗频域最小均方算法(WDAF)见文献[10]等多种,由于上述更新算法均为本领域公知的方法,因此不再赘述。基于频域维纳滤波器控制便利的考虑,可选择频域算法作为滤波系数更新项的算法,当然也不排除在增加控制元素的基础上采用其他类型算法作为滤波系数更新项的算法。
其中,G1=Gλ;
λ为大于0的非线性控制因子,优选的,λ=1;
μ为更新步长,且0<μ<2,μ取值过大则稳定性较差,μ取值过小则更新太慢,优选的,μ=0.5;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
S1,t为含噪语音信号s1(t)的M点傅立叶变换;
E2,t为参考噪声信号e2(t)的M点傅立叶变换;
F-为反傅立叶变换矩阵;
E[|S1,t|2]为|S1,t|2在t时刻的短期数学期望。
于上述技术方案基础上,进一步的,S1,t通过下式计算:
S1,t=F[s1(t-M+1),s1(t-M+2),…,s1(t)]T,
其中,上标T为转置操作;和/或
E2,t通过下式计算:
E2,t=F{[0,0,…,0]1×N[e2(t-(M-N)+1),e2(t-(M-N)+2),…,e2(t)]}T,
其中,上标T为转置操作;和/或
E[|S1,t|2]通过自回归法进行获取,具体算式如下:
E[|S1,t|2]=γE[|S1,t-1|2]+(1-γ)|S1,t|2,0<γ<1。
其中,G2=1–Gλ或G2=(1–G)λ;
λ为大于0的非线性控制因子,优选的,λ=1;
μ为更新步长,且0<μ<2,μ取值过大则稳定性较差,μ取值过小则更新太慢,优选的,μ=0.5;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
S2,t为噪声信号s2(t)的M点傅立叶变换;
E1,t为消噪语音信号e1(t)的M点傅立叶变换;
F-为反傅立叶变换矩阵;
E[|S2,t|2]为|S2,t|2在t时刻的短期数学期望。
于上述技术方案基础上,进一步的,S2,t通过下式计算:
S2,t=F[s2(t-M+1),s2(t-M+2),…,s2(t)]T,
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E1,t通过下式计算:
E1,t=F{[0,0,…,0]1×N[e1(t-(M-N)+1),e1(t-(M-N)+2),…,e1(t)]}T,
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E[|S2,t|2]通过自回归法进行获取,具体算式如下:
E[|S2,t|2]=γE[|S2,t-1|2]+(1-γ)|S2,t|2,0<γ<1。
于一种可选的实施方式中,第一自适应滤波器通过加窗频域最小均方算法计算第一抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G1=Gλ;
λ为大于0的非线性控制因子,优选的,λ=1;
μ为更新步长且0<μ<2,μ取值过大则稳定性较差,μ取值过小则更新太慢,优选的,μ=0.5;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
Sw1,t为含噪语音信号s1(t)的M点窗傅立叶变换;
Ew2,t为参考噪声信号e2(t)的M点窗傅立叶变换;
F-为反傅立叶变换矩阵;
E[|Sw1,t|2]为|Sw1,t|2在t时刻的短期数学期望。
于上述技术方案基础上,进一步的,Sw1,t通过下式计算:
Sw1,t=F[wadf(t-M+1)s1(t-M+1),wadf(t-M+2)s1(t-M+2),…,wadf(t)s1(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
Ew2,t通过下式计算:
Ew2,t=F[wadf(t-M+1)e2(t-M+1),wadf(t-M+2)e2(t-M+2),…,wadf(t)e2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
E[|Sw1,t|2]通过自回归法进行获取,具体算式如下:
E[|Sw1,t|2]=γE[|Sw1,t-1|2]+(1-γ)|Sw1,t|2,0<γ<1。
其中,G2=1–Gλ或G2=(1–G)λ;
λ为大于0的非线性控制因子,优选的,λ=1;
μ为更新步长且0<μ<2,μ取值过大则稳定性较差,μ取值过小则更新太慢,优选的,μ=0.5;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
Sw2,t为噪声信号s2(t)的M点窗傅立叶变换;
Ew1,t为消噪语音信号e1(t)的M点窗傅立叶变换;
F-为反傅立叶变换矩阵;
E[|Sw2,t|2]为|Sw2,t|2在t时刻的短期数学期望。
于上述技术方案基础上,进一步的,Sw2,t通过下式计算:
Sw2,t=F[wadf(t-M+1)s2(t-M+1),wadf(t-M+2)s2(t-M+2),…,wadf(t)s2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
Ew1,t通过下式计算:
Ew1,t=F[wadf(t-M+1)e1(t-M+1),wadf(t-M+2)e1(t-M+2),…,wadf(t)e1(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
E[|Sw2,t|2]通过自回归法进行获取,具体算式如下:
E[|Sw2,t|2]=γE[|Sw2,t-1|2]+(1-γ)|Sw2,t|2,0<γ<1。
于一种优选的实施方式中,上述窗函数wadf为矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。由于上述列举的窗函数均为本领域技术人员公知的方法,因此不再展开叙述。
为表明本发明技术方案的可行性,现基于图8中所示结构对本发明的实现进行说明,需指出的是,如上文中所述,图8中所示结构仅仅是本发明的一种实施例,并不能以此限定本发明的保护范围。
于一种较优的实施方式中,上述的含噪语音信号可通过一第一换能器获得,上述原始噪声信号可通过以第二换能器获得。于优选的实施方式中,上述第一换能器可通过一主麦克风m1实现,上述第二换能器可通过一次麦克风m2实现。
于一种较优的实施方式中,第一抗串扰滤波单元可包括第一有限冲激响应滤波器FIR1,第一有限冲激响应滤波器FIR1通过下式对含噪语音信号进行滤波以获取第一滤波信号:
其中,k为自然序列,g1[k]t为t时刻的第一有限冲激响应滤波器FIR1的滤波系数,N为第一有限冲激响应滤波器FIR1的冲激响应长度,p1(t)为第一滤波信号,s1(t-k+1)为(t-k+1)时刻的含噪语音信号,t为采样时刻的序号,下标t表示变量所处的采样时刻。第一抗串扰滤波单元可通过第一有限冲激响应滤波器实现滤除含噪语音信号中的噪音成分。滤波组件中的第一自适应滤波器通过计算滤波系数更新项对第一有限冲激响应滤波器FIR1的滤波系数g1,t进行更行。
在此实施方式基础上,选择对参考噪声信号进行频域变换的窗函数时,须使频域分析的时间窗长度M大于第一有限冲激响应滤波器FIR1的冲激响应长度N。
在此基础上,进一步的,第二抗串扰滤波单元可包括第二有限冲激响应滤波器FIR2,第二有限冲激响应滤波器FIR2通过下式对原始噪声信号进行滤波以获取第二滤波信号:
其中,k为自然序列,g2[k]t为t时刻的第二有限冲激响应滤波器FIR2的滤波系数,N为第二有限冲激响应滤波器FIR2的冲激响应长度,p2(t)为第二滤波信号,s2(t-k+1)为(t-k+1)时刻的原始噪声信号,t为采样时刻序号,下标t表示变量所处的采样时刻。第二抗串扰滤波单元可通过第二有限冲激响应滤波器FIR2实现滤除原始噪声信号中的语音成分。滤波组件中的第二自适应滤波器通过计算滤波系数更新项对第二有限冲激响应滤波器FIR2的滤波系数g2,t进行更行。
在此实施方式基础上,选择对消噪语音信号进行频域变换的窗函数时,须使频域分析的时间窗长度M大于第二有限冲激响应滤波器FIR2的冲激响应长度N。
于进一步的实施方式中,N的取值范围为fs/100/2<N<0.2fs,其中fs为采样频率;或者当fs=8000Hz时N=256,其中fs为采样频率。
于一种优选的实施方式中,第二抗串扰滤波单元还可包括一第一减法器sub1,第一减法器sub1用以将含噪语音信号减去第二滤波信号以获得消噪语音信号。
于进一步的实施方式中,第一抗串扰滤波单元还可包括一第二减法器sub2,第二减法器sub2用以将原始噪声信号减去第一滤波信号以获得参考噪声信号。
于一种优选的实施方式中,第一抗串扰滤波单元还可包括一第一延迟单元z1,第一延迟单元z1用以将含噪语音信号s1(t)延迟后提供至第一减法器sub1,第一延迟单元z1可通过下式进行延迟计算:
z1(t)=s1(t-tz1),
其中,z1(t)为含噪语音信号s1(t)经延迟后形成的第一延迟信号,tz1为第一延迟单元z1的延迟采样数。
于进一步的实施方式中,第二抗串扰滤波单元还可包括一第二延迟单元z2,第二延迟单元z2用以将原始噪声信号s2(t)延迟后提供至第二减法器sub2,第二延迟单元z2可通过下式进行延迟计算:
z2(t)=s2(t-tz2)
其中,z2(t)为原始噪声信号s2(t)经延迟后形成的第二延迟信号,tz2为第二延迟单元z2的延迟采样数。
上述的tz1与tz2和主麦克风m1及次麦克风m2之间的物理距离Ldistence有关,在较优的实施方式中,tz1的取值范围为fsLdistence/csound<tz1<10fsLdistence/csound,和/或tz2的取值范围为fsLdistence/csound<tz2<10fsLdistence/csound,其中csound是声传播速度,fs是采样频率。在进一步的实施方式中,以空气中声速340米/秒,语音采集设备长度0.15米,采样频率8000Hz为例,tz1、tz2的取值范围为,3.52<tz1=tz2<35.2。优选的,tz1=tz2=8。
基于上述具有第一延迟单元z1和第二延迟单元z1的技术方案,一种更进一步的实施方式中,第一减法器sub1可通过下式计算消噪语音信号:
e1(t)=z1(t)-p2(t),
其中,e1(t)为消噪语音信号,z1(t)为含噪语音信号s1(t)经延迟后形成的第一延迟信号,p2(t)为原始噪声信号s2(t)经滤波后形成的第二滤波信号。
于进一步的实施方式中,第二减法器sub2可通过下式计算参考噪声信号:
e2(t)=z2(t)-p1(t),
其中,e2(t)为参考噪声信号,z2(t)为原始噪声信号s2(t)经延迟后形成的第二延迟信号,p1(t)为含噪语音信号s1(t)经滤波后形成的第一滤波信号。
基于上述技术方案,进一步的,后滤波器G将消噪语音信号e1(t)和参考噪声信号e2(t)经频域转换并滤波形成滤波输出。第一自适应滤波器在后滤波器G的输出的控制下,根据参考噪声信号e2(t)和含噪语音信号s1(t)计算第一有限冲激响应滤波器FIR1的更新项第一有限冲激响应滤波器FIR1通过更新项更新滤波系数g1,t。第二自适应滤波器在后滤波器G的输出的控制下,根据消噪语音信号e1(t)和原始噪声信号s2(t)计算第二有限冲激响应滤波器FIR2的更新项第二有限冲激响应滤波器FIR2通过更新项更新滤波系数g2,t。
通过变化的消噪语音信号e1(t)及参考噪声信号e2(t),使后滤波器G的输出根据实际情况实时的改变,进而控制第一自适应滤波器及第二自适应滤波器根据实际情况的并且有针对性的形成更新权重不同的更新项及更新项以更新第一有限冲激响应滤波器FIR1,及第二有限冲激响应滤波器FIR2。
上述实施方仅仅用以表明本发明技术方案的可行性,不应当以此限制本发明的保护范围。
本发明的技术方案中,还包括一种语音采集设备,其中,采用如上述语音降噪方法。
以下通过两种典型情况来展现本发明的有益效果。情况1是噪声源为单点声源的情况,理论上在没有串扰的时候ANC可以将噪声消除干净。情况2是扩散噪声场情况,噪声是从各个方向过来的。因为串扰的存在,两种情况语音都有很强的泄漏,次麦克风中语音能量很强,这样情况1很难将主麦克风信号中的噪声消除到理想状况,情况2则很难将主麦克风信号中的噪声消除,而次麦克风则很难消除其中的语音串扰。
通过对本发明技术方案的实施,如图9的单噪声源降噪效果的语谱演示(上方为降噪前,下方为降噪后)所示,上方语谱中有大量噪声,而下方语谱已经很清晰,噪声谱变淡;如图10的单噪声源降噪效果的波形演示(上方为降噪前,下方为降噪后)所示,音节间的噪声已经被大幅度的消除。
通过对本发明技术方案的实施,如图11的扩散噪声场降噪前语谱演示(上方为主麦克风信号,下方为次麦克风信号)所示,一个随时间逐渐增大后逐渐减小的噪音几乎将主麦克风信号中的语音谱完全淹没,而次麦克风信号中的串扰语音清晰可见。如图12扩散噪声场降噪后的语谱演示(上方为主麦克风信号,下方为次麦克风信号)所示,噪声最大处,原来被淹没的主麦克风信号中的语音谱已清晰可见,而次麦克风信号中的串扰语音谱已接近完全抹去。如图13扩散噪声场主麦克风降噪前后的波形演示(黑色为降噪前,灰色为降噪后)可见,灰色的处理后信号波形,在噪声段已明显减小;如图14扩散噪声场次麦克风降噪前后的波形演示(黑色为降噪前,灰色为降噪后)可见,灰色的处理后信号波形,在语音段接近完全消除。这样处理后的双麦克风信号,很容易进行语音增强处理,进一步提高其语音质量。
综上所述,由于本发明采用了如上技术方案,提供了一种新的抗串扰自适应噪声消除(CR-ANC)结构,通过仅使用一对自适应滤波器(ADF),并采用后滤波器控制该一对自适应滤波器的滤波系数更新,从而简化了结构,通过对语音信号和噪声信号的滤波系数权重分别进行有针对性的调整,实现优秀的抗串扰和降噪效果。
以上对本发明的较佳实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,其中未尽详细描述的设备和结构应该理解为用本领域中的普通方式予以实施;任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案作出许多可能的变动和修饰,或修改为等同变化的等效实施例,这并不影响本发明的实质内容。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
引用文献:
[1]M.J.Al-Kindi and J.Dunlop,"A low distortion adaptive noisecancellation structure for real time applications"Proc.ICASSP'87,pp.2153-2156,1987;
[2]H.Kubota,T.Furukawa,and H.Itakura,"Pre-processed noise cancellerdesign and its performance,"IEICE Trans.vol.J69-A,no.5,pp.584-591,May 1986;
[3]R.L.Bouquin,G.Faucon.Study of a Voice Activity Detector and itsInfluence on a Noise Reduction System.Speech Communication,Vol.16,pp.245-254,1995;
[4]Gerhard Doblinger,“Computaionally efficient speech enhancement byspectral minima tracking in subbands,”Proc.EUROSPEECH’95,Madrid,pp.1513-1516;
[5]S.S.Haykin,Adaptive filter theory,4th ed.,Upper Saddle River,N.J.:Prentice Hall,2002;
[6]S.L.Gay,and S.Tavathia,“The fast affine projection algorithm,”inAcoustics,Speech,and Signal Processing,1995.ICASSP-95.,1995InternationalConference on,1995,pp.3023-3026;
[7]E.Ferrara,“Fast implementations of LMS adaptive filters,”Acoustics,Speech and Signal Processing,IEEE Transactions on,vol.28,no.4,pp.474-475,1980;
[8]G.Clark,S.Mitra,and S.Parker,“Block implementation of adaptivedigital filters,”Acoustics,Speech and Signal Processing,IEEE Transactions on,vol.29,no.3,pp.744-752,1981;
[9]J.J.Shynk,“Frequency-domain and multirate adaptive filtering,”IEEESignal Processing Magazine,vol.9,no.1,pp.14-37,Jan,1992;
[10]Wu Sheng,Qiu Xiaojun,“A Windowing Frequency Domain AdaptiveFilter for Acoustic Echo Cancellation”,IEICE Transactions on Fundamentals ofElectronics,Communications and Computer Sciences,Volume E92.A,Issue 10,pp.2626-2628(2009)。
Claims (27)
1.一种语音降噪方法,其特征在于,
通过一滤波组件,对一滤波形成的消噪语音信号以及一滤波形成的参考噪声信号进行频域转换并滤波,随后滤波输出对应所述参考噪声信号的原始噪声信号以及对应所述消噪语音信号的含噪语音信号,根据输出的所述原始噪声信号控制形成所述参考噪声信号的第一抗串扰滤波单元进行滤波系数更新,以及根据输出的所述含噪语音信号控制形成所述消噪语音信号的第二抗串扰滤波单元进行滤波系数更新;
所述滤波组件提供一后滤波器,所述后滤波器为具有M点冲激响应的频域维纳滤波器,通过下式计算所述频域维纳滤波器的解:
其中,G[k]t为t时刻的所述维纳滤波器的解,Psl[k]t为t时刻的所述消噪语音信号的自功率谱,Pn[k]t为t时刻的噪声的自功率谱;或者
所述滤波组件提供一后滤波器,所述后滤波器为具有M点冲激响应的频域维纳滤波器,通过下式计算所述频域维纳滤波器的解:
SNR[k]t=αG[k]t-1 2SNRP[k]t-1+(1-α)max(SNRP[k]t-1,0)
其中,G[k]t为t时刻的所述维纳滤波器的解,G[k]t-1为t-1时刻的所述维纳滤波器的解,SNR[k]t为t时刻的信噪比,SNRp[k]t为t时刻的先验信噪比,SNRp[k]t-1为t-1时刻的先验信噪比,Psl[k]t为t时刻的所述消噪语音信号的自功率谱,Pn[k]t为t时刻的噪声的自功率谱,0<α<1。
2.如权利要求1所述语音降噪方法,其特征在于,所述滤波组件采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对所述消噪语音信号进行频域转换得到第一幅度谱;和/或
所述滤波组件采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对所述参考噪声信号进行频域转换得到第二幅度谱。
3.如权利要求2所述语音降噪方法,其特征在于,采用离散傅立叶变换得到所述第一幅度谱的公式为:
其中,Ea1[k]t为t时刻的所述第一幅度谱,e1(t)为t时刻的所述消噪语音信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度;和/或
采用离散傅立叶变换得到所述第二幅度谱的公式为:
其中,Ea2[k]t为t时刻的所述第二幅度谱,e2(t)为t时刻的所述参考噪声信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度。
4.如权利要求3所述语音降噪方法,其特征在于,所述窗函数wana(n)为矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。
5.如权利要求3所述语音降噪方法,其特征在于,M的取值范围为fs/100/2<M<0.4fs,其中fs为采样频率。
6.如权利要求1所述语音降噪方法,其特征在于,Psl[k]t通过下式计算:
Ps1[k]t=|Ea1[k]t|2,
其中,Psl[k]t为t时刻的所述消噪语音信号的自功率谱;
Ea1[k]t为t时刻的所述消噪语音信号经频域转换后获得的第一幅度谱。
7.如权利要求1所述语音降噪方法,其特征在于,Pn[k]t通过下式进行估计:
其中,η1,η2,η3为平滑因子,0<η1,η2,η3<1;
Pn[k]t为t时刻的所述噪声的自功率谱;
Ps[k]t为t时刻的所述消噪语音信号的自功率谱,Ps[k]t-1为t-1时刻的所述消噪语音信号的自功率谱,或者
Ps[k]t为t时刻的所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值,Ps[k]t-1为t-1时刻的所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值。
8.如权利要求7所述语音降噪方法,其特征在于,Ps[k]t通过下式计算:
Ps[k]t=|Ea1[k]t|2;
其中,Ps[k]t为t时刻的所述消噪语音信号的自功率谱;
Ea1[k]t为t时刻的所述消噪语音信号经频域转换后获得的第一幅度谱。
9.如权利要求7所述语音降噪方法,其特征在于,Ps[k]t通过下式计算:
Ps[k]t=min(|Ea1[k]t|2,|Ea2[k]t|2);
其中,Ps[k]t为t时刻的所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值;
Ea1[k]t为t时刻的所述消噪语音信号经频域转换后获得的第一幅度谱;
Ea2[k]t为t时刻的所述参考噪音信号经频域转换后获得的第二幅度谱。
10.如权利要求7所述语音降噪方法,其特征在于,提供一语音激活检测单元,所述语音激活检测单元连接所述滤波组件;
所述语音激活检测单元根据所述含噪语音信号,或者所述含噪语音信号和所述原始噪声信号,判断是否采集到语音信号,并向所述滤波组件输出判断结果。
12.如权利要求1所述语音降噪方法,其特征在于,所述滤波组件提供一第一自适应滤波器,及一第二自适应滤波器;
所述第一自适应滤波器根据所述频域维纳滤波器的解G[k]t和G[k]t+1、所述参考噪声信号以及所述含噪语音信号计算所述第一抗串扰滤波单元在t时刻的滤波系数更新项并通过t时刻的所述滤波系数更新项更新所述第一抗串扰滤波单元在t+1时刻的滤波系数g1[k]t+1;
15.如权利要求14所述语音降噪方法,其特征在于,S1,t通过下式计算:
S1,t=F[s1(t-M+1),s1(t-M+2),…,s1(t)]T,
其中,上标T为转置操作;和/或
E2,t通过下式计算:
E2,t=F{[0,0,…,0]1×N[e2(t-(M-N)+1),e2(t-(M-N)+2),…,e2(t)]}T,
其中,上标T为转置操作;和/或
E[|S1,t|2]通过自回归法进行获取,具体算式如下:
E[|S1,t|2]=γE[|S1,t-1|2]+(1-γ)|S1,t|2,0<γ<1。
17.如权利要求16所述语音降噪方法,其特征在于,S2,t通过下式计算:
S2,t=F[s2(t-M+1),s2(t-M+2),…,s2(t)]T,
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E1,t通过下式计算:
E1,t=F{[0,0,…,0]1×N[e1(t-(M-N)+1),e1(t-(M-N)+2),…,e1(t)]}T,
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E[|S2,t|2]通过自回归法进行获取,具体算式如下:
E[|S2,t|2]=γE[|S2,t-1|2]+(1-γ)|S2,t|2,0<γ<1。
19.如权利要求18所述语音降噪方法,其特征在于,Sw1,t通过下式计算:
Sw1,t=F[wadf(t-M+1)s1(t-M+1),wadf(t-M+2)s1(t-M+2),…,wadf(t)s1(t)]T,
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M,M为频域分析的时间窗长度;和/或
Ew2,t通过下式计算:
Ew2,t=F[wadf(t-M+1)e2(t-M+1),wadf(t-M+2)e2(t-M+2),…,wadf(t)e2(t)]T,
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M,M为频域分析的时间窗长度;和/或
E[|Sw1,t|2]通过自回归法进行获取,具体算式如下:
E[|Sw1,t|2]=γE[|Sw1,t-1|2]+(1-γ)|Sw1,t|2,0<γ<1。
其中,G2=1–Gλ或G2=(1–G)λ;
λ为大于0的非线性控制因子;
μ为更新步长且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
Sw2,t为噪声信号s2(t)的M点窗傅立叶变换;
Ew1,t为消噪语音信号e1(t)的M点窗傅立叶变换;
F-为反傅立叶变换矩阵;
E[|Sw2,t|2]为|Sw2,t|2在t时刻的短期数学期望。
21.如权利要求20所述语音降噪方法,其特征在于,Sw2,t通过下式计算:
Sw2,t=F[wadf(t-M+1)s2(t-M+1),wadf(t-M+2)s2(t-M+2),…,wadf(t)s2(t)]T,
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M,M为频域分析的时间窗长度;和/或
Ew1,t通过下式计算:
Ew1,t=F[wadf(t-M+1)e1(t-M+1),wadf(t-M+2)e1(t-M+2),…,wadf(t)e1(t)]T,
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
E[|Sw2,t|2]通过自回归法进行获取,具体算式如下:
E[|Sw2,t|2]=γE[|Sw2,t-1|2]+(1-γ)|Sw2,t|2,0<γ<1。
22.如权利要求19或21所述语音降噪方法,其特征在于,所述窗函数wadf为矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。
23.如权利要求1所述语音降噪方法,其特征在于,所述第一抗串扰滤波单元包括第一有限冲激响应滤波器,所述第一有限冲激响应滤波器通过下式对所述含噪语音信号进行滤波以获取第一滤波信号:
其中,k为自然序列,g1[k]t为t时刻的所述第一有限冲激响应滤波器的滤波系数,N为所述第一有限冲激响应滤波器的冲激响应长度,p1(t)为所述第一滤波信号,s1(t-k+1)为(t-k+1)时刻的所述含噪语音信号,t为采样时刻的序号,下标t表示变量所处的采样时刻;和/或
所述第二抗串扰滤波单元包括第二有限冲激响应滤波器,所述第二有限冲激响应滤波器通过下式对所述原始噪声信号进行滤波以获取第二滤波信号:
其中,k为自然序列,g2[k]t为t时刻的所述第二有限冲激响应滤波器的滤波系数,N为所述第二有限冲激响应滤波器的冲激响应长度,p2(t)为所述第二滤波信号,s2(t-k+1)为(t-k+1)时刻的所述原始噪声信号,t为采样时刻序号,下标t表示变量所处的采样时刻。
24.如权利要求23所述语音降噪方法,其特征在于,所述N的取值范围为fs/100/2<N<0.2fs,其中fs为采样频率;或者
当fs=8000Hz时N=256,其中fs为采样频率。
25.如权利要求23所述语音降噪方法,其特征在于,所述第二抗串扰滤波单元还包括一第一减法器,所述第一减法器用以将所述含噪语音信号减去所述第二滤波信号以获得所述消噪语音信号;和/或
所述第一抗串扰滤波单元还包括一第二减法器,所述第二减法器用以将所述原始噪声信号减去所述第一滤波信号以获得所述参考噪声信号。
26.如权利要求23所述语音降噪方法,其特征在于,所述第一抗串扰滤波单元还包括一第一延迟单元,所述第一延迟单元用以将所述含噪语音信号延迟后提供至第一减法器;和/或
所述第二抗串扰滤波单元还包括一第二延迟单元,所述第二延迟单元用以将所述原始噪声信号延迟后提供至第二减法器。
27.一种语音采集设备,其特征在于,采用如权利要求1-26中任一所述语音降噪方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410525618.XA CN105575397B (zh) | 2014-10-08 | 2014-10-08 | 语音降噪方法及语音采集设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410525618.XA CN105575397B (zh) | 2014-10-08 | 2014-10-08 | 语音降噪方法及语音采集设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105575397A CN105575397A (zh) | 2016-05-11 |
CN105575397B true CN105575397B (zh) | 2020-02-21 |
Family
ID=55885450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410525618.XA Active CN105575397B (zh) | 2014-10-08 | 2014-10-08 | 语音降噪方法及语音采集设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105575397B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107424623B (zh) * | 2016-05-24 | 2020-04-07 | 展讯通信(上海)有限公司 | 语音信号处理方法及装置 |
CN105957534B (zh) * | 2016-06-28 | 2019-05-03 | 百度在线网络技术(北京)有限公司 | 自适应滤波方法和自适应滤波器 |
CN106340303B (zh) * | 2016-09-20 | 2019-07-16 | 南京朗逸锐科电子科技有限公司 | 一种基于时间频率域的语音降噪方法 |
CN107180640B (zh) * | 2017-04-13 | 2020-06-12 | 广东工业大学 | 一种相位相关的高密度叠窗频谱计算方法 |
CN107301869B (zh) * | 2017-08-17 | 2021-01-29 | 珠海全志科技股份有限公司 | 麦克风阵列拾音方法、处理器及其存储介质 |
CN108446091B (zh) * | 2018-02-26 | 2021-03-23 | 浙江创课教育科技有限公司 | 基于噪音检测的语音播放系统 |
CN108806715B (zh) * | 2018-04-12 | 2021-02-23 | 会听声学科技(北京)有限公司 | 降噪性能评价方法及系统 |
FR3086451B1 (fr) * | 2018-09-20 | 2021-04-30 | Sagemcom Broadband Sas | Filtrage d'un signal sonore acquis par un systeme de reconnaissance vocale |
CN109285556B (zh) * | 2018-09-29 | 2022-05-20 | 阿波罗智联(北京)科技有限公司 | 音频处理方法、装置、设备以及存储介质 |
CN109243482B (zh) * | 2018-10-30 | 2022-03-18 | 深圳市昂思科技有限公司 | 改进acranc与波束形成的微型阵列语音降噪方法 |
CN109584898B (zh) * | 2018-12-29 | 2022-05-31 | 上海瑾盛通信科技有限公司 | 一种语音信号的处理方法、装置、存储介质及电子设备 |
TWI739236B (zh) | 2019-12-13 | 2021-09-11 | 瑞昱半導體股份有限公司 | 具有抗噪機制的音訊播放裝置及方法 |
CN113015050B (zh) * | 2019-12-20 | 2022-11-22 | 瑞昱半导体股份有限公司 | 具有抗噪机制的音频播放装置及方法 |
CN112803921B (zh) * | 2021-04-13 | 2021-09-07 | 浙江华创视讯科技有限公司 | 自适应滤波器、方法、介质及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1851806A (zh) * | 2006-05-30 | 2006-10-25 | 北京中星微电子有限公司 | 一种自适应麦克阵列系统及其语音信号处理方法 |
CN102938254A (zh) * | 2012-10-24 | 2013-02-20 | 中国科学技术大学 | 一种语音信号增强系统和方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9202455B2 (en) * | 2008-11-24 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced active noise cancellation |
US9330675B2 (en) * | 2010-11-12 | 2016-05-03 | Broadcom Corporation | Method and apparatus for wind noise detection and suppression using multiple microphones |
JP6375362B2 (ja) * | 2013-03-13 | 2018-08-15 | コピン コーポレーション | 雑音キャンセリングマイクロホン装置 |
-
2014
- 2014-10-08 CN CN201410525618.XA patent/CN105575397B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1851806A (zh) * | 2006-05-30 | 2006-10-25 | 北京中星微电子有限公司 | 一种自适应麦克阵列系统及其语音信号处理方法 |
CN102938254A (zh) * | 2012-10-24 | 2013-02-20 | 中国科学技术大学 | 一种语音信号增强系统和方法 |
Non-Patent Citations (1)
Title |
---|
基于阵列抗串扰自适应噪声抵消与谱减相结合的语音增强;曾庆宁,欧阳缮;《声学学报》;20070531;第32卷(第3期);第252页第1列第1、2段,第253页第2列第3、5、6段,第254页第1列第4、5段,第254页第2列第5段、图2 * |
Also Published As
Publication number | Publication date |
---|---|
CN105575397A (zh) | 2016-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105575397B (zh) | 语音降噪方法及语音采集设备 | |
EP1252796B1 (en) | System and method for dual microphone signal noise reduction using spectral subtraction | |
EP1169883B1 (en) | System and method for dual microphone signal noise reduction using spectral subtraction | |
US7206418B2 (en) | Noise suppression for a wireless communication device | |
CN101510426B (zh) | 一种噪声消除方法及系统 | |
US7386135B2 (en) | Cardioid beam with a desired null based acoustic devices, systems and methods | |
WO2011079716A1 (zh) | 一种使用麦克风阵列的降噪控制方法和装置 | |
WO2012026126A1 (ja) | 音源分離装置、音源分離方法、及び、プログラム | |
US20050281415A1 (en) | Microphone array processing system for noisy multipath environments | |
JP2008512888A (ja) | 改善した雑音抑圧を有する電話装置 | |
WO2013033991A1 (zh) | 一种多麦克风阵列噪声消除方法、装置及系统 | |
WO2014181330A1 (en) | A method and apparatus for suppression of unwanted audio signals | |
CN1460323A (zh) | 次波带指数平滑噪声消除系统 | |
CN104835503A (zh) | 一种改进gsc自适应语音增强方法 | |
CN104883462A (zh) | 一种用于消除声学回声的自适应滤波器及滤波方法 | |
CN105635500A (zh) | 双麦克风回声及噪声的抑制系统及其方法 | |
CN112331226B (zh) | 一种针对主动降噪系统的语音增强系统及方法 | |
Compernolle | DSP techniques for speech enhancement | |
Ykhlef et al. | A post-filter for acoustic echo cancellation in frequency domain | |
Xia et al. | An improved cross-correlation spectral subtraction post-processing algorithm for noise and echo canceller | |
Chen et al. | Filtering techniques for noise reduction and speech enhancement | |
Djendi | An efficient wavelet-based adaptive filtering algorithm for automatic blind speech enhancement | |
Prasad et al. | Two microphone technique to improve the speech intelligibility under noisy environment | |
Hu et al. | A robust adaptive speech enhancement system for vehicular applications | |
Trong | An Improved Implementation of GSC Filter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |