CN107424623A - 语音信号处理方法及装置 - Google Patents
语音信号处理方法及装置 Download PDFInfo
- Publication number
- CN107424623A CN107424623A CN201610349602.7A CN201610349602A CN107424623A CN 107424623 A CN107424623 A CN 107424623A CN 201610349602 A CN201610349602 A CN 201610349602A CN 107424623 A CN107424623 A CN 107424623A
- Authority
- CN
- China
- Prior art keywords
- signal
- mrow
- msub
- frequency domain
- adding window
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 18
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 238000001914 filtration Methods 0.000 claims abstract description 101
- 230000003044 adaptive effect Effects 0.000 claims abstract description 92
- 238000012545 processing Methods 0.000 claims abstract description 41
- 230000008030 elimination Effects 0.000 claims abstract description 33
- 238000003379 elimination reaction Methods 0.000 claims abstract description 33
- 238000005070 sampling Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims description 24
- 230000009466 transformation Effects 0.000 claims description 13
- 238000000844 transformation Methods 0.000 claims description 11
- 238000000034 method Methods 0.000 abstract description 13
- 238000007664 blowing Methods 0.000 description 24
- 238000001228 spectrum Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/02—Constructional features of telephone sets
- H04M1/0202—Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/02—Constructional features of telephone sets
- H04M1/19—Arrangements of transmitters, receivers, or complete sets to prevent eavesdropping, to attenuate local noise or to prevent undesired transmission; Mouthpieces or receivers specially adapted therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Filters That Use Time-Delay Elements (AREA)
Abstract
一种语音信号处理方法及装置,所述方法包括:对输入的语音信号做T采样的延迟,得到延迟信号;对所述延迟信号进行加窗频域自适应滤波处理,得到滤波信号;将所述输入的语音信号与所述滤波信号时域相减,得到消除信号;对所述消除信号进行维纳滤波,得到处理后的语音信号,并将所述维纳滤波的增益以及所述消除信号作为控制信号控制所述加窗频域自适应滤波的滤波系数更新。所述方法及装置可以在消除鸣号声干扰的同时,保证语音信号质量。
Description
技术领域
本发明涉及通信领域,尤其涉及一种语音信号处理方法及装置。
背景技术
在日常生活中,鸣号声(Horn)较为常见,通常源自交通工具,例如汽车的鸣笛声。当交通状况较为恶劣时,鸣号声出现的几率大大增加,会严重干扰语音通话的质量。
现有的智能电话通常配备有双麦克风,通过双麦克风能够有效消除鸣号声。然而,针对一些低端的智能电话,出于成本考虑,可能只配置一个麦克风,导致单麦克风的智能电话容易受到鸣号声的影响。
现有技术中,为减少鸣号声的影响,根据鸣号声的可预测性,使用预测器将之前的语音信号进行处理,生成一个预测信号,用于抵消鸣号声。然而,语音信号同样具有一定的可预测性,传统的预测器会消除语音信号中的一些语音成分,导致语音信号质量较差。
发明内容
本发明解决的技术问题是单麦克风终端,如何在消除鸣号声干扰的同时保证语音信号质量。
为解决上述技术问题,本发明实施例提供一种语音信号处理方法,包括:对输入的语音信号做T采样的延迟,得到延迟信号;对所述延迟信号进行加窗频域自适应滤波处理,得到滤波信号;将所述输入的语音信号与所述滤波信号时域相减,得到消除信号;对所述消除信号进行维纳滤波,得到处理后的语音信号,并将所述维纳滤波的增益以及所述消除信号作为控制信号控制所述加窗频域自适应滤波的滤波系数更新。
可选的,所述对输入的语音信号做T采样的延迟,得到延迟信号,采用如下公式进行:z(t)=x(t-T);其中:z(t)为所述延迟信号,x(t)为所述输入的语音信号,T为延迟时长且满足0.1ms≤T/fs≤1s,fs为x(t)的采样频率。
可选的,所述将所述输入的语音信号与所述滤波信号时域相减,得到消除信号,通过如下公式进行:e(t)=x(t)-y(t);其中:e(t)为所述消除信号,y(t)为所述滤波信号。
可选的,所述对所述延迟信号进行加窗频域自适应滤波处理包括以下任一种:在时域上采用加窗频域自适应滤波器对所述延迟信号进行加窗频域自适应滤波处理;在频域上采用加窗频域自适应滤波器对所述延迟信号进行加窗频域自适应滤波处理。
可选的,所述在时域上采用加窗频域自适应滤波器对所述延迟信号进行加窗频域自适应滤波处理,通过如下公式进行:
其中,ht为所述加窗频域自适应滤波器的时域系数,ht为长度为M的一维向量且ht=[ht(1),ht(2),…,ht(M-1),ht(M)]T,为卷积操作符号,M满足:M>fs*5ms。
可选的,所述在频域上采用加窗频域自适应滤波器对所述延迟信号进行加窗频域自适应滤波处理,通过如下公式进行:
[0M,y(t-N+M+1),…,y(t-1),y(t)]T=RN-M{F-[Zt·Ht]};
其中:Ht为所述加窗频域自适应滤波器的频域系数;Ht为长度为N的一维向量且Ht=F[ht 0N-M];F为离散傅里叶矩阵;·为点乘操作符号;RN-M为约束矩阵,N-M个下对角元素为1,其余元素为0;F-为逆离散傅里叶矩阵,Zt=F[z(t-N+1),…,z(t-1),z(t)]T,N<fs×100ms。
可选的,所述将所述维纳滤波的增益以及所述消除信号作为控制信号控制所述加窗频域自适应滤波的滤波系数更新,通过如下公式进行:
其中:RM为约束矩阵,M个上对角元素为1,其余元素为0;λ为非线性控制因子且λ>0;μu为更新步长且0<μu<2;μL为泄露系数且0<μL<1;ε为防止除零错误系数且ε>0;上标*为共轭操作,Zw,t为z(t)的N点加窗傅里叶变换,Ew,t为e(t)的N点加窗傅里叶变换,E[|Zw,t|2]是|Zw,t|2在t时刻的短期数学期望值。
本发明实施例还提供了一种语音信号处理装置,包括:延迟单元,用于对输入的语音信号做T采样的延迟,得到延迟信号;加窗频域自适应滤波器,用于对所述延迟信号进行加窗频域自适应滤波处理,得到滤波信号;减法器,用于将所述输入的语音信号与所述滤波信号时域相减,得到消除信号;维纳滤波器,用于对所述消除信号进行维纳滤波,得到处理后的语音信号;反馈单元,用于将所述维纳滤波器的滤波增益以及所述消除信号反馈至所述加窗频域自适应滤波器,以控制所述加窗频域自适应滤波器的滤波系数。
可选的,所述延迟单元用于采用公式z(t)=x(t-T)对输入的语音做T采样的延迟,得到延迟信号,其中:z(t)为所述延迟信号,x(t)为所述输入的语音信号,T为延迟时长且满足0.1ms≤T/fs≤1s,fs为x(t)的采样频率。
可选的,所述减法器用于采用公式e(t)=x(t)-y(t)将输入的语音信号与所述滤波信号时域相减,得到消除信号,其中:e(t)为所述消除信号,y(t)为所述滤波信号。
可选的,所述加窗频域自适应滤波器用于在时域上或频域上对所述延迟信号进行加窗频域自适应滤波处理。
可选的,所述加窗频域自适应滤波器用于采用如下公式对所述延迟信号在时域上进行加窗频域自适应滤波处理:
其中,ht为所述加窗频域自适应滤波器的时域系数,ht为长度为M的一维向量且ht=[ht(1),ht(2),…,ht(M-1),ht(M)]T,为卷积操作符号,M满足:M>fs*5ms。
可选的,所述加窗频域自适应滤波器用于采用如下公式对所述延迟信号在频域上进行加窗频域自适应滤波处理:
[0M,y(t-N+M+1),…,y(t-1),y(t)]T=RN-M{F-[Zt·Ht]};
其中:Ht为所述加窗频域自适应滤波器的频域系数;Ht为长度为N的一维向量且Ht=F[ht 0N-M];F为离散傅里叶矩阵;·为点乘操作符号;RN-M为约束矩阵,N-M个下对角元素为1,其余元素为0;F-为逆离散傅里叶矩阵,Zt=F[z(t-N+1),…,z(t-1),z(t)]T,N<fs×100ms。
可选的,所述反馈单元用于采用如下公式将所述维纳滤波器的滤波增益以及所述消除信号反馈至所述加窗频域自适应滤波器:
其中:RM为约束矩阵,M个上对角元素为1,其余元素为0;λ为非线性控制因子且λ>0;μu为更新步长且0<μu<2;μL为泄露系数且0<μL<1;ε为防止除零错误系数且ε>0;上标*为共轭操作,Zw,t为z(t)的N点加窗傅里叶变换,Ew,t为e(t)的N点加窗傅里叶变换,E[|Zw,t|2]是|Zw,t|2在t时刻的短期数学期望值。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
对延迟信号进行加窗频域自适应滤波处理,得到滤波信号,将输入的语音信号与滤波信号时域相减,即可将输入的语音信号中的鸣号声消除,将维纳滤波的增益以及消除信号进行反馈,从而控制加窗频域自适应滤波的滤波器系数更新,使得整个鸣号声的消除流程可控,避免消除输入的语音信号中的语音部分。因此,在有效消除鸣号声的同时,保证语音信号质量。
附图说明
图1是本发明实施例中的一种语音信号处理方法的流程图;
图2(a)是存在鸣号声干扰的原始语音信号波形图;
图2(b)是消除鸣号声干扰的语音信号波形图;
图3是本发明实施例中的一种语音信号处理装置的结构示意图。
具体实施方式
现有技术中,鸣号声具有较强的可预测性。为减少鸣号声的干扰,可以使用预测器将之前的语音信号进行处理,生成一个预测信号,用于抵消鸣号声。然而,在实际应用中,语音信号同样具有一定的可预测性,因此,传统的预测器在消除鸣号声的同时,会消除语音信号中的一些语音成分,导致语音信号质量较差。
在本发明实施例中,对延迟信号进行加窗频域自适应滤波处理,得到滤波信号。将输入的语音信号与滤波信号时域相减,即可将输入的语音信号中的鸣号声消除。将维纳滤波的增益以及消除信号进行反馈,从而控制加窗频域自适应滤波的滤波器系数更新,使得整个鸣号声的消除流程是可控的,从而避免消除输入的语音信号中的语音部分。因此,在消除鸣号声的同时,保证语音信号质量。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本发明实施例提供了一种语音信号处理方法,参照图1,以下通过具体步骤进行详细说明。
步骤S101,对输入的语音信号做T采样的延迟,得到延迟信号。
在本发明实施例中,可以采用公式z(t)=x(t-T)对输入的语音信号做T采样的延迟,其中:z(t)为经过T采样的延迟之后的延迟信号,x(t)为输入的语音信号,T为延迟时长,且T满足如下条件:0.1ms≤T/fs≤1s,其中,fs为x(t)的采样频率。
在实际应用中,T的取值不宜过大也不宜过小。当T过大时,鸣号声的相关性会降低;当T过小时,T易落在语音信号的强相关时间内,导致语音信号存在较大的损失。在本发明一实施例中,T/fs的取值为2ms。
在得到延迟信号后,执行步骤S102。
步骤S102,对所述延迟信号进行加窗频域自适应滤波处理,得到滤波信号。
在具体实施中,可以采用预设的加窗频域自适应滤波器对延迟信号z(t)进行加窗频域自适应滤波。可以在时域上对延迟信号z(t)进行加窗频域自适应滤波,也可以在频域上对延迟信号z(t)进行加窗频域自适应滤波。
在本发明一实施例中,加窗频域自适应滤波器在时域上对延迟信号z(t)进行加窗频域自适应滤波。
加窗频域自适应滤波器的时域系数为ht,ht为长度为M的一维向量,且ht=[ht(1),ht(2),…,ht(M-1),ht(M)]T。
在时域上,加窗频域自适应滤波器的滤波过程可以通过如下公式实现:
其中,为卷积操作符号,M的取值满足如下关系:M>fs*5ms,也即5ms<M/fs。在本发明一实施例中,M/fs=20ms。
在本发明另一实施例中,加窗频域自适应滤波器在频域上对延迟信号z(t)进行加窗频域自适应滤波。加窗频域自适应滤波器的频域系数为Ht,Ht为长度为N的一维向量,通过如下方式生成:在ht的尾部补N-M个0,得到长度为N的一维向量,对得到的向量进行快速傅里叶变换,得到的结果即为Ht,也即:Ht=F[ht 0N-M],F为离散傅里叶矩阵。
在频域上,加窗频域自适应滤波器的滤波过程可以通过如下公式实现:
[0M,y(t-N+M+1),…,y(t-1),y(t)]T=RN-M{F-[Zt·Ht]}; (2)
其中,i为点乘操作符号;RN-M为约束矩阵,只有N-M个下对角元素为1,其余元素为0;F-为逆离散傅里叶矩阵,Zt=F[z(t-N+1),…,z(t-1),z(t)]T;N的取值满足如下关系:N<fs×100ms,也即N/fs<100ms。
在本发明一实施例中,N/fs<100=32ms。
在获取到滤波信号之后,可以执行步骤S103。
步骤S103,将所述输入的语音信号与所述滤波信号时域相减,得到消除信号。
在具体实施中,将输入的语音信号x(t)与滤波信号y(t)时域相减之后,可以将输入的语音信号x(t)中的鸣号声消除,也即得到的消除信号中,不存在鸣号声的干扰。
在本发明实施例中,可以采用如下公式获取消除信号:e(t)=x(t)-y(t),其中:e(t)为消除信号。
在得到消除信号e(t)后,可以执行步骤S104。
步骤S104,对所述消除信号进行维纳滤波,得到处理后的语音信号,并将所述维纳滤波的增益以及所述消除信号作为控制信号控制所述加窗频域自适应滤波的滤波系数更新。
在具体实施中,可以采用预设的维纳滤波器对消除信号e(t)进行维纳滤波。
在实际应用中,维纳滤波器是一种经典的最优滤波器,通常的实现形式是通过估计噪声信号(信号中的无用成分)来求取维纳滤波器增益G[k]t。维纳滤波器增益G[k]t应用到被滤波信号后,被滤波信号中的有用成分保留,无用成分会被衰减乃至消除,即:Dt=Et·Gt,其中Dt为维纳滤波器的输出信号,也即处理后的频域上的语音信号,Et为被滤波信号的短时傅里叶变换。
在本发明实施例中,被滤波信号为消除信号e(t),Et可以采用如下公式计算:
其中,wana(k)是N点的分析窗,k=1,2,3,……,N;分析窗一般用正弦窗或者Hanning窗;Ps是消除信号e(t)的自功率谱。
在实际应用中常用的一种频域维纳滤波器的迭代计算形式如下,t时刻的维纳滤波器增益为:
信噪比SNR为:
SNR[k]t=αG[k]t-1 2SNRP[k]t-1+(1-α)max(SNRP[k]t-1,0); (5)
SNRp为先验信噪比,采用如下公式计算:
其中,α取值范围为0<α<1,在本发明一实施例中α=0.5。
可以采用跟踪信号频谱短时最小值方法计算噪声自功率谱Pn,也可以采用时间递归平均方法计算噪声自功率谱Pn,还可以采用其他的方法计算噪声自功率谱Pn,此处不做赘述。
本发明一实施例中,采用G.Doblinger噪声估计法计算噪声自功率谱Ps,G.Doblinger噪声估计法是频谱短时最小值方法与时间递归平均方法的结合,具体计算公式为:
其中η1,η2,η3是平滑因子,它们的取值范围为0<η1,η2,η3<1,典型值η1=0.99,η2=0.99,η3=0.8。
在本发明实施例中,在获取到维纳滤波器的增益后,可以将维纳滤波器的滤波增益以及消除信号e(t)作为控制信号,反馈至加窗频域自适应滤波器,以对加窗频域自适应滤波器的滤波系数进行更新。
在本发明一实施例中,采用如下公式对加窗频域自适应滤波器的滤波系数进行更新:
公式(8)中:RM为约束矩阵,M个上对角元素为1,其余元素为0。λ为大于0的非线性控制因子,在本发明实施例中,λ=1。μu为更新步长,取值范围过大时稳定性较差,取值过小则更新时长较长,在本发明实施例中,μu的取值范围为0<μu<2。μL为泄露系数,且μL的取值范围为0<μL<1,在本发明实施例中,μL比1略小,用于消除远期信号的影响。ε为防止除零错误系数的微小正数;上标*为共轭操作,Zw,t为z(t)的N点加窗傅里叶变换,Ew,t为e(t)的N点加窗傅里叶变换,E[|Zw,t|2]是|Zw,t|2在t时刻的短期数学期望值。
在本发明实施例中,Zw,t与Ew,t分别采用如下公式计算:
公式(9)中,上标T为转置操作,wadf(k)是N点的用于自适应滤波器的窗函数,k=1,2,……,N,窗函数可以为矩形窗、Sine窗、Hanning窗、Hamming窗以及Tukey窗等中的任一种,也可以为其他类型的窗函数。在本发明一实施例中,wadf(k)采用Tukey窗。
在本发明一实施例中,采用自回归方法计算获取E[|Zw,t|2],计算公式如下:
E[|Zw,t|2]=γE[|Zw,t-1|2]+(1-γ)|Zw,t|2,0<γ<1; (10)
在本发明其他实施例中,还可以存在其他的方法来计算获取E[|Zw,t|2],此处不做赘述。
参照图2,图2(a)给出了原始语音信号波形图,图2(b)给出了采用本发明实施例中提供的语音信号处理方法处理后的语音信号波形图。
参照图2(a),受鸣号声干扰的语音信号波形段201中的黑色斑点状2021为鸣号声干扰。从201中可以获知,当前的语音信号存在较大的鸣号声干扰。
而在图2(b)中,201中的黑色斑点状已经被完全滤除,也即当前的语音信号不存在鸣号声干扰。此外,与图2(a)相比,在消除鸣号声的同时,语音信号的质量并没有受到影响。
由此可见,对延迟信号进行加窗频域自适应滤波处理,得到滤波信号。将输入的语音信号与滤波信号时域相减,即可将输入的语音信号中的鸣号声消除。将维纳滤波的增益以及消除信号进行反馈,从而控制加窗频域自适应滤波的滤波器系数更新,使得整个鸣号声的消除流程是可控的,从而避免消除输入的语音信号中的语音部分。因此,在消除鸣号声的同时,保证语音信号质量。
参照图3,给出了本发明实施例中的一种语音信号处理装置,包括:延迟单元301、加窗频域自适应滤波器302、减法器303、维纳滤波器304以及反馈单元305,其中:
延迟单元301,用于对输入的语音信号做T采样的延迟,得到延迟信号;
加窗频域自适应滤波器302,用于对所述延迟信号进行加窗频域自适应滤波处理,得到滤波信号;
减法器303,用于将所述输入的语音信号与所述滤波信号时域相减,得到消除信号;
维纳滤波器304,用于对所述消除信号进行维纳滤波,得到处理后的语音信号Dt;
反馈单元305,用于将所述维纳滤波器的滤波增益以及所述消除信号反馈至所述加窗频域自适应滤波器,以控制所述加窗频域自适应滤波器的滤波系数。
在具体实施中,所述延迟单元301可以用于采用公式z(t)=x(t-T)对输入的语音做T采样的延迟,得到延迟信号,其中:z(t)为所述延迟信号,x(t)为所述输入的语音信号,T为延迟时长且满足0.1ms≤T/fs≤1s,fs为x(t)的采样频率。
在具体实施中,所述减法器303可以用于采用公式e(t)=x(t)-y(t)将输入的语音信号与所述滤波信号时域相减,得到消除信号,其中:e(t)为所述消除信号,y(t)为所述滤波信号。
在具体实施中,所述加窗频域自适应滤波器302可以用于在时域上对所述延迟信号进行加窗频域自适应滤波处理,也可以用于在频域上对所述延迟信号进行加窗频域自适应滤波处理。
在具体实施中,所述加窗频域自适应滤波器302可以用于采用如下公式对所述延迟信号在时域上进行加窗频域自适应滤波处理:
其中,ht为所述加窗频域自适应滤波器的时域系数,ht为长度为M的一维向量且ht=[ht(1),ht(2),…,ht(M-1),ht(M)]T,为卷积操作符号,M满足:M>fs*5ms。
在具体实施中,所述加窗频域自适应滤波器用于采用如下公式对所述延迟信号在频域上进行加窗频域自适应滤波处理:
[0M,y(t-N+M+1),…,y(t-1),y(t)]T=RN-M{F-[Zt·Ht]};
其中:Ht为所述加窗频域自适应滤波器的频域系数;Ht为长度为N的一维向量且Ht=F[ht 0N-M];F为离散傅里叶矩阵;·为点乘操作符号;RN-M为约束矩阵,N-M个下对角元素为1,其余元素为0;F-为逆离散傅里叶矩阵,Zt=F[z(t-N+1),…,z(t-1),z(t)]T,N<fs×100ms。
在具体实施中,所述反馈单元305可以用于采用如下公式将所述维纳滤波器的滤波增益以及所述消除信号反馈至所述加窗频域自适应滤波器:
其中:RM为约束矩阵,M个上对角元素为1,其余元素为0;λ为非线性控制因子且λ>0;μu为更新步长且0<μu<2;μL为泄露系数且0<μL<1;ε为防止除零错误系数且ε>0;上标*为共轭操作,Zw,t为z(t)的N点加窗傅里叶变换,Ew,t为e(t)的N点加窗傅里叶变换,E「|Zw,t|2]是|Zw,t|2在t时刻的短期数学期望值。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (14)
1.一种语音信号处理方法,其特征在于,包括:
对输入的语音信号做T采样的延迟,得到延迟信号;
对所述延迟信号进行加窗频域自适应滤波处理,得到滤波信号;
将所述输入的语音信号与所述滤波信号时域相减,得到消除信号;
对所述消除信号进行维纳滤波,得到处理后的语音信号,并将所述维纳滤波的增益以及所述消除信号作为控制信号控制所述加窗频域自适应滤波的滤波系数更新。
2.如权利要求1所述的语音信号处理方法,其特征在于,所述对输入的语音信号做T采样的延迟,得到延迟信号,采用如下公式进行:
z(t)=x(t-T);
其中:z(t)为所述延迟信号,x(t)为所述输入的语音信号,T为延迟时长且满足0.1ms≤T/fs≤1s,fs为x(t)的采样频率。
3.如权利要求2所述的语音信号处理方法,其特征在于,所述将所述输入的语音信号与所述滤波信号时域相减,得到消除信号,通过如下公式进行:
e(t)=x(t)-y(t);
其中:e(t)为所述消除信号,y(t)为所述滤波信号。
4.如权利要求3所述的语音信号处理方法,其特征在于,所述对所述延迟信号进行加窗频域自适应滤波处理包括以下任一种:
在时域上采用加窗频域自适应滤波器对所述延迟信号进行加窗频域自适应滤波处理;
在频域上采用加窗频域自适应滤波器对所述延迟信号进行加窗频域自适应滤波处理。
5.如权利要求4所述的语音信号处理方法,其特征在于,所述在时域上采用加窗频域自适应滤波器对所述延迟信号进行加窗频域自适应滤波处理,通过如下公式进行:
<mrow>
<mi>y</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mi>h</mi>
<mi>t</mi>
</msub>
<mo>&CircleTimes;</mo>
<mi>z</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>m</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>M</mi>
</munderover>
<msub>
<mi>h</mi>
<mi>t</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>)</mo>
</mrow>
<mi>x</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>-</mo>
<mi>M</mi>
<mo>+</mo>
<mi>m</mi>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
其中,ht为所述加窗频域自适应滤波器的时域系数,ht为长度为M的一维向量且ht=[ht(1),ht(2),…,ht(M-1),ht(M)]T,为卷积操作符号,M满足:M>fs*5ms。
6.如权利要求4所述的语音信号处理方法,其特征在于,所述在频域上采用加窗频域自适应滤波器对所述延迟信号进行加窗频域自适应滤波处理,通过如下公式进行:
[0M,y(t-N+M+1),…,y(t-1),y(t)]T=RN-M{F-[Zt·Ht]};
其中:Ht为所述加窗频域自适应滤波器的频域系数;Ht为长度为N的一维向量且Ht=F[ht0N-M];F为离散傅里叶矩阵;·为点乘操作符号;RN-M为约束矩阵,N-M个下对角元素为1,其余元素为0;F-为逆离散傅里叶矩阵,Zt=F[z(t-N+1),…,z(t-1),z(t)]T,N<fs×100ms。
7.如权利要求6所述的语音信号处理方法,其特征在于,所述将所述维纳滤波的增益以及所述消除信号作为控制信号控制所述加窗频域自适应滤波的滤波系数更新,通过如下公式进行:
<mrow>
<msub>
<mi>H</mi>
<mrow>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>=</mo>
<msub>
<mi>&mu;</mi>
<mi>L</mi>
</msub>
<msub>
<mi>H</mi>
<mi>t</mi>
</msub>
<mo>+</mo>
<msub>
<mi>&mu;</mi>
<mi>u</mi>
</msub>
<mi>F</mi>
<mo>{</mo>
<msub>
<mi>R</mi>
<mi>M</mi>
</msub>
<msup>
<mi>F</mi>
<mo>-</mo>
</msup>
<mo>&lsqb;</mo>
<mfrac>
<mrow>
<msup>
<msub>
<mi>Z</mi>
<mrow>
<mi>w</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
</msub>
<mo>*</mo>
</msup>
<mo>&CenterDot;</mo>
<msub>
<mi>E</mi>
<mrow>
<mi>w</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
</msub>
<mo>&CenterDot;</mo>
<msup>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>G</mi>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>&lambda;</mi>
</msup>
</mrow>
<mrow>
<mi>E</mi>
<mo>&lsqb;</mo>
<mo>|</mo>
<msub>
<mi>Z</mi>
<mrow>
<mi>w</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
</msub>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>&rsqb;</mo>
<mo>+</mo>
<mi>&epsiv;</mi>
</mrow>
</mfrac>
<mo>&rsqb;</mo>
<mo>}</mo>
<mo>;</mo>
</mrow>
1
其中:RM为约束矩阵,M个上对角元素为1,其余元素为0;λ为非线性控制因子且λ>0;μu为更新步长且0<μu<2;μL为泄露系数且0<μL<1;ε为防止除零错误系数且ε>0;上标*为共轭操作,Zw,t为z(t)的N点加窗傅里叶变换,Ew,t为e(t)的N点加窗傅里叶变换,E[|Zw,t|2]是|Zw,t|2在t时刻的短期数学期望值。
8.一种语音信号处理装置,其特征在于,包括:
延迟单元,用于对输入的语音信号做T采样的延迟,得到延迟信号;
加窗频域自适应滤波器,用于对所述延迟信号进行加窗频域自适应滤波处理,得到滤波信号;
减法器,用于将所述输入的语音信号与所述滤波信号时域相减,得到消除信号;
维纳滤波器,用于对所述消除信号进行维纳滤波,得到处理后的语音信号;反馈单元,用于将所述维纳滤波器的滤波增益以及所述消除信号反馈至所述加窗频域自适应滤波器,以控制所述加窗频域自适应滤波器的滤波系数。
9.如权利要求8所述的语音信号处理装置,其特征在于,所述延迟单元用于采用公式z(t)=x(t-T)对输入的语音做T采样的延迟,得到延迟信号,其中:z(t)为所述延迟信号,x(t)为所述输入的语音信号,T为延迟时长且满足0.1ms≤T/fs≤1s,fs为x(t)的采样频率。
10.如权利要求9所述的语音信号处理装置,其特征在于,所述减法器用于采用公式e(t)=x(t)-y(t)将输入的语音信号与所述滤波信号时域相减,得到消除信号,其中:e(t)为所述消除信号,y(t)为所述滤波信号。
11.如权利要求10所述的语音信号处理装置,其特征在于,所述加窗频域自适应滤波器用于在时域上或频域上对所述延迟信号进行加窗频域自适应滤波处理。
12.如权利要求11所述的语音信号处理装置,其特征在于,所述加窗频域自适应滤波器用于采用如下公式对所述延迟信号在时域上进行加窗频域自适应滤波处理:
<mrow>
<mi>y</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mi>h</mi>
<mi>t</mi>
</msub>
<mo>&CircleTimes;</mo>
<mi>z</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>m</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>M</mi>
</munderover>
<msub>
<mi>h</mi>
<mi>t</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>)</mo>
</mrow>
<mi>x</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>-</mo>
<mi>M</mi>
<mo>+</mo>
<mi>m</mi>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
其中,ht为所述加窗频域自适应滤波器的时域系数,ht为长度为M的一维向量且ht=[ht(1),ht(2),…,ht(M-1),ht(M)]T,为卷积操作符号,M满足:M>fs*5ms。
13.如权利要求11所述的语音信号处理装置,其特征在于,所述加窗频域自适应滤波器用于采用如下公式对所述延迟信号在频域上进行加窗频域自适应滤波处理:
[0M,y(t-N+M+1),…,y(t-1),y(t)]T=RN-M{F-[Zt·Ht]};
其中:Ht为所述加窗频域自适应滤波器的频域系数;Ht为长度为N的一维向量且Ht=F[ht0N-M];F为离散傅里叶矩阵;·为点乘操作符号;RN-M为约束矩阵,N-M个下对角元素为1,其余元素为0;F-为逆离散傅里叶矩阵,Zt=F[z(t-N+1),…,z(t-1),z(t)]T,N<fs×100ms。
14.如权利要求13所述的语音信号处理装置,其特征在于,所述反馈单元用于采用如下公式将所述维纳滤波器的滤波增益以及所述消除信号反馈至所述加窗频域自适应滤波器:
<mrow>
<msub>
<mi>H</mi>
<mrow>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>=</mo>
<msub>
<mi>&mu;</mi>
<mi>L</mi>
</msub>
<msub>
<mi>H</mi>
<mi>t</mi>
</msub>
<mo>+</mo>
<msub>
<mi>&mu;</mi>
<mi>u</mi>
</msub>
<mi>F</mi>
<mo>{</mo>
<msub>
<mi>R</mi>
<mi>M</mi>
</msub>
<msup>
<mi>F</mi>
<mo>-</mo>
</msup>
<mo>&lsqb;</mo>
<mfrac>
<mrow>
<msup>
<msub>
<mi>Z</mi>
<mrow>
<mi>w</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
</msub>
<mo>*</mo>
</msup>
<mo>&CenterDot;</mo>
<msub>
<mi>E</mi>
<mrow>
<mi>w</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
</msub>
<mo>&CenterDot;</mo>
<msup>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>G</mi>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>&lambda;</mi>
</msup>
</mrow>
<mrow>
<mi>E</mi>
<mo>&lsqb;</mo>
<mo>|</mo>
<msub>
<mi>Z</mi>
<mrow>
<mi>w</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
</msub>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>&rsqb;</mo>
<mo>+</mo>
<mi>&epsiv;</mi>
</mrow>
</mfrac>
<mo>&rsqb;</mo>
<mo>}</mo>
<mo>;</mo>
</mrow>
2
其中:RM为约束矩阵,M个上对角元素为1,其余元素为0;λ为非线性控制因子且λ>0;μu为更新步长且0<μu<2;μL为泄露系数且0<μL<1;ε为防止除零错误系数且ε>0;上标*为共轭操作,Zw,t为z(t)的N点加窗傅里叶变换,Ew,t为e(t)的N点加窗傅里叶变换,E[|Zw,t|2]是|Zw,t|2在t时刻的短期数学期望值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610349602.7A CN107424623B (zh) | 2016-05-24 | 2016-05-24 | 语音信号处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610349602.7A CN107424623B (zh) | 2016-05-24 | 2016-05-24 | 语音信号处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107424623A true CN107424623A (zh) | 2017-12-01 |
CN107424623B CN107424623B (zh) | 2020-04-07 |
Family
ID=60422654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610349602.7A Active CN107424623B (zh) | 2016-05-24 | 2016-05-24 | 语音信号处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107424623B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110289009A (zh) * | 2019-07-09 | 2019-09-27 | 广州视源电子科技股份有限公司 | 声音信号的处理方法、装置和交互智能设备 |
CN113938112A (zh) * | 2021-08-12 | 2022-01-14 | 襄阳达安汽车检测中心有限公司 | 无相移滤波数据的生成方法和无相移滤波器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101940003A (zh) * | 2009-01-30 | 2011-01-05 | 松下电器产业株式会社 | 振鸣抑制装置、振鸣抑制方法、程序以及集成电路 |
US20130066628A1 (en) * | 2011-09-12 | 2013-03-14 | Oki Electric Industry Co., Ltd. | Apparatus and method for suppressing noise from voice signal by adaptively updating wiener filter coefficient by means of coherence |
CN103262572A (zh) * | 2011-10-14 | 2013-08-21 | 松下电器产业株式会社 | 振鸣抑制装置、助听器、振鸣抑制方法及集成电路 |
CN104754465A (zh) * | 2013-12-31 | 2015-07-01 | 展讯通信(上海)有限公司 | 一种自适应信号增强方法和系统 |
CN105575397A (zh) * | 2014-10-08 | 2016-05-11 | 展讯通信(上海)有限公司 | 语音降噪方法及语音采集设备 |
-
2016
- 2016-05-24 CN CN201610349602.7A patent/CN107424623B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101940003A (zh) * | 2009-01-30 | 2011-01-05 | 松下电器产业株式会社 | 振鸣抑制装置、振鸣抑制方法、程序以及集成电路 |
US20130066628A1 (en) * | 2011-09-12 | 2013-03-14 | Oki Electric Industry Co., Ltd. | Apparatus and method for suppressing noise from voice signal by adaptively updating wiener filter coefficient by means of coherence |
CN103262572A (zh) * | 2011-10-14 | 2013-08-21 | 松下电器产业株式会社 | 振鸣抑制装置、助听器、振鸣抑制方法及集成电路 |
CN104754465A (zh) * | 2013-12-31 | 2015-07-01 | 展讯通信(上海)有限公司 | 一种自适应信号增强方法和系统 |
CN105575397A (zh) * | 2014-10-08 | 2016-05-11 | 展讯通信(上海)有限公司 | 语音降噪方法及语音采集设备 |
Non-Patent Citations (1)
Title |
---|
李宁: "LMS自适应滤波算法的收敛性能研究与应用", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110289009A (zh) * | 2019-07-09 | 2019-09-27 | 广州视源电子科技股份有限公司 | 声音信号的处理方法、装置和交互智能设备 |
CN110289009B (zh) * | 2019-07-09 | 2021-06-15 | 广州视源电子科技股份有限公司 | 声音信号的处理方法、装置和交互智能设备 |
CN113938112A (zh) * | 2021-08-12 | 2022-01-14 | 襄阳达安汽车检测中心有限公司 | 无相移滤波数据的生成方法和无相移滤波器 |
Also Published As
Publication number | Publication date |
---|---|
CN107424623B (zh) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3474280B1 (en) | Signal processor for speech signal enhancement | |
EP2031583B1 (en) | Fast estimation of spectral noise power density for speech signal enhancement | |
US8010355B2 (en) | Low complexity noise reduction method | |
JP5068653B2 (ja) | 雑音のある音声信号を処理する方法および該方法を実行する装置 | |
DE69831288T2 (de) | An Umgebungsgeräusche angepasste Sprachverarbeitung | |
Plapous et al. | Speech enhancement using harmonic regeneration | |
Erkelens et al. | A data-driven approach to optimizing spectral speech enhancement methods for various error criteria | |
JP2002541753A (ja) | 固定フィルタを用いた時間領域スペクトラル減算による信号雑音の低減 | |
WO2000014724A1 (en) | Method for reducing noise distortions in a speech recognition system | |
EP2346032A1 (en) | Noise suppression device and audio decoding device | |
EP1995722B1 (en) | Method for processing an acoustic input signal to provide an output signal with reduced noise | |
CN107424623A (zh) | 语音信号处理方法及装置 | |
CN112151060B (zh) | 单通道语音增强方法及装置、存储介质、终端 | |
Schmid et al. | An expectation-maximization algorithm for multichannel adaptive speech dereverberation in the frequency-domain | |
Lei et al. | Speech enhancement for nonstationary noises by wavelet packet transform and adaptive noise estimation | |
US6507623B1 (en) | Signal noise reduction by time-domain spectral subtraction | |
JP6143702B2 (ja) | エコー消去装置、その方法及びプログラム | |
Puder | Kalman‐filters in subbands for noise reduction with enhanced pitch‐adaptive speech model estimation | |
Prasad et al. | Two microphone technique to improve the speech intelligibility under noisy environment | |
Esch et al. | A Modified Minimum Statistics Algorithm for Reducing Time Varying Harmonic Noise. | |
Goswami et al. | A novel approach for design of a speech enhancement system using NLMS adaptive filter and ZCR based pattern identification | |
Esch et al. | Model-based speech enhancement exploiting temporal and spectral dependencies | |
Babu et al. | Modified Kalman Filter-based Approach in Comparison with Traditional Speech Enhancement Algorithms from Adverse Noisy Environments | |
Balaji | Enhancement of Speech Signal Using Modified Binary Mask Based Algorithm for Vehicular Noise | |
Manjare et al. | Performance Evaluation of Adaptive Algorithms for Speech Improvement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |