CN105489224B - 一种基于麦克风阵列的语音降噪方法及系统 - Google Patents
一种基于麦克风阵列的语音降噪方法及系统 Download PDFInfo
- Publication number
- CN105489224B CN105489224B CN201410468440.XA CN201410468440A CN105489224B CN 105489224 B CN105489224 B CN 105489224B CN 201410468440 A CN201410468440 A CN 201410468440A CN 105489224 B CN105489224 B CN 105489224B
- Authority
- CN
- China
- Prior art keywords
- signal
- voice signal
- noise
- targeted voice
- corrected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种基于麦克风阵列的语音降噪方法及系统,包括:将组成麦克风阵列的两个无指向性麦克风构建为两个背向心形指向性麦克风,得到前向目标语音信号和后向噪声信号;对前向目标语音信号和后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号;对前向目标语音信号和后向噪声信号进行自适应双滤波,得到已修正噪声信号和已修正目标语音信号;基于已修正目标语音信号,得到还原后的目标语音信号。本发明采用频率均衡避免还原后的目标语音信号出现频率失真,采用自适应双滤波方法解决在通过自适应滤波器进行降噪的同时也损害到目标语音信号的问题,进而彻底避免还原后的目标语音信号出现失真。
Description
技术领域
本发明涉及数字信号处理技术领域,尤其涉及一种基于麦克风阵列的语音降噪方法及系统。
背景技术随着语音通信及语音识别技术的快速发展,其已在人们的日常生活和工作中的多个领域得到了广泛的应用,为人们提供了极大的便利。然而,语音通信及语音识别的应用环境是复杂多变的,尤其是在车载、机载以及多人讲话等信噪比较低的应用环境中,噪声的存在给传统的语音通信及语音识别技术带来了很大的挑战,因此语音降噪技术已成为语音通信及语音识别能正常、准确工作的保证。为了提升语音降噪技术的有效性,现有语音降噪技术主要包括单麦克风增强技术和麦克风阵列技术,其中,单麦克风增强技术单纯利用信号的时序信息进行降噪处理,而麦克风阵列技术却融合语音信号的时序信息和空间信息,因此,麦克风阵列技术相较于单麦克风语音增强技术,能更好地平衡噪声抑制幅度和语音失真度控制之间的关系。
麦克风阵列技术是利用两个或者更多的麦克风组成的麦克风阵列进行语音增强,其最基本的思想是通过自适应滤波器用一个麦克风接收到的噪声抵消另一个麦克风接收到的信号中的噪声成分,得到目标语音信号。由于在实际应用中两个麦克风采集的信号都可能包含目标语音信号,因此,降噪的同时也会损害到目标语音信号,这就需要对自适应滤波器的收敛和滤波进行控制,以保证在有效地抑制噪声的同时保护一个麦克风中的目标语音信号不会被另一个麦克风中的目标语音信号所抵消,否则就会造成目标语音信号的失真。针对上述技术问题,后又有技术人员提出通过确定麦克风阵列所有声音信号的入射角度进行信号成分的统计,进而得到滤波控制因子,利用该滤波控制因子可将目标语音信号中可能存在的噪声成分滤除,从而较有效地解决了在滤波过程中存在语音信号失真的问题,但是,如果噪声信号中含有目标语音信号成分,则无论如何调整滤波控制因子,目标语音信号经滤波后仍会存在一定的失真,这使得该种方案也无法完全解决语音信号失真的问题。
发明内容
本发明的实施例针对基于麦克风阵列的现有语音降噪方法存在的上述技术问题,提供一种可以更为有效地解决语音失真问题的语音降噪方法及系统。
为实现上述目的,本发明采用的技术方案为:一种基于麦克风阵列的语音降噪方法,包括:
利用波束成形技术将组成所述麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风,以得到前向目标语音信号和后向噪声信号;
对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号;
对所述已均衡目标语音信号进行自适应滤波处理,估计出所述已均衡噪声信号中存在的目标语音信号的泄漏成分;
从所述已均衡噪声信号中去除所述目标语音信号的泄漏成分,得到已修正噪声信号;
对所述已修正噪声信号进行自适应滤波处理,估计出所述已均衡目标语音信号中存在的噪声信号的泄漏成分;
从所述已均衡目标语音信号中去除所述噪声信号的泄漏成分,得到已修正目标语音信号;
基于所述已修正目标语音信号,得到还原后的目标语音信号。
优选的是,所述对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号包括:
提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子;
将所述前向目标语音信号除以所述增益因子,得到所述已均衡目标语音信号;
将所述后向噪声信号除以所述增益因子,得到所述已均衡噪声信号。
优选的是,所述方法还包括:
计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比;
在所述信噪比大于预设门限时,更新估计出的所述目标语音信号的泄漏成分;
在所述信噪比小于等于所述预设门限时,更新估计出的所述噪声信号的泄漏成分。
优选的是,所述计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比包括:
计算所有频带下的已修正目标语音信号总量;
计算所有频带下的已修正噪声信号总量;
计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为所述已修正目标语音信号与所述已修正噪声信号之间的信噪比。
优选的是,所述基于所述已修正目标语音信号,得到还原后的目标语音信号包括:
对所述已修正目标语音信号进行自适应后置滤波处理,得到已后置滤波目标语音信号;
基于所述已后置滤波目标语音信号,得到所述还原后的目标语音信号。
为了实现上述目的,本发明采用的技术方案为:一种基于麦克风阵列的语音降噪系统,包括:
波束形成模块,用于利用波束成形技术将组成所述麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风,以得到前向目标语音信号和后向噪声信号;
频率均衡模块,用于对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号;
目标语音信号自适应滤波模块,用于对所述已均衡目标语音信号进行自适应滤波处理,估计出所述已均衡噪声信号中存在的目标语音信号的泄漏成分;
噪声信号修正模块,用于从所述已均衡噪声信号中去除所述目标语音信号的泄漏成分,得到已修正噪声信号;
噪声信号自适应滤波模块,用于对所述已修正噪声信号进行自适应滤波处理,估计出所述已均衡目标语音信号中存在的噪声信号的泄漏成分;
目标语音信号修正模块,用于从所述已均衡目标语音信号中去除所述噪声信号的泄漏成分,得到已修正目标语音信号;以及,
后置处理模块,用于基于所述已修正目标语音信号,得到还原后的目标语音信号。
优选的是,所述频率均衡模块包括:
增益因子提取单元,用于提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子;
目标语音信号均衡单元,用于将所述前向目标语音信号除以所述增益因子,得到所述已均衡目标语音信号;以及,
噪声信号均衡单元,用于将所述后向噪声信号除以所述增益因子,得到所述已均衡噪声信号。
优选的是,所述系统还包括:
信噪比计算模块,用于计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比;
所述目标语音信号自适应滤波模块还用于在所述信噪比大于预设门限时,更新估计出的所述目标语音信号的泄漏成分;
所述噪声信号自适应滤波模块还用于在所述信噪比小于等于所述预设门限时,更新估计出的所述噪声信号的泄漏成分。
优选的是,所述信噪比计算模块包括:
第一计算单元,用于计算所有频带下的已修正目标语音信号总量;
第二计算单元,用于计算所有频带下的已修正噪声信号总量;以及,
信噪比计算单元,用于计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为所述已修正目标语音信号与所述已修正噪声信号之间的信噪比。
优选的是,所述后置处理模块还用于对所述已修正目标语音信号进行自适应后置滤波处理,得到已后置滤波目标语音信号;及还用于基于所述已后置滤波目标语音信号,得到所述还原后的目标语音信号。
本发明的有益效果在于,本发明的基于麦克风阵列的语音降噪方法及系统通过波束成形技术将组成麦克风阵列的背靠背布置的两个无指向性麦克风构建为具有两个背向心形指向性麦克风,这可以获得主要包括目标语音信号的前向目标语音信号和主要包括噪声信号的后向噪声信号,而且本发明通过对前向目标语音信号进行频率均衡,可以有效地避免前向目标语音信号在不同的频带具有不同的缩放幅度,进而可以避免还原后的目标语音信号出现频率失真;另外,本发明在此基础上创新性地采用了对已均衡目标语音信号和已修正噪声信号均进行自适应滤波的自适应双滤波方法,彻底解决在两个麦克风采集到的声音信号均包含目标语音信号的情况下,通过自适应滤波进行降噪的同时也损害到目标语音信号的问题,进而可以从另一个方面避免还原后的目标语音信号出现失真。
附图说明
图1为根据本发明所述基于麦克风阵列的语音降噪方法的一种实施方式的流程图;
图2示出了图1所述麦克风阵列的布局结构;
图3示出了图2所示麦克风阵列接收源信号的情况;
图4示出了图1所述心形指向性麦克风的波束图,其中,实线代表前向目标语音信号的前向心形波束,虚线代表后向噪声信号的后向心形波束;
图5示出了图1所述麦克风阵列的波束形成结构图;
图6为根据本发明所述基于麦克风阵列的语音降噪系统的一种实施方式的方框原理图;
图7示出了图6所示语音降噪系统的一种实施结构;
图8示出了图6中频率均衡模块的一种实施结构;
图9为根据本发明所述基于麦克风阵列的语音降噪系统的另一种实施方式的方框原理图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
如图1至图5所示,本发明的基于麦克风阵列的语音降噪方法,包括如下步骤:
步骤S1:利用波束成形技术将组成麦克风阵列的如图4所示的背靠背布置的两个无指向性麦克风M1、M2构建为两个背向心形指向性麦克风,以得到前向目标语音信号C(l,k)和后向噪声信号B(l,k),该前向目标语音信号C(l,k)和后向噪声信号B(l,k)具体为离散的频域信号,其中,l为与时间相关的参数,k为频带。
步骤S2:对前向目标语音信号C(l,k)和后向噪声信号B(l,k)进行相同程度的频率均衡,得到已均衡目标语音信号C′(l,k)和已均衡噪声信号B′(l,k),以防止因前向目标语音信号在不同的频带具有不同的缩放幅度而导致还原后的目标语音信号出现频率失真,在此对后向噪声信号进行相同程度的频率均衡是保证后续进行的自适应双滤波的准确性。
步骤S3:对已均衡目标语音信号C′(l,k)进行以βT表示的自适应滤波处理,估计出已均衡噪声信号中存在的以βT·C′(l,k)表示的目标语音信号的泄漏成分。
步骤S4:从已均衡噪声信号B′(l,k)中去除目标语音信号的泄漏成分βT·C′(l,k),得到更加纯净的已修正噪声信号CBA(l,k)。
步骤S5:对已修正噪声信号CBA(l,k)进行以β表示的自适应滤波处理,估计出已均衡目标语音信号中存在的以β·CBA(l,k)表示的噪声信号的泄漏成分。
步骤S6:从已均衡目标语音信号C′(l,k)中去除噪声信号的泄漏成分β·CBA(l,k),得到已修正目标语音信号OUT(l,k)。通过步骤S3至步骤S6进行的自适应双滤波,保证了从已均衡目标语音信号中去除的仅为噪声信号的泄漏成分β·CBA(l,k),进而可以有效避免在降噪的同时损害目标语音信号问题的发生,保证经本发明方法还原得到的目标语音信号Yout(l,k)的真实性。
步骤S7:基于该已修正目标语音信号OUT(l,k),得到还原后的目标语音信号,即降噪输出的时域目标语音信号。
在步骤S7中,可采用直接将已修正目标语音信号OUT(l,k)转换为时域信号,得到还原后的目标语音信号的方式。在本发明中,为了进一步对已修正目标语音信号OUT(l,k)中残留的稳态噪声做进一步的有效抑制,还可进一步对已修正目标语音信号OUT(l,k)进行自适应后置滤波处理,得到已后置滤波目标语音信号Yout(l,k),最后再基于该已后置滤波目标语音信号Yout(l,k)得到还原后的目标语音信号yout(n),具体为对已后置滤波目标语音信号Yout(l,k)进行反傅里叶变换(IDFT),以将已后置滤波目标语音信号Yout(l,k)转换为时域目标语音信号yout(n),在实际应用中,该时域目标语音信号yout(n)通常经过数模转换后即可输出。在此,该自适应后置滤波处理例如可采用维纳滤波方法、卡尔曼滤波方法等手段进行,其中,采用维纳滤波方法进行自适应后置滤波处理的具体方法如图7所示可为:
分别计算已修正目标语音信号OUT(l,k)和已修正噪声信号CBA(l,k)的功率谱λout(l,k)和λB(l,k),利用功率谱λB(l,k)和λout(l,k)进行自适应后置滤波,最终输出已后置滤波目标语音信号Yout(l,k):
Yout(l,k)=G(l,k)·λout(l,k),其中G(l,k)为自适应后置滤波的增益,该增益可利用最小均方误差的方法获得:
即G(l,k)=S′(l,k)/(λB(l,k)+S′(l,k))
公式中的S′(l,k)为考虑到语音信号的短时平稳性和相关性,通过平滑递归得到的干净语音信号,其估计方法为:
S′(l,k)=0.85*Yout(l-1,k)+0.15*(λout(l,k)-λB(l,k))
其中,Yout(l-1,k)为上一时间帧输出的已后置滤波目标语音信号,λout(l,k)-λB(l,k)为初步估计得到的当前时间帧估计降噪语音信号。另外,上述自适应后置滤波的增益G(l,k)还可通过递归最小二乘滤波算法、自适应滤波的神经网络方法、基于QR分解的方法、统一模型下的自适应滤波及基于高阶累积量的自适应算法等获得。
步骤S1中利用波束成形技术将组成麦克风阵列的如图4所示的背靠背布置的两个无指向性麦克风M1、M2构建为两个背向心形指向性麦克风的具体方法如下:
如图2所示,首先使麦克风M1和麦克风M2背靠背布置,即使二者的轴向AX重合,其中的麦克风M1面向目标语音信号区域α,而麦克风M2则面向噪声信号区域β。
利用图2所示的麦克风阵列构建两个背向心形指向性麦克风,以得到前向目标语音信号和后向噪声信号的过程如下:
步骤S101:如图3所示,经麦克风M1获得时域声音信号x1(n),及经麦克风M2获得时域声音信号x2(n),其中,假设时域源信号为s(n),则经麦克风M1接收到的时域声音信号x1(n)=s(n),经麦克风M2接收到的时域声音信号x2(n)=s(n-τ),其中,时域源信号s(n)、时域声音信号x1(n)和时域声音信号x2(n)均为经过模数转换后获得的数字信号,其中n代表时间,τ为时域源信号s(n)到达麦克风M2的时间相对到达麦克风M1的时间的延迟,在此假设时域源信号s(n)的入射波方向与轴向AX的夹角为θ,则τ=dcosθ/c,其中d为麦克风M1和麦克风M2之间的间距,c为声音在空气中的传播速度,一般取c等于340米/秒。
步骤S102:将时域声音信号x1(n)和时域声音信号x2(n)从时间域变换为频率域,这具体需要先对时域声音信号进行分帧处理,再将分帧后的每帧时域声音信号进行加窗处理,最后对加窗后的每帧时域声音信号进行离散傅里叶变换(DFT),最终得到源于时域声音信号x1(n)的频域声音信号X1(l,k)和源于时域声音信号x2(n)的频域声音信号X2(l,k),具体地X1(l,k)=S(l,k),X2(l,k)=S(l,k)e-jωτ,其中S(l,k)为源于源信号s(n)的频域源信号。
步骤S103:如图5所示,以麦克风M1接收到的频域声音信号X1(l,k)减去对麦克风M2接收到的频域声音信号进行时间T延迟后的信号,得到主要包括目标语音信号的前向目标语音信号C(l,k),即C(l,k)=X1(l,k)-X2(l,k)e-jωd/c;及以麦克风M2接收到的频域声音信号X2(l,k)减去对麦克风M1接收到的频域声音信号进行时间T延时后的信号,得到主要包括噪声信号的后向噪声信号B(l,k),即:B(l,k)=X2(l,k)-X1(l,k)e-jωd/c;这里选取延迟时间T=d/c,其中d为麦克风M1和麦克风M2之间的间距,c为声音在空气中的传播速度。通过该步骤即可将麦克风M1、麦克风M2构建为两个背向心形指向性麦克风,图4示出了由麦克风M1、麦克风M2组成的麦克风阵列的波束图。
上述步骤S2中,对前向目标语音信号C(l,k)和后向噪声信号B(l,k)进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号包括:
步骤S201:提取前向目标语音信号C(l,k)相对最先到达麦克风阵列的频域声音信号X1(l,k),即频域源信号S(l,k),进行缩放的增益因子,具体为:
C(l,k)=X1(l,k)-X2(l,k)e-jωT=S(l,k)-S(l,k)e-jω(τ+T),进而得到:
C(l,k)=S(l,k)(1-e-jω(dcosθ/c+T))=S(l,k)·2sin[πf(T+dcosθ/c)];
由此可见,前向目标语音信号C(l,k)并不仅仅是频域源信号S(l,k),还乘上了一个与信号频率相关增益因子2sin[πf(T+dcosθ/c)](f为频带k对应的频率值),在此将该增益因子记为weq,该增益因子会使得前向目标语音信号在不同的频带具有不同的缩放幅度,从而导致还原后的目标语音信号的失真,因此本发明在该步骤对前向目标语音信号C(l,k)进行频率均衡,也即将该增益因子weq规整掉,就可以避免还原后的目标语音信号出现频率失真。
步骤S202:将前向目标语音信号C(l,k)除以该增益因子weq,得到已均衡目标语音信号C′(l,k)。
步骤S203:将后向噪声信号B(l,k)除以增益因子weq,得到已均衡噪声信号B′(l,k)。
为了使上述自适应双滤波可以获得更好的修正和跟踪效果,本发明利用信噪比对两路自适应滤波的估计输出的更新时间进行控制,具体为:计算已修正目标语音信号OUT(l,k)与已修正噪声信号CBA(l,k)之间的信噪比γ(l);在信噪比γ(l)大于预设门限时,认为存在目标语音信号的泄漏成分βT·C′(l,k),则更新估计出的目标语音信号的泄漏成分βT·C′(l,k);在信噪比γ(l)小于等于预设门限时,认为存在噪声信号的泄漏成分β·CBA(l,k),则更新估计出的噪声信号的泄漏成分β·CBA(l,k)。在此,该预设门限可根据麦克风阵列的应用场合设定,对于麦克风M1与需要采集的目标语音信号较近的应用场合,例如在降噪耳机中的应用,容易获得更高的信噪比,此时预设门限应设定的相对高一些,通常设定为10左右;而对于麦克风M1与需要采集的目标语音信号较远的应用场合,例如在某些固定的降噪设备中的应用,信噪比会相对较低,此时预设门限应设定的相对低一些,通常设定为5左右,基于上述说明该预设门限的参考设定范围为5至10。
上述计算已修正目标语音信号与已修正噪声信号之间的信噪比γ(l)具体可包括:计算所有频带下的已修正目标语音信号总量;计算所有频带下的已修正噪声信号总量;计算已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为已修正目标语音信号与所述已修正噪声信号之间的信噪比γ(l),公式表达为:γ(l)=∑kOUT(l,k)/∑kCBA(l,k)。
本发明的基于麦克风阵列的语音降噪方法首先通过波束成形技术将组成麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风,因此可利用该麦克风阵列获得主要包括目标语音信号的前向目标语音信号和主要包括噪声信号的后向噪声信号;之后通过对前向目标语音信号进行规整掉与频率相关的增益因子的频率均衡处理,可以避免还原后的目标语音信号出现频率失真,为了保证后续自适应双滤波的准确实施,本发明在此对后向噪声信号进行了与前向目标语音信号相同程度的频率均衡,以保证在该频率均衡步骤可对前向目标语音信号和后向噪声信号进行相同程度的缩放;在上述处理的基础上,本发明的方法创新性地采用了自适应双滤波方法对已均衡目标语音信号进行降噪处理,利用后向噪声信号和前向目标语音信号的陷零方向分别跟踪到目标语音信号的泄漏成分和噪声信号的泄漏成分,具体为首先通过对已均衡目标语音信号进行自适应滤波处理,估计出已均衡噪声信号中存在的目标语音信号的泄漏成分,也即已均衡噪声信号中具有的目标语音信号的成分,这样,本发明通过在已均衡噪声信号中去除该目标语音信号的泄漏成分的方式即可获得纯净的已修正噪声信号,此时,再对已修正噪声信号进行自适应滤波处理,即可更准确地估计出已均衡目标语音信号中存在的噪声信号的泄漏成分,因此,通过在已均衡目标语音信号中去除该已噪声信号的泄漏成分,即可有效避免在对已均衡目标语音信号进行降噪的同时损害目标语音信号问题的发生,进而可以保证经本发明方法还原得到的目标语音信号的真实性。
与上述基于麦克风阵列的语音降噪方法相对应,本发明的基于麦克风阵列的语音降噪系统包括波束形成模块1、频率均衡模块2、目标语音信号自适应滤波模块3、噪声信号修正模块4、噪声信号自适应滤波模块5、目标语音信号修正模块6和后置处理模块7,该波束形成模块1用于按照图5和图7所示的波束成形技术将组成麦克风阵列的如图4所示的背靠背布置的两个无指向性麦克风M1、M2构建为两个背向心形指向性麦克风,以得到前向目标语音信号C(l,k)和后向噪声信号B(l,k);频率均衡模块2用于对前向目标语音信号C(l,k)和后向噪声信号B(l,k)进行相同程度的频率均衡,得到已均衡目标语音信号C′(l,k)和已均衡噪声信号B′(l,k);目标语音信号自适应滤波模块3用于对已均衡目标语音信号C′(l,k)进行以βT表示的自适应滤波处理,估计出已均衡噪声信号存在的以βT·C′(l,k)表示的目标语音信号的泄漏成分;噪声信号修正模块4用于从已均衡噪声信号B′(l,k)中去除目标语音信号的泄漏成分βT·C′(l,k),得到已修正噪声信号CBA(l,k);噪声信号自适应滤波模块5用于对已修正噪声信号CBA(l,k)进行以β表征的自适应滤波处理,估计出已均衡目标语音信号中存在的以β·CBA(l,k)表示的噪声信号的泄漏成分;目标语音信号修正模块6用于从已均衡目标语音信号C′(l,k)中去除噪声信号的泄漏成分β·CBA(l,k),得到已修正目标语音信号OUT(l,k);后置处理模块7用于基于该已修正目标语音信号OUT(l,k),得到还原后的目标语音信号。
如图8所示,上述频率均衡模块2可进一步包括增益因子提取单元21、目标语音信号均衡单元22和噪声信号均衡单元23,该增益因子提取单元21用于提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子weq;目标语音信号均衡单元22用于将前向目标语音信号C(l,k)除以增益因子weq,得到已均衡目标语音信号C′(l,k);噪声信号均衡单元23用于将后向噪声信号B(l,k)除以所述增益因子weq,得到已均衡噪声信号B′(l,k)。
如图9所示,本发明的系统还可包括信噪比计算模块8,其用于计算已修正目标语音信号OUT(l,k)与所述已修正噪声信号CBA(l,k)之间的信噪比γ(l);在此基础上,上述目标语音信号自适应滤波模块3还用于在信噪比γ(l)大于预设门限时,更新估计出的目标语音信号的泄漏成分βT·C′(l,k);该噪声信号自适应滤波模块5还用于在信噪比γ(l)小于等于预设门限时,更新估计出的噪声信号的泄漏成分β·CBA(l,k)。
上述信噪比计算模块8可进一步包括第一计算单元、第二计算单元和信噪比计算单元(未图示),该第一计算单元用于计算所有频带下的已修正目标语音信号总量;该第二计算单元用于计算所有频带下的已修正噪声信号总量;该信噪比计算单元用于计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为已修正目标语音信号OUT(l,k)与已修正噪声信号CBA(l,k)之间的信噪比γ(l)。
上述后置处理模块7例如可以采用维纳滤波方法对所述已修正目标语音信号进行自适应后置滤波处理,得到已后置滤波目标语音信号Yout(l,k),最后基于已后置滤波目标语音信号Yout(l,k)得到还原后的目标语音信号yout(n)。
本发明的基于麦克风阵列的语音降噪系统首先通过波束形成模块1获得主要包括目标语音信号的前向目标语音信号和主要包括噪声信号的后向噪声信号;之后通过频率均衡模块2对前向目标语音信号进行规整掉与频率相关的增益因子的频率均衡处理,可以避免还原后的目标语音信号出现频率失真,为了保证后续自适应双滤波的准确实施,该频率均衡模块2在此对后向噪声信号进行了与前向目标语音信号相同程度的频率均衡,以保证该频率均衡模块2可对前向目标语音信号和后向噪声信号进行相同程度的缩放;在此基础上,本发明的系统创新性地通过目标语音信号自适应滤波模块3、噪声信号修正模块4、噪声信号自适应滤波模块5和目标语音信号修正模块6采用了自适应双滤波方法对已均衡目标语音信号进行降噪处理,利用后向噪声信号和前向目标语音信号的陷零方向分别跟踪到目标语音信号的泄漏成分和噪声信号的泄漏成分,具体为首先通过目标语音信号自适应滤波模块3对已均衡目标语音信号进行自适应滤波处理,估计出已均衡噪声信号中存在的目标语音信号的泄漏成分,也即已均衡噪声信号中具有的目标语音信号的成分,这样,噪声信号修正模块4通过在已均衡噪声信号中去除该目标语音信号的泄漏成分的方式即可获得纯净的已修正噪声信号,此时,再通过噪声信号自适应滤波模块5对已修正噪声信号进行自适应滤波处理,即可更准确地估计出已均衡目标语音信号中存在的噪声信号的泄漏成分,因此,通过目标语音信号修正模块6在已均衡目标语音信号中去除该噪声信号的泄漏成分,即可有效避免在对已均衡目标语音信号进行降噪的同时损害目标语音信号问题的发生,进而可以保证经本发明系统还原得到的目标语音信号的真实性。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的模块或单元可以是或者也可以不是物理上分开的,作为模块或单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上依据图式所示的实施例详细说明了本发明的构造、特征及作用效果,以上所述仅为本发明的较佳实施例,但本发明不以图面所示限定实施范围,凡是依照本发明的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本发明的保护范围内。
Claims (8)
1.一种基于麦克风阵列的语音降噪方法,其特征在于,包括:
利用波束成形技术将组成所述麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风,以得到前向目标语音信号和后向噪声信号;
对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号;
对所述已均衡目标语音信号进行自适应滤波处理,估计出所述已均衡噪声信号中存在的目标语音信号的泄漏成分;
从所述已均衡噪声信号中去除所述目标语音信号的泄漏成分,得到已修正噪声信号;
对所述已修正噪声信号进行自适应滤波处理,估计出所述已均衡目标语音信号中存在的噪声信号的泄漏成分;
从所述已均衡目标语音信号中去除所述噪声信号的泄漏成分,得到已修正目标语音信号;
计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比;
在所述信噪比大于预设门限时,更新估计出的所述目标语音信号的泄漏成分;
在所述信噪比小于等于所述预设门限时,更新估计出的所述噪声信号的泄漏成分;
基于所述已修正目标语音信号,得到还原后的目标语音信号。
2.根据权利要求1所述的方法,其特征在于,所述对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号包括:
提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子;
将所述前向目标语音信号除以所述增益因子,得到所述已均衡目标语音信号;
将所述后向噪声信号除以所述增益因子,得到所述已均衡噪声信号。
3.根据权利要求1所述的方法,其特征在于,所述计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比包括:
计算所有频带下的已修正目标语音信号总量;
计算所有频带下的已修正噪声信号总量;
计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为所述已修正目标语音信号与所述已修正噪声信号之间的信噪比。
4.根据权利要求1或2所述的方法,其特征在于,所述基于所述已修正目标语音信号,得到还原后的目标语音信号包括:
对所述已修正目标语音信号进行自适应后置滤波处理,得到已后置滤波目标语音信号;
基于所述已后置滤波目标语音信号,得到所述还原后的目标语音信号。
5.一种基于麦克风阵列的语音降噪系统,其特征在于,包括:
波束形成模块,用于利用波束成形技术将组成所述麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风,以得到前向目标语音信号和后向噪声信号;
频率均衡模块,用于对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号;
目标语音信号自适应滤波模块,用于对所述已均衡目标语音信号进行自适应滤波处理,估计出所述已均衡噪声信号中存在的目标语音信号的泄漏成分;
噪声信号修正模块,用于从所述已均衡噪声信号中去除所述目标语音信号的泄漏成分,得到已修正噪声信号;
噪声信号自适应滤波模块,用于对所述已修正噪声信号进行自适应滤波处理,估计出所述已均衡目标语音信号中存在的噪声信号的泄漏成分;
目标语音信号修正模块,用于从所述已均衡目标语音信号中去除所述噪声信号的泄漏成分,得到已修正目标语音信号;
信噪比计算模块,用于计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比;
所述目标语音信号自适应滤波模块还用于在所述信噪比大于预设门限时,更新估计出的所述目标语音信号的泄漏成分;
所述噪声信号自适应滤波模块还用于在所述信噪比小于等于所述预设门限时,更新估计出的所述噪声信号的泄漏成分;以及,
后置处理模块,用于基于所述已修正目标语音信号,得到还原后的目标语音信号。
6.根据权利要求5所述的系统,其特征在于,所述频率均衡模块包括:
增益因子提取单元,用于提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子;
目标语音信号均衡单元,用于将所述前向目标语音信号除以所述增益因子,得到所述已均衡目标语音信号;以及,
噪声信号均衡单元,用于将所述后向噪声信号除以所述增益因子,得到所述已均衡噪声信号。
7.根据权利要求5所述的系统,其特征在于,所述信噪比计算模块包括:
第一计算单元,用于计算所有频带下的已修正目标语音信号总量;
第二计算单元,用于计算所有频带下的已修正噪声信号总量;以及,
信噪比计算单元,用于计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为所述已修正目标语音信号与所述已修正噪声信号之间的信噪比。
8.根据权利要求5或6所述的系统,其特征在于,所述后置处理模块还用于对所述已修正目标语音信号进行自适应后置滤波处理,得到已后置滤波目标语音信号;及还用于基于所述已后置滤波目标语音信号,得到所述还原后的目标语音信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410468440.XA CN105489224B (zh) | 2014-09-15 | 2014-09-15 | 一种基于麦克风阵列的语音降噪方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410468440.XA CN105489224B (zh) | 2014-09-15 | 2014-09-15 | 一种基于麦克风阵列的语音降噪方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105489224A CN105489224A (zh) | 2016-04-13 |
CN105489224B true CN105489224B (zh) | 2019-10-18 |
Family
ID=55676171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410468440.XA Active CN105489224B (zh) | 2014-09-15 | 2014-09-15 | 一种基于麦克风阵列的语音降噪方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105489224B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103904B (zh) * | 2017-04-12 | 2020-06-09 | 奇瑞汽车股份有限公司 | 一种应用于车载语音识别的双麦克风降噪系统及降噪方法 |
CN107749296A (zh) * | 2017-10-12 | 2018-03-02 | 深圳市沃特沃德股份有限公司 | 语音翻译方法和装置 |
CN107742522B (zh) * | 2017-10-23 | 2022-01-14 | 科大讯飞股份有限公司 | 基于麦克风阵列的目标语音获取方法及装置 |
CN111418010B (zh) * | 2017-12-08 | 2022-08-19 | 华为技术有限公司 | 一种多麦克风降噪方法、装置及终端设备 |
CN108445450B (zh) * | 2018-04-13 | 2024-03-12 | 上海其高电子科技有限公司 | 超大规模声源定位方法 |
CN110232905B (zh) * | 2019-06-12 | 2021-08-27 | 会听声学科技(北京)有限公司 | 上行降噪方法、装置和电子设备 |
CN110415718B (zh) * | 2019-09-05 | 2020-11-03 | 腾讯科技(深圳)有限公司 | 信号生成的方法、基于人工智能的语音识别方法及装置 |
JP2022547860A (ja) * | 2019-09-11 | 2022-11-16 | ディーティーエス・インコーポレイテッド | コンテキスト適応の音声了解度を向上させる方法 |
CN111798860B (zh) | 2020-07-17 | 2022-08-23 | 腾讯科技(深圳)有限公司 | 音频信号处理方法、装置、设备及存储介质 |
CN114449410B (zh) * | 2021-11-12 | 2023-05-30 | 山东大学 | 一种多通道声纹信号同步采集系统及方法 |
CN116624793B (zh) * | 2023-07-25 | 2023-10-31 | 上海电机学院 | 一种双指向性超低压气体管道泄漏声波信号检测方法 |
CN116701921B (zh) * | 2023-08-08 | 2023-10-20 | 电子科技大学 | 多通道时序信号自适应抑噪电路 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1851806A (zh) * | 2006-05-30 | 2006-10-25 | 北京中星微电子有限公司 | 一种自适应麦克阵列系统及其语音信号处理方法 |
CN1953059A (zh) * | 2006-11-24 | 2007-04-25 | 北京中星微电子有限公司 | 一种噪声消除装置和方法 |
CN101569209A (zh) * | 2007-10-04 | 2009-10-28 | 松下电器产业株式会社 | 使用麦克风的噪声抽取装置 |
CN101779476A (zh) * | 2007-06-13 | 2010-07-14 | 爱利富卡姆公司 | 全向性双麦克风阵列 |
CN102077607A (zh) * | 2008-05-02 | 2011-05-25 | Gn奈康有限公司 | 组合至少两个音频信号的方法和包括至少两个麦克风的麦克风系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2237270B1 (en) * | 2009-03-30 | 2012-07-04 | Nuance Communications, Inc. | A method for determining a noise reference signal for noise compensation and/or noise reduction |
-
2014
- 2014-09-15 CN CN201410468440.XA patent/CN105489224B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1851806A (zh) * | 2006-05-30 | 2006-10-25 | 北京中星微电子有限公司 | 一种自适应麦克阵列系统及其语音信号处理方法 |
CN1953059A (zh) * | 2006-11-24 | 2007-04-25 | 北京中星微电子有限公司 | 一种噪声消除装置和方法 |
CN101779476A (zh) * | 2007-06-13 | 2010-07-14 | 爱利富卡姆公司 | 全向性双麦克风阵列 |
CN101569209A (zh) * | 2007-10-04 | 2009-10-28 | 松下电器产业株式会社 | 使用麦克风的噪声抽取装置 |
CN102077607A (zh) * | 2008-05-02 | 2011-05-25 | Gn奈康有限公司 | 组合至少两个音频信号的方法和包括至少两个麦克风的麦克风系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105489224A (zh) | 2016-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105489224B (zh) | 一种基于麦克风阵列的语音降噪方法及系统 | |
CN104040627B (zh) | 用于风噪声检测的方法和设备 | |
DK2608197T3 (en) | Method, device and system for noise reduction in multi-microphone array | |
CN104835503A (zh) | 一种改进gsc自适应语音增强方法 | |
CN102404671B (zh) | 噪音去除装置与噪音去除方法 | |
CN105741849A (zh) | 数字助听器中融合相位估计与人耳听觉特性的语音增强方法 | |
CN108172235A (zh) | 基于维纳后置滤波的ls波束形成混响抑制方法 | |
CN102111697A (zh) | 一种麦克风阵列降噪控制方法及装置 | |
CN104810024A (zh) | 一种双路麦克风语音降噪处理方法及系统 | |
TW201214418A (en) | Monaural noise suppression based on computational auditory scene analysis | |
CN105338450A (zh) | 一种残留回波抑制方法及装置 | |
CN101901602A (zh) | 一种利用受损听力的听阈进行降噪的方法 | |
CN111193977A (zh) | 耳机的降噪方法、自适应fir滤波器、除噪滤波器组和耳机 | |
CN112331226B (zh) | 一种针对主动降噪系统的语音增强系统及方法 | |
CN108010536A (zh) | 回声消除方法、装置、系统及存储介质 | |
CN106331969B (zh) | 有噪声语音的增强方法、系统及助听器 | |
JP2016048872A (ja) | 収音装置 | |
CN103929704B (zh) | 一种基于变换域的自适应声反馈消除的方法和系统 | |
CN106328160B (zh) | 一种基于双麦克的降噪方法 | |
CN104464745A (zh) | 一种双通道语音增强系统及其方法 | |
CN100524464C (zh) | 一种提高移动通信设备语音质量的自适应滤波方法及装置 | |
CN110858485B (zh) | 语音增强方法、装置、设备及存储介质 | |
CN106658323A (zh) | 人工耳蜗及助听器的双麦克风降噪系统和方法 | |
Lezzoum et al. | Noise reduction of speech signals using time-varying and multi-band adaptive gain control for smart digital hearing protectors | |
Huemmer et al. | A new uncertainty decoding scheme for DNN-HMM hybrid systems with multichannel speech enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |