CN113362846A

CN113362846A - 一种基于广义旁瓣相消结构的语音增强方法

Info

Publication number: CN113362846A
Application number: CN202110722390.3A
Authority: CN
Inventors: 于�玲; 常雅婷
Original assignee: Liaoning University of Technology
Current assignee: Liaoning University of Technology
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2021-09-07
Anticipated expiration: 2041-06-29
Also published as: CN113362846B

Abstract

本发明属于语音信号处理技术领域，提供一种基于广义旁瓣相消器的语音增强方法。其特征是首先分别获得两路信号，其中一路是纯净语音信号，另一路信号为噪声信号，经过时延估计和时延补偿将信号对齐。信号进入广义旁瓣相消器的主通道通过LCMV波束形成器抑制干扰和噪声，再经辅助通道的阻塞矩阵过滤掉语音信号得到噪声信号，此噪声信号作为自适应滤波器的参考信号，基于新的变步长lms算法估计噪声，再由维纳滤波器去掉非相干噪声，最终得到理想语音信号。本发明对噪声的抑制能力更强，可以输出更具信噪比的语音信号，满足实际需求。

Description

一种基于广义旁瓣相消结构的语音增强方法

技术领域

本发明属于语音信号处理技术领域，涉及到自适应波束形成语音增强方法，特别涉及一种使用广义旁瓣相消结构的语音增强方法。

背景技术

语音增强技术作为一项核心技术广泛应用于语音信号处理中。语音增强技术包括单通道语音增强、多通道语音增强和基于深度学习的语音增强三大类。在免提电话、视频会议等语音通信系统中，麦克风接收到的语音信号通常已被各种噪声污染，例如周期噪声、脉冲噪声和高斯白噪声等，这些噪声干扰人类的学习与工作。语音增强技术是利用麦克风接收语音信号，然后利用自适应滤波或波束形成等算法对信号进行处理，抑制噪声和干扰，达到增强目标语音信号的目的。

语音增强的分类方法有很多，其中按照使用的麦克风个数可将其分为单通道语音增强算法和多通道语音增强算法。单通道语音增强技术只需要对一个麦克风接收到的语音信号进行处理。虽然对硬件设备的要求简单，但可利用的语音信息较少，所以单通道语音增强技术对噪声的抑制效果并不理想。所谓多通道语音增强，即利用麦克风阵列对语音信号进行增强处理。麦克风阵列可以根据麦克风的空间位置以及语音信号的时域和频域等信息，利用波束形成准则对阵元接收到的每一通道的语音信号分别施加权重，在目标方向形成一个波束使其增益最大，使波束外的噪声信号得以消除。波束形成技术又可根据加权值是否随着语音信息改变分为固定波束成形和自适应波束成形。固定波束成形的权值与语音信号无关，只与声源和麦克风之间的距离有关，而自适应波束成形语音信号改变时加权值也可以自适应更新。其优点是使用少量的麦克风就可以对干扰噪声产生抑制。综上所述，本文拟针对传统自适应波束形成算法进行改进，使得改进后算法可以更好地抑制噪声，提高输出语音的信噪比，提高后续基于语音的应用的效果。

发明内容

针对现有技术的不足，本发明提供一种基于广义旁瓣相消结构的语音增强方法，是一种自适应波束形成的语音增强方法，本方法采用广义旁瓣相消器，并用LCMV(线性约束最小方差)波束形成器代替广义旁瓣相消器中上支路的固定波束形成器。提出一种GSC-LCMV语音增强方法，GSC为广义旁瓣相消器。

本发明的技术方案为：

一种GSC-LCMV自适应的语音增强方法，主要包括以下步骤：

第一步，分别获得两路信号，其中一路是纯净语音信号，另一路信号为噪声信号，经过时延估计和时延补偿将信号对齐。

第二步，带噪信号进入广义旁瓣相消器进行降噪处理。

2.1利用主通道的LCMV波束形成器对噪声和干扰进行抑制。

2.2利用辅助通道的阻塞矩阵过滤掉语音信号得到噪声信号。

2.3利用噪声抵消模块估计噪声。

第三步，经广义旁瓣相消器输出的信号进入维纳滤波器去掉非相干噪声，最后得到所求的语音增强之后的信号。

其优点在于：

本方法对噪声的抑制能力更强，可以输出更具信噪比的语音信号，满足实际需求。

附图说明

图1是本发明的算法流程图。

图2是本发明中LCMV波束形成方向图。

图3是本发明中带噪语音波形图和经过本发明语音增强之后的语音波形图。

具体实施方式

为使本发明实施例的目的、技术方案及其优点更加清楚，下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚完整的描述，整体算法流程图如图1所示：

第一步，时延估计和时延补偿。

按公式(1)计算各麦克风与参考麦克风的时延差值；按公式(1)给每路信号加上时延补偿时间。

因麦克风之间的位置不同，各麦克风收集到的信号会存在相对时延。其中，假设阵列中心的麦克风为参考麦克风，其时延为零，τ_n为各麦克风相对于参考麦克风的时延差值，D表示相邻麦克风间距离；c表示声速,θ表示声源与y轴方向的夹角。

第二步，带噪信号进入广义旁瓣相消器进行降噪处理。

2.1LCMV波束形成器的约束方程可以表示为公式(2)。

W_opt＝argmin_wW^HR_xW (2)。

s.t.W^HC＝f (3)。

其中，C表示约束矩阵，f表示约束矢量，R_x表示采样协方差矩阵，W^H表示波束形成权系数矢量，阵列的采样快拍是统计独立同分布的复高斯随机矢量，由公式(4)求出联合概率密度函数。

通过公式(4)对联合概率密度函数取对数，求得协方差矩阵最大似然估计为公式(5)；

利用拉格朗日子算法求得公式(6)的最优权矢量。

公式(7)求得经过LCMV波束形成器输出的语音信号。

b(k)＝w_LCMVx(k) (7)。

2.2按照公式(8)构造阻塞矩阵B，阻塞矩阵将语音信号过滤掉输出噪声信号，通过公式(9)求出带噪语音信号b(k)经阻塞矩阵求得噪声信号z(k)。

z_k＝B·b(k) (9)。

2.3阻塞矩阵输出的信号z(k)作为参考信号通过公式(10)输入到基于新的变步长lms自适应滤波器中。

y(k)＝W^T(k)X(k)

e(k)＝d(k)-y(k)＝d(k)-W^T(k)X(n)

β(k)＝λβ(k-1)+(1-λ)Δe(k) (10)。

W(k+1)＝W(k)+μX(k)e(k)

其中X(k)表示k时刻的输入信号，y(k)表示k时刻的输出信号，d(k)表示k时刻的期望信号，e(k)表示期望信号与输出信号的差，W^T表示采样信号对应时刻的系数，μ为步长因子，λ表示相关矩阵最大特征值，α(k),β(k)均表示控制步长因子的系数，Δe(k)表示前一时刻与当前时刻的期望信号与输出信号的差。

第三步，进入维纳滤波器去掉非相干噪声。

公式(11)通过Wiener-Hopf方程(维纳-霍普夫)求解相应系数。

其中R_xx(k)为麦克风阵列接受信号的自相关函数，R_ss(k)表示阵列接收信号的语音的自相关函数。

本发明属于语音信号处理技术领域，提供一种基于广义旁瓣相消器的语音增强方法。其特征是首先分别获得两路信号，其中一路是纯净语音信号，另一路信号为噪声信号，经过时延估计和时延补偿将信号对齐。信号进入广义旁瓣相消器的主通道通过LCMV波束形成器抑制干扰和噪声，再经辅助通道的阻塞矩阵过滤掉语音信号得到噪声信号，此噪声信号作为自适应滤波器的参考信号，基于新的变步长lms(最小均方自适应滤波)算法估计噪声，再由维纳滤波器去掉非相干噪声，最终得到理想语音信号。本发明对噪声的抑制能力更强，可以输出更具信噪比的语音信号，满足实际需求。

Claims

1.一种基于广义旁瓣相消结构的语音增强方法，其特征在于包括下列步骤：

第一步，时延估计和时延补偿；

按公式(1)计算各麦克风与参考麦克风的时延差值；按公式(1)给每路信号加上时延补偿时间；

其中，设阵列中心的麦克风为参考麦克风，其时延为零，τ_n为各麦克风相对于参考麦克风的时延差值，D表示相邻麦克风间距离；c表示声速,θ表示声源与y轴方向的夹角；

第二步，带噪信号进入广义旁瓣相消器进行降噪处理；

2.1LCMV波束形成器的约束方程可以表示为公式(2)；

W_opt＝argmin_wW^HR_xW (2)；

s.t.W^HC＝f (3)；

其中，C表示约束矩阵，f表示约束矢量，R_x表示采样协方差矩阵，W^H表示波束形成权系数矢量，阵列的采样快拍是统计独立同分布的复高斯随机矢量，由公式(4)求出联合概率密度函数；

利用拉格朗日子算法求得公式(6)的最优权矢量；

公式(7)求得经过LCMV波束形成器输出的语音信号；

b(k)＝w_LCMVx(k) (7)

2.2按照公式(8)构造阻塞矩阵B，阻塞矩阵将语音信号过滤掉输出噪声信号，通过公式(9)求出带噪语音信号b(k)经阻塞矩阵求得噪声信号z(k)；

z_k＝B·b(k) (9)；

2.3阻塞矩阵输出的信号z(k)作为参考信号通过公式(10)输入到基于新的变步长lms自适应滤波器中；

y(k)＝W^T(k)X(k)

e(k)＝d(k)-y(k)＝d(k)-W^T(k)X(n)

β(k)＝λβ(k-1)+(1-λ)Δe(k) (10)；

W(k+1)＝W(k)+μX(k)e(k)

其中X(k)表示k时刻的输入信号，y(k)表示k时刻的输出信号，d(k)表示k时刻的期望信号，e(k)表示期望信号与输出信号的差，W^T表示采样信号对应时刻的系数，μ为步长因子，λ表示相关矩阵最大特征值，α(k),β(k)表示控制步长因子的系数，Δe(k)表示前一时刻与当前时刻的期望信号与输出信号的差；

第三步，进入维纳滤波器去掉非相干噪声；

公式(11)通过Wiener-Hopf方程求解相应系数；

其中R_xx(k)麦克风阵列接受信号的自相关函数，R_ss(k)表示阵列接收信号的语音的自相关函数。