CN108877828B

CN108877828B - 语音增强方法/系统、计算机可读存储介质及电子设备

Info

Publication number: CN108877828B
Application number: CN201710346918.5A
Authority: CN
Inventors: 张益萍
Original assignee: Fuzhou Rockchip Electronics Co Ltd
Current assignee: Rockchip Electronics Co Ltd
Priority date: 2017-05-16
Filing date: 2017-05-16
Publication date: 2020-12-08
Anticipated expiration: 2037-05-16
Also published as: CN108877828A

Abstract

本发明提供一种语音增强方法/系统、计算机可读存储介质及电子设备，语音增强方法包括：对麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号；生成一优化的超增益波束形成器，以通过超增益波束形成器处理频域输入信号，以形成超增益波束处理输出信号；对超增益波束处理输出信号进行低频白噪声增益修正，以确定低频白噪声增益修正结果是超增益波束处理输出信号，还是延迟相加波束处理输出信号；对低频白噪声增益修正结果进行低频降噪补偿，以输出低频降噪补偿后的频域信号。本发明可以控制白噪声放大的问题，且在一定程度上增强了低频降干扰能力。不仅如此，采用本发明后，对角加载因子的选择范围缩小，且鲁棒性增强，有利于实际应用。

Description

语音增强方法/系统、计算机可读存储介质及电子设备

技术领域

本发明属于音频处理技术领域，涉及一种增强方法和系统，特别是涉及一种语音增强方法/系统、计算机可读存储介质及电子设备。

背景技术

传统的单麦克风技术提供的信息仅限于时/频信息，因此其降噪性能并不理想。而麦克风阵列可以提供空域和时/频信息，能够更好的解决该问题。

麦克风阵列信号处理的一个核心技术是波束形成技术，即将麦克风阵列的接收信号通过一定的加权，使阵列方向图在期望信号方向的增益最大，而系统总的输出功率最小，从而完成空域滤波。

根据实现方式不同，现有的波束形成技术可以分为固定波束形成技术和自适应波束形成技术。固定波束形成技术一般都与接收到的数据有关，并且其滤波器系数不随时间的变化而变化，或者说滤波器所形成的波束是固定不变的。自适应的波束形成技术相对于固定波束形成技术而言，其自适应特性表现在滤波系数是随着输入信号统计特性的变化而变化的。

延时相加波束形成和超增益波束形成是较为常用的固定波束形成方法。其中，延时相加波束形成不能抑制任何方向入射的低频噪声源。与其它方法相比，经过超增益波束形成处理，阵列的阵增益达到最大，即麦克风阵列获得最大的指向性。但超增益波束形成存在白噪声放大的问题，尤其是低频段。

但在实际应用中，常用的方法是通过在归一化自相关矩阵的主对角线元素上增加一个很小的常数(称对角加载因子)，来实现增加白噪声增益约束的目的。但是，控制白噪声增益和保持降干扰能力两者是矛盾的，因此增加白噪声增益约束必然导致超增益波束形成的降干扰能力下降。且该常数因子取值范围是从零到无穷，因此该因子很难选择，不利于实际应用。

因此，如何提供一种语音增强方法/系统、计算机可读存储介质及电子设备，以解决现有技术是通过在归一化自相关矩阵的主对角线元素上增加一个对角加载因子，来实现增加白噪声增益约束的目的，但是控制白噪声增益和保持降干扰能力两者相互矛盾，增加白噪声增益约束必然导致超增益波束形成的降干扰能力下降；且对角加载因子取值范围是从零到无穷，由于该因子很难选择，不利于实际应用等缺陷，实以成为本领域技术人员亟待解决的技术问题。

发明内容

鉴于以上所述现有技术的缺点，本发明的目的在于提供一种语音增强方法/系统、计算机可读存储介质及电子设备，用于解决现有技术中是通过在归一化自相关矩阵的主对角线元素上增加一个对角加载因子，来实现增加白噪声增益约束的目的，但是控制白噪声增益和保持降干扰能力两者相互矛盾，增加白噪声增益约束必然导致超增益波束形成的降干扰能力下降；且对角加载因子取值范围是从零到无穷，由于该因子很难选择，不利于实际应用的问题。

为实现上述目的及其他相关目的，本发明一方面提供一种语音增强方法，应用于电子设备，在所述电子设备内设置麦克风阵列；所述语音增强方法包括以下步骤：步骤一，对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号；步骤二，在保证所述麦克风阵列在期望方向上信号不失真的约束条件下，生成一优化的超增益波束形成器，以通过所述超增益波束形成器处理所述频域输入信号，以形成超增益波束处理输出信号；步骤三，在预存的延迟相加波束形成器对所述频域输入信号的处理，而形成的延迟相加波束处理输出信号的基础上，对所述超增益波束处理输出信号进行低频白噪声增益修正，以确定低频白噪声增益修正结果是所述超增益波束处理输出信号，还是所述延迟相加波束处理输出信号；步骤四，对所述低频白噪声增益修正结果进行低频降噪补偿，以输出低频降噪补偿后的频域信号。

于本发明的一实施例中，所述步骤二中生成超增益波束形成器的步骤包括：根据麦克风阵列的几何结构，构造各向同性噪声的归一化自相关矩阵；在所述归一化自相关矩阵中加入对角加载因子，以通过所述对角加载因子控制白噪声增益；在保证所述麦克风阵列在期望方向信号不失真的约束条件下，根据最小化的输出功率，以生成优化的超增益波束形成器。

于本发明的一实施例中，保证所述麦克风阵列在期望方向上信号不失真的约束条件是指未加入所述对角加载因子的超增益波束形成器的共轭转置与麦克风阵列在期望方向上的响应向量的点乘等于1。

于本发明的一实施例中，所述步骤三包括：从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限的各频点；计算从所述超增益波束处理输出信号选出的频点的频点能量，和从所述延迟相加波束处理输出信号选出的频点的频点能量；将从所述超增益波束处理输出信号选出的频点的频点能量与从所述延迟相加波束处理输出信号选出的频点的频点能量进行比较，若所述超增益波束处理输出信号选出的频点的频点能量大于从所述延迟相加波束处理输出信号选出的频点的频点能量，则判定该频点处为非相干噪声占主体，确定低频白噪声增益修正结果为所述延迟相加波束处理输出信号；若所述超增益波束处理输出信号选出的频点的频点能量小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量，则判定该频点处为语音干扰占主体，确定低频白噪声增益修正结果为所述超增益波束处理输出信号。

于本发明的一实施例中，所述步骤四包括：统计所述低频白噪声增益修正结果中高频段内的能量，及延迟相加波束处理输出信号中高频段内的能量，并将两者进行能量比较；若所述低频白噪声增益修正结果中高频段内的能量大于等于延迟相加波束处理输出信号中高频段内的能量，则表示无需进行低频降噪补偿，直接输出低频白噪声增益修正结果；若所述低频白噪声增益修正结果中高频段内的能量小于延迟相加波束处理输出信号中高频段内的能量，则继续进行低频降噪补偿，以输出低频降噪补偿后的频域信号。

于本发明的一实施例中，对所述低频白噪声增益修正结果进行低频降噪补偿的步骤包括：统计所述频域输入信号中高频内的能量；从所述超增益波束处理输出信号选出干扰性能下降一性能阈值的频率点，以作为低频降噪补偿的最高频率点；计算中高频综合降噪因子和中高频降干扰因子；根据所述中高频综合降噪因子和中高频降干扰因子，计算低频降噪补偿增益；基于所述低频降噪补偿增益，对所述超增益波束处理输出信号中的不同频点进行补偿增益计算，以获取各频点的补偿增益；根据所获取的各频点的补偿增益处理所述低频白噪声增益修正结果，以获取低频降噪补偿后频域信号，予以输出。

本发明另一发明提供一种语音增强系统，应用于电子设备，在所述电子设备内设置麦克风阵列；所述语音增强系统包括：傅里叶变换模块，用于对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号；处理模块，用于在保证所述麦克风阵列在期望方向上信号不失真的约束条件下，生成一优化的超增益波束形成器，以通过所述超增益波束形成器处理所述频域输入信号，以形成超增益波束处理输出信号；修正模块，用于在预存的延迟相加波束形成器对所述频域输入信号的处理，而形成的延迟相加波束处理输出信号的基础上，对所述超增益波束处理输出信号进行低频白噪声增益修正，通过预存的延迟相加波束形成器处理所述频域输入信号，以形成延迟相加波束处理输出信号，以确定低频白噪声增益修正结果是所述超增益波束处理输出信号，还是所述延迟相加波束处理输出信号；补偿模块，用于对所述低频白噪声增益修正结果进行低频降噪补偿，以输出低频降噪补偿后的频域信号。

于本发明的一实施例中，所述处理模块用于根据麦克风阵列的几何结构，构造各向同性噪声的归一化自相关矩阵；在所述归一化自相关矩阵中加入对角加载因子，以通过所述对角加载因子控制白噪声增益；在保证所述麦克风阵列在期望方向信号不失真的约束条件下，根据最小化的输出功率，以生成优化的超增益波束形成器。

于本发明的一实施例中，所述修改模块用于从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限的各频点；计算从所述超增益波束处理输出信号选出的频点的频点能量，和从所述延迟相加波束处理输出信号选出的频点的频点能量；将从所述超增益波束处理输出信号选出的频点的频点能量与从所述延迟相加波束处理输出信号选出的频点的频点能量进行比较，若所述超增益波束处理输出信号选出的频点的频点能量大于从所述延迟相加波束处理输出信号选出的频点的频点能量，则判定该频点处为非相干噪声占主体，确定低频白噪声增益修正结果为所述延迟相加波束处理输出信号；若所述超增益波束处理输出信号选出的频点的频点能量小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量，则判定该频点处为语音干扰占主体，确定低频白噪声增益修正结果为所述超增益波束处理输出信号。

于本发明的一实施例中，所述补偿模块用于统计所述低频白噪声增益修正结果中高频段内的能量，及延迟相加波束处理输出信号中高频段内的能量，并将两者进行能量比较；若所述低频白噪声增益修正结果中高频段内的能量大于等于延迟相加波束处理输出信号中高频段内的能量，则表示无需进行低频降噪补偿，直接输出低频白噪声增益修正结果；若所述低频白噪声增益修正结果中高频段内的能量小于延迟相加波束处理输出信号中高频段内的能量，则继续进行低频降噪补偿，以输出低频降噪补偿后的频域信号。

本发明另一方面还提供一种计算机可读存储介质，其上存储有计算机程序，程序被处理器执行时实现所述语音增强方法，

本发明另一方面又提供一种电子设备，所述电子设备包括：处理器及存储器；所述存储器用于存储计算机程序，所述处理器用于执行所述存储器存储的计算机程序，以使所述终端执行所述语音增强方法。

如上所述，本发明的语音增强方法/系统、计算机可读存储介质及电子设备，具有以下有益效果：

本发明所述的语音增强方法/系统、计算机可读存储介质及电子设备提出了超增益波束形成的修正算法，结合超增益波束形成方法和延迟相加波束形成方法的语音增强特性，根据两种波束形成方法的输出进行判断，给出综合的波束形成结果。并对输出结果的低频段进行再次噪声抑制。这样可以控制白噪声放大的问题，且在一定程度上增强了低频降干扰能力。不仅如此，采用本发明后，对角加载因子的选择范围缩小，且鲁棒性增强，有利于实际应用。

附图说明

图1显示为本发明的语音增强方法于一实施例中的流程示意图。

图2显示为本发明的语音增强方法中步骤S2的流程示意图。

图3显示为本发明的语音增强方法中步骤S3的流程示意图。

图4A显示为本发明的语音增强方法中步骤S4的流程示意图。

图4B显示为本发明的步骤S43的流程示意图。

图5显示为本发明的语音增强系统于一实施例中的原理结构示意图。

图6显示为本发明的电子设备于一实施例中的原理结构示意图。

元件标号说明

5 语音增强系统

51 傅里叶变换模块

52 处理模块

53 修正模块

54 补偿模块

6 电子设备

61 处理器

62 存储器

63 收发器

64 通信接口

65 系统总线

S1～S4 步骤

S21～S23 步骤

S31～S35 步骤

S41～S44 步骤

S441～S445 步骤

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

实施例一

本实施例提供一种语音增强方法，其特征在于，应用于电子设备，在所述电子设备内设置麦克风阵列；所述语音增强方法包括以下步骤：

步骤一，对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号；

步骤二，在保证所述麦克风阵列在期望方向上信号不失真的约束条件下，生成一优化的超增益波束形成器，以通过所述超增益波束形成器处理所述频域输入信号，以形成超增益波束处理输出信号；

步骤三，在预存的延迟相加波束形成器对所述频域输入信号的处理，而形成的延迟相加波束处理输出信号的基础上，对所述超增益波束处理输出信号进行低频白噪声增益修正，以确定低频白噪声增益修正结果是所述超增益波束处理输出信号，还是所述延迟相加波束处理输出信号；

步骤四，对所述低频白噪声增益修正结果进行低频降噪补偿，以输出低频降噪补偿后的频域信号。

以下将结合图示对本实施例所提供的语音增强方法进行详细描述。本实施例所提供的语音增强方法应用于一电子设备上，在所述电子设备内设置有1行M列的麦克风阵列(1，2，…，n，…，m，…，M)。其中，第n个麦克风与第m个麦克风之间的间距为L_nm。请参阅图1，显示为语音增强方法于一实施例中的流程示意图。如图1所示，所述语音增强方法具体包括以下几个步骤：

S1，对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号X(k)。

S2，在保证所述麦克风阵列在期望方向上信号不失真的约束条件下，生成一优化的超增益波束形成器，以通过所述超增益波束形成器处理所述频域输入信号，以形成超增益波束处理输出信号。请参阅图2，显示为步骤S2的具体流程示意图。如图2所示，所述步骤S2具体包括以下几个步骤：

S21，根据麦克风阵列的几何结构，构造各向同性噪声的归一化自相关矩阵。在本实施例中，所述归一化自相关矩阵Γ_VV(ω)中第(n，m)个元素可表示为：

其中，ω为角频率，ω＝2πf，f为时间频率，τ_nm为两麦克风间最大时延，

c为声音传播速度，n，m为麦克风个数序号。

S22，在所述归一化自相关矩阵中加入对角加载因子，以通过所述对角加载因子控制白噪声增益。在本实施例中，所述对角加载因子为μ，将对角加载因子为μ加入到归一化自相关矩阵Γ_VV(ω)中，即Γ_VV(ω)+μI，I为单位矩阵。

S23，在保证所述麦克风阵列在期望方向信号不失真的约束条件下，根据最小化的输出功率，以生成优化的超增益波束形成器W_S。在本实施例中，所述保证所述麦克风阵列在期望方向上信号不失真的约束条件是指未加入所述对角加载因子μ的超增益波束形成器W的共轭转置与麦克风阵列在期望方向上的响应向量的点乘等于1，即W^Hd＝1。

具体过程为：

求解未加入所述对角加载因子μ的超增益波束形成器W。

推知未加入所述对角加载因子μ的超增益波束形成器W

其中，W^H为未加入所述对角加载因子μ的超增益波束形成器W的共轭转置，d为麦克风阵列在期望方向上的响应向量，d^H是d的共轭转置。其中，假设麦克风阵列为均匀线性麦克风阵列，相邻间距为L₀，声源以平面波的形式传播，其入射方位与麦克风阵列成θ角度。则麦克风阵列在期望方向上的响应向量d

其中，τ₀为相邻麦克风的最大时延，

是虚实单位。

根据所述未加入所述对角加载因子μ的超增益波束形成器W，获取到优化的超增益波束形成器W_S为公式(5)所示：

在本实施例中，增加对角加载因子μ，可使低频白噪声增益增大，缓减白噪声放大问题。但是同时超增益波束形成的降干扰能力下降。当对角加载因子μ增大到一定值时，超增益波束降噪能力在整个频段内都急剧下降。因此该参数很难选择。本实施例中，对优化的超增益波束形成器处理结果进行低频修正。则在选择对角加载因子时，应避免超增益波束形成器的降干扰能力在整个频段内下降，允许低频存在负白噪声增益。由于进行了低频白噪声增益修正，因此即使低频白噪声较高时，也不会对其进行放大。而当噪声较低时，设计的超增益波束形成器仍保持较好的抗干扰能力。

S3，在预存的延迟相加波束形成器对所述频域输入信号的处理，而形成的延迟相加波束处理输出信号的基础上，对所述超增益波束处理输出信号进行低频白噪声增益修正，以确定低频白噪声增益修正结果是所述超增益波束处理输出信号，还是所述延迟相加波束处理输出信号。在本实施例中，延迟相加波束处理输出信号为Y_D(k)，超增益波束处理输出信号Y_S(k)。

在本实施例中，预存的延迟相加波束形成算法不会产生白噪声放大，且在整个频带内降低白噪的能力要高于超增益波束形成算法。而超增益波束形成算法在整个频带内降干扰能力要高于延迟相加波束形成算法。

请参阅图3，显示为步骤S3具体包括以下几个步骤：

S31，从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限f_th的各频点。在本实施例中，所述预设低频限f_th小于所述优化的超增益波束形成器白噪声增益为0dB的频点对应的频率。

S32，计算从所述超增益波束处理输出信号Y_S(k)选出的频点的频点能量P_S(k)，和从所述延迟相加波束处理输出信号Y_D(k)选出的频点的频点能量P_D(k)。

其中，P_S(k)＝|Y_S(k)|²，P_D(k)＝|Y_D(k)|²，k为频率索引。

S33，将从所述超增益波束处理输出信号选出的频点的频点能量P_S(k)与从所述延迟相加波束处理输出信号选出的频点的频点能量P_D(k)进行比较，即判断所述超增益波束处理输出信号选出的频点的频点能量P_S(k)小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量P_D(k)，若所述超增益波束处理输出信号选出的频点的频点能量P_S(k)大于从所述延迟相加波束处理输出信号选出的频点的频点能量P_D(k)，则执行步骤S34，即判定该频点处为非相干噪声占主体，确定低频白噪声增益修正结果Y_SM(k)为所述延迟相加波束处理输出信号Y_D(k)；若所述超增益波束处理输出信号选出的频点的频点能量P_S(k)小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量P_D(k)，则执行步骤S35，即判定该频点处为语音干扰占主体，确定低频白噪声增益修正结果Y_SM(k)为所述超增益波束处理输出信号Y_S(k)。

S4，对所述低频白噪声增益修正结果进行低频降噪补偿，以输出低频降噪补偿后的频域信号。请参阅图4A，显示为步骤S4的流程示意图。如图4A所示，所述步骤S4具体包括以下几个步骤：

S41，统计所述低频白噪声增益修正结果中高频段内的能量P_SM,band(k)，及延迟相加波束处理输出信号中高频段内的能量P_D,band(k)，并将两者进行能量比较。中高频段内为(f_th，3400Hz)。

在本实施例中，

k₁，k_h分别是f_th和3400Hz之间所对应的频率索引。

S42，判断所述低频白噪声增益修正结果中高频段内的能量是否P_SM,band(k)小于延迟相加波束处理输出信号中高频段内的能量P_D,band(k)。

S43，若所述低频白噪声增益修正结果中高频段内的能量P_SM,band(k)大于等于延迟相加波束处理输出信号中高频段内的能量P_D,band(k)，则表示无需进行低频降噪补偿(即判断所述麦克风阵列中输入信号无干扰或干扰很小)，直接输出低频白噪声增益修正结果Y_SM(k)。

S44，若所述低频白噪声增益修正结果中高频段内的能量P_SM,band(k)小于延迟相加波束处理输出信号中高频段内的能量P_D,band(k)，则进行低频降噪补偿，以输出低频降噪补偿后的频域信号。请参阅图4B，显示为步骤S43的流程示意图。如图4B所示，所述步骤S44具体包括以下几个步骤：

S441，统计所述频域输入信号中高频内的能量。在本实施例中，所述频域输入信号中高频内的能量P_X,band。

S442，从所述超增益波束处理输出信号选出干扰性能下降一性能阈值(于本实施例中，性能阈值为2dB)的频率点f_low，以作为低频降噪补偿的最高频率点。频率点f_low对应频率索引为k_low。

S443，计算中高频综合降噪因子factor_x和中高频降干扰因子factor_s。

所述中高频综合降噪因子factor_x的计算公式如下：

所述中高频降干扰因子factor_s的计算公式如下：

factor_s＝(1-((P_D,band(k)-P_SM,band(k)/P_X,band(k))^1/2)² 公式(7)

S444，根据所述中高频综合降噪因子和中高频降干扰因子，计算低频降噪补偿增益G。

G＝1-(factor_x+factor_s)/2(G≤1) 公式(8)

S445，基于所述低频降噪补偿增益，对所述超增益波束处理输出信号中的不同频点进行补偿增益计算，以获取各频点的补偿增益G(k)。

在本实施例中，各频点的补偿增益G(k)＝G·(1-k/k_low)，k≤k_low。

根据所获取的各频点的补偿增益G(k)处理所述低频白噪声增益修正结果，以获取低频降噪补偿后频域信号，予以输出。

通过G(k)处理低频白噪声增益修正结果Y_SM(k)的计算公式如下：

Y(k)＝(1-G(k))·Y_SM(k)，k≤k_low 公式(9)

本实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述的语音增强方法。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

本实施例所述的语音增强方法及计算机可读存储介质提出了超增益波束形成的修正算法，结合超增益波束形成方法和延迟相加波束形成方法的语音增强特性，根据两种波束形成方法的输出进行判断，给出综合的波束形成结果。并对输出结果的低频段进行再次噪声抑制。这样可以控制白噪声放大的问题，且在一定程度上增强了低频降干扰能力。不仅如此，采用本发明后，对角加载因子的选择范围缩小，且鲁棒性增强，有利于实际应用。

实施例二

本实施例提供一种语音增强系统，应用于电子设备，在所述电子设备内设置麦克风阵列；所述语音增强系统包括：

傅里叶变换模块，用于对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号；

处理模块，用于在保证所述麦克风阵列在期望方向上信号不失真的约束条件下，生成一优化的超增益波束形成器，以通过所述超增益波束形成器处理所述频域输入信号，以形成超增益波束处理输出信号；

修正模块，用于在预存的延迟相加波束形成器对所述频域输入信号的处理，而形成的延迟相加波束处理输出信号的基础上，对所述超增益波束处理输出信号进行低频白噪声增益修正，通过预存的延迟相加波束形成器处理所述频域输入信号，以形成延迟相加波束处理输出信号，以确定低频白噪声增益修正结果是所述超增益波束处理输出信号，还是所述延迟相加波束处理输出信号；

补偿模块，用于对所述低频白噪声增益修正结果进行低频降噪补偿，以输出低频降噪补偿后的频域信号。

以下将集合图示对本实施例所提供的语音增强系统进行详细说明。需要说明的是，应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，x模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(ApplicationSpecificIntegratedCircuit，简称ASIC)，或，一个或多个微处理器(digitalsingnalprocessor，简称DSP)，或，一个或者多个现场可编程门阵列(FieldProgrammableGateArray，简称FPGA)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(CentralProcessingUnit，简称CPU)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，简称SOC)的形式实现。

请参阅图5，显示为语音增强系统于一实施例中的原理结构示意图。如图5所示，所述语音增强系统5包括：傅里叶变换模块51、处理模块52、修正模块53、及补偿模块54。

所述傅里叶变换模块51用于对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号。

与所述傅里叶变换模块51连接的处理模块52用于在保证所述麦克风阵列在期望方向上信号不失真的约束条件下，生成一优化的超增益波束形成器，以通过所述超增益波束形成器处理所述频域输入信号，以形成超增益波束处理输出信号。

具体地，所述处理模块52用于：

根据麦克风阵列的几何结构，构造各向同性噪声的归一化自相关矩阵。在本实施例中，所述归一化自相关矩阵Γ_VV(ω)中第(n，m)个元素可表示为

c为声音传播速度，n，m为麦克风个数序号。

在所述归一化自相关矩阵中加入对角加载因子，以通过所述对角加载因子控制白噪声增益。在本实施例中，所述对角加载因子为μ，将对角加载因子为μ加入到归一化自相关矩阵Γ_VV(ω)中，即Γ_VV(ω)+μI，I为单位矩阵。

在保证所述麦克风阵列在期望方向信号不失真的约束条件下，根据最小化的输出功率，以生成优化的超增益波束形成器W_S。在本实施例中，所述保证所述麦克风阵列在期望方向上信号不失真的约束条件是指未加入所述对角加载因子μ的超增益波束形成器W的共轭转置与麦克风阵列在期望方向上的响应向量的点乘等于1，即W^Hd＝1。

所述处理模块求解优化的超增益波束形成器W_S过程为：求解未加入所述对角加载因子μ的超增益波束形成器W。根据

推知未加入所述对角加载因子μ的超增益波束形成器W，

其中，W^H为未加入所述对角加载因子μ的超增益波束形成器W的共轭转置，d为麦克风阵列在期望方向上的响应向量，d^H是d的共轭转置。其中，假设麦克风阵列为均匀线性麦克风阵列，相邻间距为L₀，声源以平面波的形式传播，其入射方位与麦克风阵列成θ角度。则麦克风阵列在期望方向上的响应向量d，

其中，τ₀为相邻麦克风的最大时延，

是虚实单位。根据所述未加入所述对角加载因子μ的超增益波束形成器W，获取到优化的超增益波束形成器W_S，

在本实施例中，所述处理模块52增加对角加载因子μ，可使低频白噪声增益增大，缓减白噪声放大问题。但是同时超增益波束形成的降干扰能力下降。当对角加载因子μ增大到一定值时，超增益波束降噪能力在整个频段内都急剧下降。因此该参数很难选择。本实施例中，对优化的超增益波束形成器处理结果进行低频修正。则在选择对角加载因子时，应避免超增益波束形成器的降干扰能力在整个频段内下降，允许低频存在负白噪声增益。由于进行了低频白噪声增益修正，因此即使低频白噪声较高时，也不会对其进行放大。而当噪声较低时，设计的超增益波束形成器仍保持较好的抗干扰能力。

与所述傅里叶模块51和处理模块52连接的修改模块53用于在预存的延迟相加波束形成器对所述频域输入信号的处理，而形成的延迟相加波束处理输出信号的基础上，对所述超增益波束处理输出信号进行低频白噪声增益修正，以确定低频白噪声增益修正结果是所述超增益波束处理输出信号，还是所述延迟相加波束处理输出信号。在本实施例中，延迟相加波束处理输出信号为Y_D(k)，超增益波束处理输出信号Y_S(k)。

具体地，所述修改模块53用于从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限f_th的各频点。在本实施例中，所述预设低频限f_th小于所述优化的超增益波束形成器白噪声增益为0dB的频点对应的频率。

计算从所述超增益波束处理输出信号Y_S(k)选出的频点的频点能量P_S(k)，和从所述延迟相加波束处理输出信号Y_D(k)选出的频点的频点能量P_D(k)。其中，P_S(k)＝|Y_S(k)|²，P_D(k)＝|Y_D(k)|²，k为频率索引。

将从所述超增益波束处理输出信号选出的频点的频点能量P_S(k)与从所述延迟相加波束处理输出信号选出的频点的频点能量P_D(k)进行比较，若所述超增益波束处理输出信号选出的频点的频点能量P_S(k)大于从所述延迟相加波束处理输出信号选出的频点的频点能量P_D(k)，则判定该频点处为非相干噪声占主体，确定低频白噪声增益修正结果Y_SM(k)为所述延迟相加波束处理输出信号Y_D(k)；若所述超增益波束处理输出信号选出的频点的频点能量P_S(k)小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量P_D(k)，则判定该频点处为语音干扰占主体，确定低频白噪声增益修正结果Y_SM(k)为所述超增益波束处理输出信号Y_S(k)。

与所述处理模块52和修改模块53连接的补偿模块54用于对所述低频白噪声增益修正结果进行低频降噪补偿，以输出低频降噪补偿后的频域信号。

具体地，所述补偿模块54用于统计所述低频白噪声增益修正结果中高频段内的能量P_SM,band(k)，及延迟相加波束处理输出信号中高频段内的能量P_D,band(k)，并将两者进行能量比较。中高频段内为(f_th，3400Hz)。在本实施例中，

k₁，k_h分别是f_th和3400Hz之间所对应的频率索引。

若所述低频白噪声增益修正结果中高频段内的能量P_SM,band(k)大于等于延迟相加波束处理输出信号中高频段内的能量P_D,band(k)，则表示无需进行低频降噪补偿(即判断所述麦克风阵列中输入信号无干扰或干扰很小)，所述补偿模块54直接输出低频白噪声增益修正结果Y_SM(k)。

若所述低频白噪声增益修正结果中高频段内的能量P_SM,band(k)小于延迟相加波束处理输出信号中高频段内的能量P_D,band(k)，则继续进行低频降噪补偿，以输出低频降噪补偿后的频域信号。所述补偿模块54进行低频降噪补偿的过程包括：

统计所述频域输入信号中高频内的能量。

在本实施例中，所述频域输入信号中高频内的能量P_X,band。从所述超增益波束处理输出信号选出干扰性能下降一性能阈值(于本实施例中，性能阈值为2dB)的频率点f_low，以作为低频降噪补偿的最高频率点。频率点f_low对应频率索引为k_low。计算中高频综合降噪因子factor_x和中高频降干扰因子factor_s。所述中高频综合降噪因子factor_x的计算公式为：

所述中高频降干扰因子factor_s的计算公式为：

factor_s＝(1-((P_D,band(k)-P_SM,band(k)/P_X,band(k))^1/2)²

根据所述中高频综合降噪因子和中高频降干扰因子，计算低频降噪补偿增益G。低频降噪补偿增益G的计算公式为：

G＝1-(factor_x+factor_s)/2(G≤1)

基于所述低频降噪补偿增益，对所述超增益波束处理输出信号中的不同频点进行补偿增益计算，以获取各频点的补偿增益G(k)。

根据所获取的各频点的补偿增益G(k)处理所述低频白噪声增益修正结果，以获取低频降噪补偿后频域信号，予以输出。通过G(k)处理低频白噪声增益修正结果Y_SM(k)的计算公式为：Y(k)＝(1-G(k))·Y_SM(k)，k≤k_low。

需要说明的是，应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，x模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

实施例三

本实施例提供一种电子设备6，请参阅图6，显示为电子设备于电子设备于一实施例中的原理结构示意图。如图6所示，本实例提供的电子设备6，包括：处理器61、存储器62、收发器63、通信接口64和系统总线65；存储器和通信接口通过系统总线与处理器和收发器连接并完成相互间的通信，存储器用于存储计算机程序，通信接口用于和其他设备进行通信，处理器和收发器用于运行计算机程序，使电子设备6执行如实施例一所提供的语音增强方法的各个步骤。

上述提到的系统总线可以是外设部件互连标准(PeripheralPomponentInterconnect，简称PCI)总线或扩展工业标准结构(ExtendedIndustryStandardArchitecture，简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(RandomAccessMemory，简称RAM)，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。

上述的处理器可以是通用处理器，包括中央处理器(CentralProcessingUnit，简称CPU)、网络处理器(NetworkProcessor，简称NP)等；还可以是数字信号处理器(DigitalSignalProcessing，简称DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit，简称ASIC)、现场可编程门阵列(Field－ProgrammableGateArray，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

综上所述，本发明所述的语音增强方法/系统、计算机可读存储介质及电子设备提出了超增益波束形成的修正算法，结合超增益波束形成方法和延迟相加波束形成方法的语音增强特性，根据两种波束形成方法的输出进行判断，给出综合的波束形成结果。并对输出结果的低频段进行再次噪声抑制。这样可以控制白噪声放大的问题，且在一定程度上增强了低频降干扰能力。不仅如此，采用本发明后，对角加载因子的选择范围缩小，且鲁棒性增强，有利于实际应用。所以，本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

Claims

1.一种语音增强方法，其特征在于，应用于电子设备，在所述电子设备内设置麦克风阵列；所述语音增强方法包括以下步骤：

步骤三，在预存的延迟相加波束形成器对所述频域输入信号的处理，而形成的延迟相加波束处理输出信号的基础上，对所述超增益波束处理输出信号进行低频白噪声增益修正，以确定低频白噪声增益修正结果是所述超增益波束处理输出信号，还是所述延迟相加波束处理输出信号；所述步骤三包括：从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限的各频点；计算从所述超增益波束处理输出信号选出的频点的频点能量，和从所述延迟相加波束处理输出信号选出的频点的频点能量；将从所述超增益波束处理输出信号选出的频点的频点能量与从所述延迟相加波束处理输出信号选出的频点的频点能量进行比较，若所述超增益波束处理输出信号选出的频点的频点能量大于从所述延迟相加波束处理输出信号选出的频点的频点能量，则判定该频点处为非相干噪声占主体，确定低频白噪声增益修正结果为所述延迟相加波束处理输出信号；若所述超增益波束处理输出信号选出的频点的频点能量小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量，则判定该频点处为语音干扰占主体，确定低频白噪声增益修正结果为所述超增益波束处理输出信号；

步骤四，对所述低频白噪声增益修正结果进行低频降噪补偿，以输出低频降噪补偿后的频域信号；所述步骤四包括：统计所述低频白噪声增益修正结果中高频段内的能量，及延迟相加波束处理输出信号中高频段内的能量，并将两者进行能量比较；若所述低频白噪声增益修正结果中高频段内的能量大于等于延迟相加波束处理输出信号中高频段内的能量，则表示无需进行低频降噪补偿，直接输出低频白噪声增益修正结果；若所述低频白噪声增益修正结果中高频段内的能量小于延迟相加波束处理输出信号中高频段内的能量，则继续进行低频降噪补偿，以输出低频降噪补偿后的频域信号。

2.根据权利要求1所述的语音增强方法，其特征在于：所述步骤二中生成超增益波束形成器的步骤包括：

根据麦克风阵列的几何结构，构造各向同性噪声的归一化自相关矩阵；

在所述归一化自相关矩阵中加入对角加载因子，以通过所述对角加载因子控制白噪声增益；

在保证所述麦克风阵列在期望方向信号不失真的约束条件下，根据最小化的输出功率，以生成优化的超增益波束形成器。

3.根据权利要求2所述的语音增强方法，其特征在于：保证所述麦克风阵列在期望方向上信号不失真的约束条件是指未加入所述对角加载因子的超增益波束形成器的共轭转置与麦克风阵列在期望方向上的响应向量的点乘等于1。

4.根据权利要求1所述的语音增强方法，其特征在于：对所述低频白噪声增益修正结果进行低频降噪补偿的步骤包括：

统计所述频域输入信号中高频内的能量；

从所述超增益波束处理输出信号选出干扰性能下降一性能阈值的频率点，以作为低频降噪补偿的最高频率点；

计算中高频综合降噪因子和中高频降干扰因子；

根据所述中高频综合降噪因子和中高频降干扰因子，计算低频降噪补偿增益；

基于所述低频降噪补偿增益，对所述超增益波束处理输出信号中的不同频点进行补偿增益计算，以获取各频点的补偿增益；

根据所获取的各频点的补偿增益处理所述低频白噪声增益修正结果，以获取低频降噪补偿后频域信号，予以输出。

5.一种语音增强系统，其特征在于，应用于电子设备，在所述电子设备内设置麦克风阵列；所述语音增强系统包括：

修正模块，用于在预存的延迟相加波束形成器对所述频域输入信号的处理，而形成的延迟相加波束处理输出信号的基础上，对所述超增益波束处理输出信号进行低频白噪声增益修正，通过预存的延迟相加波束形成器处理所述频域输入信号，以形成延迟相加波束处理输出信号，以确定低频白噪声增益修正结果是所述超增益波束处理输出信号，还是所述延迟相加波束处理输出信号；其中，所述修正模块从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限的各频点；计算从所述超增益波束处理输出信号选出的频点的频点能量，和从所述延迟相加波束处理输出信号选出的频点的频点能量；将从所述超增益波束处理输出信号选出的频点的频点能量与从所述延迟相加波束处理输出信号选出的频点的频点能量进行比较，若所述超增益波束处理输出信号选出的频点的频点能量大于从所述延迟相加波束处理输出信号选出的频点的频点能量，则判定该频点处为非相干噪声占主体，确定低频白噪声增益修正结果为所述延迟相加波束处理输出信号；若所述超增益波束处理输出信号选出的频点的频点能量小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量，则判定该频点处为语音干扰占主体，确定低频白噪声增益修正结果为所述超增益波束处理输出信号；

补偿模块，用于对所述低频白噪声增益修正结果进行低频降噪补偿，以输出低频降噪补偿后的频域信号；所述补偿模块统计所述低频白噪声增益修正结果中高频段内的能量，及延迟相加波束处理输出信号中高频段内的能量，并将两者进行能量比较；若所述低频白噪声增益修正结果中高频段内的能量大于等于延迟相加波束处理输出信号中高频段内的能量，则表示无需进行低频降噪补偿，直接输出低频白噪声增益修正结果；若所述低频白噪声增益修正结果中高频段内的能量小于延迟相加波束处理输出信号中高频段内的能量，则继续进行低频降噪补偿，以输出低频降噪补偿后的频域信号。

6.根据权利要求5所述的语音增强系统，其特征在于：所述处理模块用于根据麦克风阵列的几何结构，构造各向同性噪声的归一化自相关矩阵；在所述归一化自相关矩阵中加入对角加载因子，以通过所述对角加载因子控制白噪声增益；在保证所述麦克风阵列在期望方向信号不失真的约束条件下，根据最小化的输出功率，以生成优化的超增益波束形成器。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，程序被处理器执行时实现权利要求1至4中任一项所述语音增强方法。

8.一种电子设备，其特征在于，所述电子设备包括：处理器及存储器；

所述存储器用于存储计算机程序，所述处理器用于执行所述存储器存储的计算机程序，以使所述电子设备执行如权利要求1至4中任一项所述语音增强方法。