CN109767783A

CN109767783A - 语音增强方法、装置、设备及存储介质

Info

Publication number: CN109767783A
Application number: CN201910117712.4A
Authority: CN
Inventors: 朱虎; 王鑫山; 李国梁; 曾端; 郭红敬
Original assignee: Shenzhen Huiding Technology Co Ltd
Current assignee: Shenzhen Goodix Technology Co Ltd
Priority date: 2019-02-15
Filing date: 2019-02-15
Publication date: 2019-05-17
Anticipated expiration: 2039-02-15
Also published as: EP3696814A1; US20200265857A1; CN109767783B; US11056130B2

Abstract

本发明提供一种语音增强方法、装置、设备及存储介质。该方法，包括：采集第一路语音信号和第二路语音信号；获取所述第一路语音信号的信噪比；根据所述第一路语音信号的信噪比，确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数；根据所述融合系数，对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理，得到语音增强信号。从而实现了根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数，从而改善语音融合后的信号质量，提升语音增强的效果。

Description

语音增强方法、装置、设备及存储介质

技术领域

本申请涉及语音处理技术领域，尤其涉及一种语音增强方法、装置、设备及存储介质。

背景技术

语音增强是语音信号处理的重要环节，通过对语音信号的增强，可以提高噪声环境下语音的清晰度，可懂度和舒适度，从而改善人的听觉感知效果。在语音处理系统中，对各种语音信号进行处理之前，往往需要先进行语音增强处理，从而减小噪声对语音处理系统的影响。

目前，一般采用将非空气传导语音传感器和空气传导语音传感器结合的方式来改善语音质量。根据非空气传导语音传感器确定有声/无声段，并将确定的有声段表示应用于空气传导语音传感器，以取出其中的语音信号。

但是，非空气传导语音传感器的高频语音信号容易受到高频噪声的干扰，导致高频部分的语音信号损失严重，从而影响输出的语音信号的质量。

发明内容

本发明提供一种语音增强方法、装置、设备及存储介质，可以根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数，从而改善语音融合后的信号质量，提升语音增强的效果。

第一方面，本发明实施例提供一种语音增强方法，包括：

采集第一路语音信号和第二路语音信号；

获取所述第一路语音信号的信噪比；

根据所述第一路语音信号的信噪比，确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数；

根据所述融合系数，对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理，得到语音增强信号。

可选地，采集第一路语音信号和第二路语音信号，包括：

通过空气传导语音传感器采集第一路语音信号，通过非空气传导语音传感器采集第二路语音信号；其中，所述非空气传导语音传感器包括：骨传导语音感器；所述空气传导语音传感器包括：麦克风。

可选地，获取所述第一路语音信号的信噪比，包括：

对所述第一路语音信号进行预处理，得到预处理信号；

对所述预处理信号进行傅里叶转换处理，得到对应的频域信号；

估计所述频域信号的噪声功率，并基于所述噪声功率得到所述第一路语音信号的信噪比。

可选地，在获取所述第一路语音信号的信噪比之后，还包括：

根据所述第一路语音信号的信噪比，确定所述第一路语音信号对应的第一滤波器的截止频率，以及所述第二路语音信号对应的第二滤波器的截止频率；

通过所述第一滤波器对所述第一路语音信号进行滤波处理，得到第一滤波信号；通过所述第二滤波器对所述第二路语音信号进行滤波处理，得第二滤波信号。

可选地，根据所述第一路语音信号的信噪比，确定所述第一路语音信号对应的第一滤波器的截止频率，以及所述第二路语音信号对应的第二滤波器的截止频率，包括：

获取所述第一路语音信号的每一帧语音的先验信噪比；

确定预设的频段范围内，先验信噪比连续变大的频点数；

根据所述频率数、所述第一路语音信号的采样频率、傅里叶变换的采样点数，计算得到所述第一滤波器和第二滤波器的截止频率。

可选地，根据所述第一路语音信号的信噪比，确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数，包括：

构建融合系数的解算模型，所述融合系数的解算模型如下：

k_λ＝γk_λ-1+(1-γ)f(SNR)

其中：f(SNR)＝0.5·tanh(0.025·SNR)+0.5

k_λ＝max[0,f(SNR)]或者k_λ＝min[f(SNR),1]

其中：k_λ为第λ帧语音信号的融合系数，γ为融合系数的平滑因子，k_λ-1为第λ-1帧语音信号的融合系数，f(SNR)为给定信噪比SNR和融合系数k_λ之间的映射函数。

可选地，根据所述融合系数，对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理，得到语音增强信号，包括：

采用预设的语音融合算法，对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理；其中，预设的语音融合算法的计算公式如下：

s＝s_bc+k·s_ac

其中：s为融合后的语音增强信号，s_ac为第一路语音信号对应的滤波信号，s_bc为第二路语音信号对应的滤波信号，k为融合系数。

第二方面，本发明实施例提供一种语音增强装置，包括：

采集模块，用于采集第一路语音信号和第二路语音信号；

获取模块，用于获取所述第一路语音信号的信噪比；

确定模块，用于根据所述第一路语音信号的信噪比，确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数；

融合模块，用于根据所述融合系数，对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理，得到语音增强信号。

可选地，所述采集模块，具体用于：

可选地，所述获取模块，具体用于：

对所述第一路语音信号进行预处理，得到预处理信号；

可选地，还包括：

滤波模块，用于根据所述第一路语音信号的信噪比，确定所述第一路语音信号对应的第一滤波器的截止频率，以及所述第二路语音信号对应的第二滤波器的截止频率；

获取所述第一路语音信号的每一帧语音的先验信噪比；

确定预设的频段范围内，先验信噪比连续变大的频点数；

可选地，所述确定模块，具体用于：

构建融合系数的解算模型，所述融合系数的解算模型如下：

k_λ＝γk_λ-1+(1-γ)f(SNR)

其中：f(SNR)＝0.5·tanh(0.025·SNR)+0.5

k_λ＝max[0,f(SNR)]或者k_λ＝min[f(SNR),1]

可选地，所述融合模块，具体用于：

s＝s_bc+k·s_ac

第三方面，本发明实施例提供一种语音增强设备，包括：信号处理器和存储器；所述存储器中存储有算法程序，所述信号处理器用于调取所述存储器中的算法程序，执行如第一方面中任一项所述的语音增强方法。

第四方面，本发明实施例提供一种计算机可读存储介质，包括：程序指令，当其在计算机上运行时，使得计算机执行所述程序指令，以实现如第一方面中任一项所述的语音增强方法。

本发明提供的语音增强方法、装置、设备及存储介质，通过采集第一路语音信号和第二路语音信号；获取所述第一路语音信号的信噪比；根据所述第一路语音信号的信噪比，确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数；根据所述融合系数，对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理，得到语音增强信号。从而实现了根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数，从而改善语音融合后的信号质量，提升语音增强的效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一应用场景的原理示意图；

图2为本发明实施例一提供的语音增强方法的流程图；

图3为本发明实施例二提供的语音增强方法的流程图；

图4为本发明实施例提供的高通滤波器和低通滤波器设计图；

图5为本发明实施例三提供的语音增强装置的结构示意图；

图6为本发明实施例四提供的语音增强装置的结构示意图；

图7为本发明实施例五提供的语音增强设备的结构示意图。

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开提到的概念。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例，能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含。例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

下面以具体的实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

目前，一般采用将非空气传导语音传感器和空气传导语音传感器结合的方式来改善语音质量。根据非空气传导语音传感器确定有声/无声段，并将确定的有声段表示应用于空气传导语音传感器，以取出其中的语音信号。这是利用在带噪情况下，空气传导语音传感器语音的频谱很杂乱，没有规律。而骨传导传感器语音，具有低频信号完整、频谱干净的特点，且不易受外界噪声的影响。

但是，现有的传统单通道降噪性能严重依赖于噪声估计的准确性，噪声估计过大容易噪声语音损失，残留音乐噪声，噪声估计过小则残留噪声严重，影响语音的可懂度；而现有根据骨传导语音的特点，将非空气传导传感器语音的低频代替受噪声干扰的空气传导传感器低频，然后与空气传导传感器语音高频叠加，重新合成语音信号。这种做法在空气传导传感器语音的高频同样受到严重噪声干扰，很难得到高质量的语音；而现有的骨传导语音和空气传导语音之间的融合并没有考虑SNR(Signal to Noise Ratio，信噪比)的影响并且融合系数固定，很难具有对环境的自适应；此外骨传导传感器语音、空气传导传感器干净语音和带噪语音之间映射虽然效果很好，但是模型的建立比较复杂，算法资源开销太大，不利于可穿戴设备的采用。

本发明提供一种语音增强方法，可以根据环境噪声SNR来自适应的调整骨传导语音和空气传导语音的融合系数，这种做法可以避免单通道语音增强中对于噪声估计的依赖，可以适应环境噪声的变化和空气传导语音的高频受到严重噪声干扰的场景，能很好的消除背景噪声和残余音乐噪声。本发明提供的语音增强方法，能够运用于语音信号处理技术领域，并适用于低功耗语音增强、语音识别、语音交互产品中，包括但不限于耳机、助听器、手机、可穿戴设备、智能家居等。

在具体的实现过程中，图1为本发明一应用场景的原理示意图，如图1所示，y_ac表示通过空气传导语音传感器采集的第一路语音信号，y_bc表示通过非空气传导语音传感器采集的第二路语音信号。其中，非空气传导语音传感器包括：骨传导语音感器；空气传导语音传感器包括：麦克风。然后，对一路语音信号进行处理，获取第一路语音信号的信噪比SNR。具体地，对第一路语音信号进行预处理，得到预处理信号；对预处理信号傅里叶转换处理，得到对应的频域信号；估计频域信号的噪声功率，并基于噪声功率得到第一路语音信号的信噪比。然后，根据第一路语音信号的信噪比，确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数k。可选地，还可以根据第一路语音信号的信噪比自适应地计算出滤波器的截止频率，从而通对应的滤波器得到第一滤波信号s_ac和得第二滤波信号s_bc。最后，根据融合系数k，对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理，得到语音增强信号S。

应用上述方法可以实现根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数，从而改善语音融合后的信号质量，提升语音增强的效果。

下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本发明的实施例进行描述。

图2为本发明实施例一提供的语音增强方法的流程图，如图2所示，本实施例中的方法可以包括：

S101、采集第一路语音信号和第二路语音信号。

本实施例中，通过空气传导语音传感器采集第一路语音信号，通过非空气传导语音传感器采集第二路语音信号；其中，非空气传导语音传感器包括：骨传导语音感器；空气传导语音传感器包括：麦克风。

S102、获取第一路语音信号的信噪比。

本实施例中，对第一路语音信号进行预处理，得到预处理信号；对预处理信号进行傅里叶转换处理，得到对应的频域信号；估计频域信号的噪声功率，并基于噪声功率得到第一路语音信号的信噪比。

具体地，首先对通过空气传导语音传感器采集第一路语音信号进行预处理，主要包括预加重处理，滤除低频成分，增强高频语音成分、重叠加窗处理，以避免帧与帧信号之间重叠导致突变的情况。然后，通过傅里叶转换处理，进行时域信号与频域信号之间的互相转换，以得到第一路信号的频域信号。然后，通过噪声功率估计，尽可能准确估计空气传导的噪声信号，例如采用最小值跟踪方法、时间递归平均算法、基于直方图的算法进行噪声估计。最后，根据估计噪声来计算空气传导语音信号的信噪比，尽可能计算带噪语音信号的信噪比。这里计算信噪比的方法有很多，比如计算每帧信噪比、通过判决引导法计算先验信噪比等。

本实施例中，输入数据流采样率为Fs＝8000Hz，数据长度一般处理数据为8ms～30ms之间，本实施例处理数据为64点并且重叠上一帧64个点，则系统算法实际一次处理128个点。首先，需要对原始数据进行预加重处理，提高语音的高频成分，预加重的方法很多，本实施例具体的运算为：

其中，α为平滑因子，取值为0.98，y_ac(n-1)为预处理前n-1时刻的空气传导语音信号，y_ac(n)为预处理前n时刻的空气传导语音信号，为预处理以后n时刻空气传导语音信号，n为第n时刻。

预处理中的窗函数必须为保幂映射，即语音信号重叠部分的窗口平方和必须为1，如下所示

w²(N)+w²(N+M)＝1

其中，w²(N)为窗函数在第N点取值的平方，w²(N+M)为窗函数在第N+M点取值的平方，N是FFT处理的点数，本发明取值为128，M是帧长度取值为64。窗函数设计根据不同运用场景可选择矩形窗，汉明窗、汉宁窗和高斯窗函数等，实际设计中可灵活选择，本实施例采用恺撒窗(Kaiser Window)，重叠50％。

由于本发明的噪声估计和信噪比计算都在频域进行处理，所以在将加权预处理后的信号进行加窗处理，并加加窗后的数据通过FFT变换到频域。

其中，k代表频谱点数，w(n)为窗函数，y_w(n,m)为第m帧语音乘窗函数以后n时刻的空气传导语音信号，Y_ac(m)为空气传导语音信号FFT变换以后频点m处的频谱。

经典的噪声估计主要有基于最小值跟踪算法、时间递归平均算法和基于直方图的算法。本实施例根据实际需求，采用时间递归平均算法MCRA，具体做法如下：

计算平滑带噪语音功率谱密度S(λ,k)

S(λ,k)＝α_s·S(λ-1,k)+(1-α_s)·S_f(λ,k)

其中，λ代表帧数，k代表频点数，S(λ-1,k)为第λ-1帧在频点k处功率谱密度，S_f(λ,k)为第λ帧空气传导语音信号频点平滑以后频点k的功率谱密度，Y_ac(λ,k-i)为第λ帧频点k-i的空气传导语音信号的频谱。α_s为平滑因子，取值为0.8，w(i)为窗函数，窗函数为2L_w+1(L_w＝1)，本发明选取汉明窗。局部最小值S_min(λ,k)通过在一个D帧(D＝100)的固定窗口长度上，通过与过去每一个S(λ,k)值进行对比得到。根据平滑功率谱S(λ,k)与其局部最小值倍数5·S_min(λ,k)之间比较来确定语音存在的概率。当S(λ,k)≥5·S_min(λ,k)，p(λ,k)＝1，否则p(λ,k)＝0。最后得到估计的噪声功率

其中，α_d(λ,k)为第λ帧频点k处噪声的平滑系数，为第λ-1帧频点k处估计的噪声功率，Y_ac(λ,k)为第λ帧频点k的空气传导语音信号的频谱，α为平滑常数，为第λ帧频点k处估计得到的语音存在的概率，为第λ-1帧频点k处估计得到的语音存在的概率，平滑因子α_p＝0.2，α＝0.95。

本实施例需要计算每一帧语音的先验信噪比ξ(λ,k)和整帧信噪比SNR(λ)。每一帧语音的先验信噪比ξ(λ,k)的计算主要采用改进判决引导方法，具体做法如下：

其中，γ(λ,k)为其每一帧的后验信噪比，a_ξ为平滑因子，取值为0.98，ξ_min取值为-15dB；为第λ帧频点k处的先验信噪比，为第λ-1帧频点k处计算的纯净语音信号频谱。

整帧信噪比SNR(λ)的计算公式如下：

S103、根据第一路语音信号的信噪比，确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数。

本实施例中，构建融合系数的解算模型，融合系数的解算模型如下：

k_λ＝γk_λ-1+(1-γ)f(SNR)

其中：f(SNR)＝0.5·tanh(0.025·SNR)+0.5

k_λ＝max[0,f(SNR)]或者k_λ＝min[f(SNR),1]

其中：k_λ为第λ帧语音信号的融合系数，γ为融合系数的平滑因子，k_λ-1为第λ-1帧语音信号的融合系数，f(SNR)为给定信噪比SNR和融合系数k_λ之间的映射函数。本实施例中，平滑常数γ选择0.95。

S104、根据融合系数，对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理，得到语音增强信号。

本实施例中，采用预设的语音融合算法，对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理；其中，预设的语音融合算法的计算公式如下：

s＝s_bc+k·s_ac

本实施例，通过采集第一路语音信号和第二路语音信号；获取第一路语音信号的信噪比；根据第一路语音信号的信噪比，确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数；根据融合系数，对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理，得到语音增强信号。从而实现了根据环境噪声自适应地调整非空气传导语音传感器和空气传导语音传感器的语音信号的融合系数，从而改善语音融合后的信号质量，提升语音增强的效果。

图3为本发明实施例二提供的语音增强方法的流程图，如图3所示，本实施例中的方法可以包括：

S201、采集第一路语音信号和第二路语音信号。

S202、获取第一路语音信号的信噪比。

本实施例中，步骤S201～步骤S202的具体实现过程和技术原理请参见图2所示的方法中步骤S101～步骤S102中的相关描述，此处不再赘述。

S203、根据第一路语音信号的信噪比，得到第一滤波信号和得第二滤波信号。

本实施例中，根据第一路语音信号的信噪比，确定第一路语音信号对应的第一滤波器的截止频率，以及第二路语音信号对应的第二滤波器的截止频率；通过第一滤波器对第一路语音信号进行滤波处理，得到第一滤波信号；通过第二滤波器对第二路语音信号进行滤波处理，得第二滤波信号。

在一种可选的实施方式中，获取第一路语音信号的每一帧语音的先验信噪比；确定预设的频段范围内，先验信噪比连续变大的频点数；根据频率数、第一路语音信号的采样频率、傅里叶变换的采样点数，计算得到第一滤波器和第二滤波器的截止频率。

具体地，高通滤波器和低通滤波器的截止频率受每一帧语音的先验信噪比ξ(λ,k)的自适应调整。具体处理流程如下所示：

首先，选取ξ(λ,k)的低频部分然后，计算两点之间的斜率。然后，选取斜率连续变大或者寻找到先验信噪比连续变大的频点数k。图4为本发明实施例提供的高通滤波器和低通滤波器设计图，如图4所示，低通滤波器和高通滤波器的截止频率为：

f_cl＝min[k·f_s/N+200,2000]

f_ch＝max[k·f_s/N-200,800]

其中，f_cl为低通滤波器的截止频率，f_ch为高通滤波器的截止频率，N代表FFT的点数，f_s为采样率，此处f_s＝8000Hz。

S204、根据第一路语音信号的信噪比，确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数。

S205、根据融合系数，对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理，得到语音增强信号。

本实施例中，步骤S204～步骤S205的具体实现过程和技术原理请参见图2所示的方法中步骤S103～步骤S104中的相关描述，此处不再赘述。

另外，本实施还可以根据第一路语音信号的信噪比，确定第一路语音信号对应的第一滤波器的截止频率，以及第二路语音信号对应的第二滤波器的截止频率；通过第一滤波器对第一路语音信号进行滤波处理，得到第一滤波信号；通过第二滤波器对第二路语音信号进行滤波处理，得第二滤波信号。从而改善语音融合后的信号质量，提升语音增强的效果。

图5为本发明实施例三提供的语音增强装置的结构示意图，如图5所示，本实施例的语音增强装置可以包括：

采集模块31，用于采集第一路语音信号和第二路语音信号；

获取模块32，用于获取第一路语音信号的信噪比；

确定模块33，用于根据第一路语音信号的信噪比，确定第一路语音信号和第二路语音信号对应的滤波信号的融合系数；

融合模块34，用于根据融合系数，对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理，得到语音增强信号。

可选地，采集模块31，具体用于：

通过空气传导语音传感器采集第一路语音信号，通过非空气传导语音传感器采集第二路语音信号；其中，非空气传导语音传感器包括：骨传导语音感器；空气传导语音传感器包括：麦克风。

可选地，获取模块32，具体用于：

对第一路语音信号进行预处理，得到预处理信号；

对预处理信号傅里叶转换处理，得到对应的频域信号；

估计频域信号的噪声功率，并基于噪声功率得到第一路语音信号的信噪比。

可选地，确定模块33，具体用于：

构建融合系数的解算模型，融合系数的解算模型如下：

k_λ＝γk_λ-1+(1-γ)f(SNR)

其中：f(SNR)＝0.5·tanh(0.025·SNR)+0.5

k_λ＝max[0,f(SNR)]或者k_λ＝min[f(SNR),1]

可选地，融合模块34，具体用于：

采用预设的语音融合算法，对第一路语音信号和第二路语音信号对应的滤波信号进行语音融合处理；其中，预设的语音融合算法的计算公式如下：

s＝s_bc+k·s_ac

本实施例的语音增强装置，可以执行图2所示方法中的技术方案，其具体实现过程和技术原理参见图2所示方法中的相关描述，此处不再赘述。

图6为本发明实施例四提供的语音增强装置的结构示意图，如图6所示，本实施例的语音增强装置在图5所示装置的基础上，还可以包括：

滤波模块35，用于根据第一路语音信号的信噪比，确定第一路语音信号对应的第一滤波器的截止频率，以及第二路语音信号对应的第二滤波器的截止频率；

通过第一滤波器对第一路语音信号进行滤波处理，得到第一滤波信号；通过第二滤波器对第二路语音信号进行滤波处理，得第二滤波信号。

可选地，根据第一路语音信号的信噪比，确定第一路语音信号对应的第一滤波器的截止频率，以及第二路语音信号对应的第二滤波器的截止频率，包括：

获取第一路语音信号的每一帧语音的先验信噪比；

确定预设的频段范围内，先验信噪比连续变大的频点数；

根据频率数、第一路语音信号的采样频率、傅里叶变换的采样点数，计算得到第一滤波器和第二滤波器的截止频率。

本实施例的语音增强装置，可以执行图2、图3所示方法中的技术方案，其具体实现过程和技术原理参见图2、图3所示方法中的相关描述，此处不再赘述。

图7为本发明实施例五提供的语音增强设备的结构示意图，如图7所示，本实施例中的语音增强设备40包括：

信号处理器41以及存储器42；其中：

存储器42，用于存储可执行指令，该存储器还可以是flash(闪存)。

信号处理器41，用于执行存储器存储的可执行指令，以实现上述实施例涉及的方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。

可选地，存储器42既可以是独立的，也可以跟信号处理器41集成在一起。

当存储器42是独立于信号处理器41之外的器件时，语音增强设备40还可以包括：

总线43，用于连接存储器42和信号处理器41。

本实施例中的语音增强设备可以执行图2、图3所示的方法，其具体实现过程和技术原理参见图2、图3所示方法中的相关描述，此处不再赘述。

此外，本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，当用户设备的至少一个信号处理器执行该计算机执行指令时，用户设备执行上述各种可能的方法。

其中，计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于应用专用集成电路(ASIC)中。另外，该应用专用集成电路可以位于用户设备中。当然，处理器和存储介质也可以作为分立组件存在于通信设备中。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求书指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims

1.一种语音增强方法，其特征在于，包括：

采集第一路语音信号和第二路语音信号；

获取所述第一路语音信号的信噪比；

2.根据权利要求1所述的方法，其特征在于，采集第一路语音信号和第二路语音信号，包括：

3.根据权利要求1所述的方法，其特征在于，获取所述第一路语音信号的信噪比，包括：

对所述第一路语音信号进行预处理，得到预处理信号；

4.根据权利要求1所述的方法，其特征在于，在获取所述第一路语音信号的信噪比之后，还包括：

5.根据权利要求4所述的方法，其特征在于，根据所述第一路语音信号的信噪比，确定所述第一路语音信号对应的第一滤波器的截止频率，以及所述第二路语音信号对应的第二滤波器的截止频率，包括：

获取所述第一路语音信号的每一帧语音的先验信噪比；

确定预设的频段范围内，先验信噪比连续变大的频点数；

6.根据权利要求1所述的方法，其特征在于，根据所述第一路语音信号的信噪比，确定所述第一路语音信号和所述第二路语音信号对应的滤波信号的融合系数，包括：

构建融合系数的解算模型，所述融合系数的解算模型如下：

k_λ＝γk_λ-1+(1-γ)f(SNR)

其中：f(SNR)＝0.5·tanh(0.025·SNR)+0.5

k_λ＝max[0,f(SNR)]或者k_λ＝min[f(SNR),1]

7.根据权利要求6所述的方法，其特征在于，根据所述融合系数，对所述第一路语音信号和所述第二路语音信号对应的滤波信号进行语音融合处理，得到语音增强信号，包括：

s＝s_bc+k·s_ac

8.一种语音增强装置，其特征在于，包括：

采集模块，用于采集第一路语音信号和第二路语音信号；

获取模块，用于获取所述第一路语音信号的信噪比；

9.根据权利要求8所述的装置，其特征在于，所述采集模块，具体用于：

10.根据权利要求8所述的装置，其特征在于，所述获取模块，具体用于：

对所述第一路语音信号进行预处理，得到预处理信号；

11.根据权利要求8所述的装置，其特征在于，还包括：

12.根据权利要求11所述的装置，其特征在于，根据所述第一路语音信号的信噪比，确定所述第一路语音信号对应的第一滤波器的截止频率，以及所述第二路语音信号对应的第二滤波器的截止频率，包括：

获取所述第一路语音信号的每一帧语音的先验信噪比；

确定预设的频段范围内，先验信噪比连续变大的频点数；

13.根据权利要求8所述的装置，其特征在于，所述确定模块，具体用于：

构建融合系数的解算模型，所述融合系数的解算模型如下：

k_λ＝γk_λ-1+(1-γ)f(SNR)

其中：f(SNR)＝0.5·tanh(0.025·SNR)+0.5

k_λ＝max[0,f(SNR)]或者k_λ＝min[f(SNR),1]

14.根据权利要求13所述的装置，其特征在于，所述融合模块，具体用于：

s＝s_bc+k·s_ac

15.一种语音增强设备，其特征在于，包括：信号处理器和存储器；所述存储器中存储有算法程序，所述信号处理器用于调取所述存储器中的算法程序，执行如权利要求1-7中任一项所述的语音增强方法。

16.一种计算机可读存储介质，其特征在于，包括：程序指令，当其在计算机上运行时，使得计算机执行所述程序指令，以实现如权利要求1-7中任一项所述的语音增强方法。