CN104637489A

CN104637489A - 声音信号处理的方法和装置

Info

Publication number: CN104637489A
Application number: CN201510029274.8A
Authority: CN
Inventors: 周雷; 郑成诗; 石代虎
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Cloud Computing Technologies Co Ltd
Priority date: 2015-01-21
Filing date: 2015-01-21
Publication date: 2015-05-20
Anticipated expiration: 2035-01-21
Also published as: CN104637489B

Abstract

本发明公开了一种声音信号处理的方法和装置。该方法包括：根据风噪声的频谱连续性和起始于低频的特性，对声音信号进行风噪声检测；根据浊音的谐频特性，对该声音信号进行浊音检测；根据清音的中高频特性，对该声音信号进行清音检测；根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对该声音信号进行增益控制。本发明实施例的声音处理的方法和装置，能够提高语音质量。

Description

声音信号处理的方法和装置

技术领域

本发明涉及信息技术领域，并且更具体地，涉及声音信号处理的方法和装置。

背景技术

各种语音处理设备，如手机、蓝牙耳机以及录音机、录像机等等，在户外使用时不可避免地会受到风噪声的干扰。风噪声主要是由气流和传声器之间相互作用产生的，类似于传声器拾音时手指轻敲传声器前端或嘴离传声器较近时呼气所产生的噪音。由于风噪声是气流直接作用在传声器表面形成的，因此可达到较高的声压级，极易掩盖语音信号，对语音信号的听觉舒适度和可懂度造成极大影响。因此对语音处理设备来说，风噪声抑制技术十分重要。

风噪声抑制技术主要有两类，一种是采用物理技术手段进行风噪抑制，比如给传声器套上风罩，或者从传声器的声学结构、材料设计方面来抑制风噪声；另外一种是采用数字信号处理的技术手段，即采用算法进行风噪声抑制。物理技术手段降风噪受使用环境和设备结构影响大，比如对大多数便携语音处理设备，受体积和结构限制无法给传声器安装风罩；对传声器进行声学结构、材料设计来抑制风噪声有可能会牺牲传声器的灵敏度，降低拾取语音信号质量，而且降风噪效果不够理想。采用信号处理的手段进行风噪抑制不受传声器类型和设备结构的影响，可移植性高，通用性强，非常适合应用在各种语音处理设备中，尤其是便携式语音通讯设备中实现风噪声抑制。因此风噪声检测和抑制信号处理算法在语音处理设备消除风噪干扰方面具有重要应用。

现有的风噪声检测和抑制算法采用输入信号低频能量与总能量的比来确定风噪声存在概率，或者当前信号的信噪比，进而选择频率抑制特性不同的滤波器来实现风噪抑制。这种方式计算出来的风噪声存在概率或信噪比误差比较大，导致风噪声的残留和语音的失真，影响语音质量。

发明内容

本发明实施例提供了一种声音信号处理的方法和装置，能够提高语音质量。

第一方面，提供了一种声音信号处理的方法，包括：

根据风噪声的频谱连续性和起始于低频的特性，对声音信号进行风噪声检测；

根据浊音的谐频特性，对该声音信号进行浊音检测；

根据清音的中高频特性，对该声音信号进行清音检测；

根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对该声音信号进行增益控制。

结合第一方面，在第一种可能的实现方式中，根据风噪声的频谱连续性和起始于低频的特性，对声音信号进行风噪声检测，包括：

若该声音信号的当前帧当前频点信号在高能区域且当前频点小于风噪声低频门限，则确定该声音信号的当前帧当前频点信号是风噪声；

若该声音信号的当前帧当前频点信号在高能区域，当前频点不小于风噪声低频门限，且当前频点相邻的低频点信号是风噪声，则确定该声音信号的当前帧当前频点信号是风噪声；

若该声音信号的当前帧当前频点信号在高能区域，当前频点不小于风噪声低频门限，且当前频点相邻的低频点信号不是风噪声，则确定该声音信号的当前帧当前频点信号不是风噪声；

若该声音信号的当前帧当前频点信号不在高能区域，则确定该声音信号的当前帧当前频点信号不是风噪声；

若该声音信号的当前帧当前频点信号是风噪声，则确定该声音信号的当前帧当前频点的风噪声的功率等于该声音信号的当前帧当前频点信号的功率；

若该声音信号的当前帧当前频点信号不是风噪声，则确定该声音信号的当前帧当前频点的风噪声的功率等于零。

结合第一方面或第一方面的上述任一种可能的实现方式，在第二种可能的实现方式中，根据浊音的谐频特性，对该声音信号进行浊音检测，包括：

将该声音信号的频带分为多个子带；

对于每个子带，若该每个子带上该声音信号的能量与语音长时平均能量的比值不小于第二比较门限，则确定该每个子带存在强风噪，若该每个子带上该声音信号的能量与语音长时平均能量的比值小于第二比较门限，则确定该每个子带不存在强风噪；

确定该声音信号的功率谱在所有不存在强风噪的子带组成的频段范围内的局部最大值和局部最小值；

对于每个局部最大值，若该每个局部最大值与该每个局部最大值相邻的局部最小值的比值大于第三比较门限，则确定该局部最大值为谐频波峰；

若所有谐频波峰的总能量与所有不存在强风噪的子带的总能量的比值大于第四比较门限，则确定该声音信号的当前帧有浊音，若所有谐频波峰的总能量与所有不存在强风噪的子带的总能量的比值不大于第四比较门限，则确定该声音信号的当前帧没有浊音。

结合第一方面或第一方面的上述任一种可能的实现方式，在第三种可能的实现方式中，根据清音的中高频特性，对该声音信号进行清音检测，包括：

确定该声音信号的当前帧中的低频信号的总能量和该声音信号的当前帧中的中高频信号的总能量；

若该声音信号的当前帧中的中高频信号的总能量与该声音信号的当前帧中的低频信号的总能量的比值大于第五比较门限，则确定该声音信号的当前帧有清音，若该声音信号的当前帧中的中高频信号的总能量与该声音信号的当前帧中的低频信号的总能量的比值不大于第五比较门限，则确定该声音信号的当前帧没有清音。

结合第一方面或第一方面的上述任一种可能的实现方式，在第四种可能的实现方式中，根据风噪声的频谱连续性和起始于低频的特性，对声音信号进行风噪声检测，包括：

根据以下等式对所述声音信号进行高能区域判定，

m_{High - energy} (k, l) = \{\begin{matrix} 1, P_{X} (k, l) > θ_{th 1} \cdot P_{N} (k, l) \\ 0, P_{X} (k, l) \leq θ_{th 1} \cdot P_{N} (k, l) \end{matrix},

其中，k为频点，l为帧数，m_High-energy(k,l)为高能区域标志，P_X(k,l)为该声音信号的功率谱，P_N(k,l)为该声音信号中的平稳态噪声的功率谱，θ_th1为第一比较门限；

根据以下等式判定该声音信号中的风噪声，

m_int(k,l)＝(m_High-energy(k,l)∧m_int(k-1,l))∨(m_High-energy(k,l)∧k≤k_low)，

其中，m_int(k,l)为风噪声判定标志，k_low为风噪声低频门限；

根据以下等式确定该声音信号中的风噪声的功率谱P_I(k,l)，

P_{I} (k, l) = \{\begin{matrix} P_{X} (k, l), & m_{int} (k, l) = 1 \\ 0, & m_{int} (k, l) = 0 \end{matrix} .

结合第一方面或第一方面的上述任一种可能的实现方式，在第五种可能的实现方式中，根据浊音的谐频特性，对该声音信号进行浊音检测，包括：

将该声音信号的频带分为P个子带，P为正整数且P≥2；

根据以下等式确定每个子带是否存在强风噪，

f_{strong - wind} (p, l) = \{\begin{matrix} 1, P_{X, p} (k, l) &GreaterEqual; θ_{th 2} \cdot P_{S - av, p} (k, l) \\ 0, P_{X, p} (k, l) < θ_{th 2} \cdot P_{S - av, p} (k, l) \end{matrix},

其中，k为频点，l为帧数，p为子带数，p＝1,2,...,P，P_X,p(k,l)为第p个子带的能量，P_S-av,p(k,l)为第p个子带的语音长时平均能量，θ_th2为第二比较门限；

根据以下等式确定该声音信号的功率谱在f_strong-wind(p,l)＝0的频段范围内的局部最大值P_X(k_i,l)和局部最小值P_X(k_j,l)，

根据以下等式确定谐频波峰P_X,peak(k_i,l),

其中，P_X(k_j,left,l)和P_X(k_j,right,l)为k_i频点两侧相邻的局部最小值，θ_th3为第三比较门限；

根据以下等式判定该声音信号中的浊音，

其中，f_voiced(l)为浊音判定标志，K₁为f_strong-wind(p,l)＝0的频段范围，θ_th4为第四比较门限。

结合第一方面或第一方面的上述任一种可能的实现方式，在第六种可能的实现方式中，根据清音的中高频特性，对该声音信号进行清音检测，包括：

根据以下等式确定该声音信号的当前帧中的低频信号的总能量P_X,low(k,l)和该声音信号的当前帧中的中高频信号的总能量P_X,high(k,l)，

P_{X, low} (k, l) = Σ_{k = 1}^{k_{mid}} P_{X} (k, l),

P_{X, high} (k, l) = Σ_{k = k_{mid} + 1}^{N} P_{X} (k, l),

其中，k为频点，l为帧数，P_X(k,l)为该声音信号的功率谱，k_mid为清音低频门限；

根据以下等式判定该声音信号中的清音，

f_{unvoiced} (l) = \{\begin{matrix} 1, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} > θ_{th 5} \\ 0, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} \leq θ_{th 5} \end{matrix},

其中，f_unvoiced(l)为清音判定标志，θ_th5为第五比较门限。

结合第一方面或第一方面的上述任一种可能的实现方式，在第七种可能的实现方式中，根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对该声音信号进行增益控制，包括：

根据风噪声检测的结果、浊音检测的结果和清音检测的结果，确定保护语音抑制风噪声的滤波器增益函数，利用该滤波器增益函数对该声音信号进行增益控制。

结合第一方面或第一方面的上述任一种可能的实现方式，在第八种可能的实现方式中，根据风噪声检测的结果、浊音检测的结果和清音检测的结果，确定保护语音抑制风噪声的滤波器增益函数，包括：

根据风噪声检测的结果确定原始风噪抑制增益函数；

根据浊音检测的结果确定浊音保护增益函数；

根据清音检测的结果确定清音保护增益函数；

将该原始风噪抑制增益函数、该浊音保护增益函数和该清音保护增益函数中的最大者作为该滤波器增益函数。

结合第一方面或第一方面的上述任一种可能的实现方式，在第九种可能的实现方式中，根据风噪声检测的结果、浊音检测的结果和清音检测的结果，确定保护语音抑制风噪声的滤波器增益函数，包括：

根据以下等式确定原始风噪抑制增益函数G₁(k,l)，

G_{1} (k, l) = \frac{P_{X} (k, l) - P_{I} (k, l)}{P_{X} (k, l)},

其中，k为频点，l为帧数，P_X(k,l)为该声音信号的功率谱，P_I(k,l)为该声音信号中的风噪声的功率谱；

根据以下等式确定浊音保护增益函数G_{voiced-protect}(k,l)，

其中，f_voiced(l)为浊音判定标志，k_min为谐频波峰的最小频点；

根据以下等式确定清音保护增益函数G_{unvoiced-protect}(k,l)，

其中，f_unvoiced(l)为清音判定标志；

根据以下等式确定该滤波器增益函数G(k,l)，

G(k,l)＝max{G₁(k,l),G_{voiced-protect}(k,l),G_{unvoiced-protect}(k,l)}，

其中，max{}表示取最大值。

第二方面，提供了一种声音信号处理的装置，包括：

风噪声检测模块，用于根据风噪声的频谱连续性和起始于低频的特性，对声音信号进行风噪声检测；

浊音检测模块，用于根据浊音的谐频特性，对该声音信号进行浊音检测；

清音检测模块，用于根据清音的中高频特性，对该声音信号进行清音检测；

增益控制模块，用于根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对该声音信号进行增益控制。

结合第二方面，在第一种可能的实现方式中，该风噪声检测模块具体用于：

结合第二方面或第二方面的上述任一种可能的实现方式，在第二种可能的实现方式中，该浊音检测模块具体用于：

将该声音信号的频带分为多个子带；

结合第二方面或第二方面的上述任一种可能的实现方式，在第三种可能的实现方式中，该清音检测模块具体用于：

结合第二方面或第二方面的上述任一种可能的实现方式，在第四种可能的实现方式中，该风噪声检测模块具体用于：

根据以下等式对所述声音信号进行高能区域判定，

m_{High - energy} (k, l) = \{\begin{matrix} 1, P_{X} (k, l) > θ_{th 1} \cdot P_{N} (k, l) \\ 0, P_{X} (k, l) \leq θ_{th 1} \cdot P_{N} (k, l) \end{matrix},

根据以下等式判定该声音信号中的风噪声，

其中，m_int(k,l)为风噪声判定标志，k_low为风噪声低频门限；

根据以下等式确定该声音信号中的风噪声的功率谱P_I(k,l)，

P_{I} (k, l) = \{\begin{matrix} P_{X} (k, l), & m_{int} (k, l) = 1 \\ 0, & m_{int} (k, l) = 0 \end{matrix} .

结合第二方面或第二方面的上述任一种可能的实现方式，在第五种可能的实现方式中，该浊音检测模块具体用于：

将该声音信号的频带分为P个子带，P为正整数且P≥2；

根据以下等式确定每个子带是否存在强风噪，

f_{strong - wind} (p, l) = \{\begin{matrix} 1, P_{X, p} (k, l) &GreaterEqual; θ_{th 2} \cdot P_{S - av, p} (k, l) \\ 0, P_{X, p} (k, l) < θ_{th 2} \cdot P_{S - av, p} (k, l) \end{matrix},

根据以下等式确定谐频波峰P_X,peak(k_i,l),

根据以下等式判定该声音信号中的浊音，

结合第二方面或第二方面的上述任一种可能的实现方式，在第六种可能的实现方式中，该清音检测模块具体用于：

P_{X, low} (k, l) = Σ_{k = 1}^{k_{mid}} P_{X} (k, l),

P_{X, high} (k, l) = Σ_{k = k_{mid} + 1}^{N} P_{X} (k, l),

根据以下等式判定该声音信号中的清音，

f_{unvoiced} (l) = \{\begin{matrix} 1, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} > θ_{th 5} \\ 0, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} \leq θ_{th 5} \end{matrix},

其中，f_unvoiced(l)为清音判定标志，θ_th5为第五比较门限。

结合第二方面或第二方面的上述任一种可能的实现方式，在第七种可能的实现方式中，该增益控制模块具体用于：

结合第二方面或第二方面的上述任一种可能的实现方式，在第八种可能的实现方式中，该增益控制模块具体用于：

根据风噪声检测的结果确定原始风噪抑制增益函数；

根据浊音检测的结果确定浊音保护增益函数；

根据清音检测的结果确定清音保护增益函数；

结合第二方面或第二方面的上述任一种可能的实现方式，在第九种可能的实现方式中，该增益控制模块具体用于：

根据以下等式确定原始风噪抑制增益函数G₁(k,l)，

G_{1} (k, l) = \frac{P_{X} (k, l) - P_{I} (k, l)}{P_{X} (k, l)},

根据以下等式确定浊音保护增益函数G_{voiced-protect}(k,l)，

根据以下等式确定清音保护增益函数G_{unvoiced-protect}(k,l)，

其中，f_unvoiced(l)为清音判定标志；

根据以下等式确定该滤波器增益函数G(k,l)，

G(k,l)＝max{G₁(k,l),G_{voiced-protect}(k,l),G_{unvoiced-protect}(k,l)}_，

其中，max{}表示取最大值。

基于上述技术方案，本发明实施例的声音信号处理的方法和装置，通过对声音信号进行风噪声检测、浊音检测和清音检测，根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对声音信号进行增益控制，既能够抑制风噪声，又能够保护语音，从而能够提高语音质量。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例的声音信号处理的方法的示意性流程图。

图2是本发明另一实施例的声音信号处理的方法的示意性流程图。

图3是本发明又一实施例的声音信号处理的方法的示意性流程图。

图4是本发明又一实施例的声音信号处理的方法的示意性流程图。

图5是本发明一个实施例的声音信号处理的装置的示意性框图。

图6是本发明另一实施例的声音信号处理的装置的示意性结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

图1示出了根据本发明实施例的声音信号处理的方法100的示意性流程图。该方法100可以由声音信号处理的装置执行。如图1所示，该方法100包括：

S110，根据风噪声的频谱连续性和起始于低频的特性，对声音信号进行风噪声检测；

S120，根据浊音的谐频特性，对该声音信号进行浊音检测；

S130，根据清音的中高频特性，对该声音信号进行清音检测；

S140，根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对该声音信号进行增益控制。

在本发明实施例中，在处理声音信号时，除了对声音信号进行风噪声检测，还对声音信号进行语音检测，即浊音检测和清音检测，其中，风噪声检测利用风噪声的频谱连续性和起始于低频的特性，浊音检测利用浊音的谐频特性，清音检测利用清音的中高频特性，最后根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对声音信号进行增益控制。这样，对声音信号的增益控制不但能够抑制风噪声，还能够保护语音，因而可以提高语音质量。

因此，本发明实施例的声音信号处理的方法，通过对声音信号进行风噪声检测、浊音检测和清音检测，根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对声音信号进行增益控制，既能够抑制风噪声，又能够保护语音，从而能够提高语音质量。

在本发明一个实施例中，可选地，如图2所示，S110，根据风噪声的频谱连续性和起始于低频的特性，对声音信号进行风噪声检测，包括：

S111，若该声音信号的当前帧当前频点信号在高能区域且当前频点小于风噪声低频门限，则确定该声音信号的当前帧当前频点信号是风噪声；

S112，若该声音信号的当前帧当前频点信号在高能区域，当前频点不小于风噪声低频门限，且当前频点相邻的低频点信号是风噪声，则确定该声音信号的当前帧当前频点信号是风噪声；

S113，若该声音信号的当前帧当前频点信号在高能区域，当前频点不小于风噪声低频门限，且当前频点相邻的低频点信号不是风噪声，则确定该声音信号的当前帧当前频点信号不是风噪声；

S114，若该声音信号的当前帧当前频点信号不在高能区域，则确定该声音信号的当前帧当前频点信号不是风噪声；

S115，若该声音信号的当前帧当前频点信号是风噪声，则确定该声音信号的当前帧当前频点的风噪声的功率等于该声音信号的当前帧当前频点信号的功率；

S116，若该声音信号的当前帧当前频点信号不是风噪声，则确定该声音信号的当前帧当前频点的风噪声的功率等于零。

具体而言，风噪声在频谱上有以下两个特征：(1)能量强；(2)由低频持续至高频。也就是说，风噪声在持续过程中一直保持比较强的能量；另外风噪声在频谱上具有连续性，由低频(100Hz以下)持续至高频某个频率。在进行风噪声检测时，可从低频起始点开始往高频进行检测，判断声音信号当前帧当前频点是否处在高能区域，如果不是，则确定当前帧当前频点不是风噪声；如果是，则判断当前频点是否小于风噪声低频门限，如果是，则确定当前帧当前频点是风噪声；如果不是，则检测当前频点相邻的低频点是不是风噪声，如果是，则确定当前帧当前频点是风噪声；如果不是，则确定当前帧当前频点不是风噪声。

假设传声器采集到的声音信号x(t)为：

x(t)＝s(t)+i(t)+n(t) (1)

其中，s(t)、i(t)和n(t)分别为传声器接收到的语音信号、风噪声信号和平稳态噪声信号。首先对声音信号x(t)进行时频变换，得到声音信号的频谱。时频变换可以通过FFT模块实现。例如FFT模块采用短时傅立叶变换(Short-Time Fourier Transform，STFT)对声音信号x(t)进行处理，得到x(t)的频谱X(k,l)，其中，k为频点，l为帧数。X(k,l)可表示为：

X(k,l)＝S(k,l)+I(k,l)+N(k,l) (2)

其中，S(k,l)、I(k,l)和N(k,l)分别为s(t)、i(t)和n(t)的频谱。

在本发明实施例中，可选地，可以通过声音信号与声音信号中的平稳态噪声的能量比确定声音信号的高能区域。

平稳态噪声的功率谱P_N(k,l)可以通过平稳态噪声估计算法估计。例如，最小值控制的递归平均(Minima Controlled Recursive Averaging，MCRA)算法和最小值统计(Minima Statistics，MS)噪声估计算法等。

声音信号的功率谱P_X(k,l)可以通过一阶递归平滑得到。

可选地，可以根据以下等式对声音信号进行高能区域判定，

m_{High - energy} (k, l) = \{\begin{matrix} 1, P_{X} (k, l) > θ_{th 1} \cdot P_{N} (k, l) \\ 0, P_{X} (k, l) \leq θ_{th 1} \cdot P_{N} (k, l) \end{matrix} - - - (3)

其中，m_High-energy(k,l)为高能区域标志，P_X(k,l)为该声音信号的功率谱，P_N(k,l)为该声音信号中的平稳态噪声的功率谱，θ_th1为第一比较门限，θ_th1的值可以预先设定。

可选地，可以根据以下等式判定该声音信号中的风噪声，

m_int(k,l)＝(m_High-energy(k,l)∧m_int(k-1,l))∨(m_High-energy(k,l)∧k≤k_low) (4)

其中，m_int(k,l)为风噪声判定标志，k_low为风噪声低频门限。也就是说，低于风噪声低频门限的频点如果处在高能区域，可以直接判定为风噪声，高于风噪声低频门限的频点，需要跟低频相邻频点连续才会被判断为风噪声。

可选地，可以根据以下等式确定该声音信号中的风噪声的功率谱P_I(k,l)，

P_{I} (k, l) = \{\begin{matrix} P_{X} (k, l), & m_{int} (k, l) = 1 \\ 0, & m_{int} (k, l) = 0 \end{matrix} - - - (5)

在本发明实施例中，除了对声音信号进行风噪声检测，还对声音信号进行语音检测。语音检测包括浊音检测和清音检测，其中，浊音检测利用浊音的谐频特性，清音检测利用清音的中高频特性。

在本发明一个实施例中，可选地，如图3所示，S120，根据浊音的谐频特性，对该声音信号进行浊音检测，包括：

S121，将该声音信号的频带分为多个子带；

S122，对于每个子带，若该每个子带上该声音信号的能量与语音长时平均能量的比值不小于第二比较门限，则确定该每个子带存在强风噪，若该每个子带上该声音信号的能量与语音长时平均能量的比值小于第二比较门限，则确定该每个子带不存在强风噪；

S123，确定该声音信号的功率谱在所有不存在强风噪的子带组成的频段范围内的局部最大值和局部最小值；

S124，对于每个局部最大值，若该每个局部最大值与该每个局部最大值相邻的局部最小值的比值大于第三比较门限，则确定该局部最大值为谐频波峰；

S125，若所有谐频波峰的总能量与所有不存在强风噪的子带的总能量的比值大于第四比较门限，则确定该声音信号的当前帧有浊音，若所有谐频波峰的总能量与所有不存在强风噪的子带的总能量的比值不大于第四比较门限，则确定该声音信号的当前帧没有浊音。

具体而言，语音中的浊音信号具有谐频特性。在本发明实施例中，首先采用声音信号与长时语音的子带能量比确定强风噪存在的频段，然后选择不存在强风噪的频段范围来进行谐频检测，这样能够避免强风噪对语音检测结果的影响。确定检测范围后，利用谐频的峰谷能量差异进行谐频检测。首先搜索出检测频段范围内的所有峰值(局部最大值)和峰值两侧的谷值(局部最小值)，然后计算峰谷能量比，语音谐频信号的峰谷能量比十分大，而风噪声信号不具备这个特性，这样就能有效地检测出语音谐频信号。

可选地，可以根据以下等式确定语音长时平均能量P_S-av(k,l)，

P_{S - av} (k, l) = \{\begin{matrix} α_{av} \cdot P_{S - av} (k, l - 1) + (1 - α_{av}) \cdot P_{X} (k, l), & f_{speech} (k, l) = 1 \\ P_{av} (k, l - 1), & else \end{matrix} - - - (6)

其中，α_av为平滑因子，f_speech(k,l)为采用倒谱方法得到的语音谐频检测标志。具体地，将P_X(k,l)进行倒谱分析，并设定一个倒谱门限值，如果倒谱峰值大于倒谱门限值，f_speech(k,l)就置为1，表示有语音存在，可以进行能量更新。可选地，倒谱门限值可取值较高以减小谐频检测虚警，这样虽然增加了语音谐频检测的漏警，但是对于语音长时平均能量的估计影响不大。

将该声音信号的频带分为P个子带，P为正整数且P≥2。第p个子带的能量为P_X,p(k,l)，第p个子带的语音长时平均能量为P_S-av,p(k,l)，p＝1,2,...,P。

可选地，可以根据以下等式确定每个子带是否存在强风噪，

f_{strong - wind} (p, l) = \{\begin{matrix} 1, P_{X, p} (k, l) &GreaterEqual; θ_{th 2} \cdot P_{S - av, p} (k, l) \\ 0, P_{X, p} (k, l) < θ_{th 2} \cdot P_{S - av, p} (k, l) \end{matrix} - - - (7)

其中，θ_th2为第二比较门限，θ_th2的值可以预先设定。

在f_strong-wind(p,l)＝0的频段范围内进行谐频检测。

具体地，可以根据以下等式确定该声音信号的功率谱在f_strong-wind(p,l)＝0的频段范围内的局部最大值P_X(k_i,l)和局部最小值P_X(k_j,l)，

根据以下等式确定谐频波峰P_X,peak(k_i,l),

其中，P_X(k_j,left,l)和P_X(k_j,right,l)为k_i频点两侧相邻的局部最小值，θ_th3为第三比较门限，θ_th3的值可以预先设定。

根据以下等式判定该声音信号中的浊音，

其中，f_voiced(l)为浊音判定标志，取1表示当前帧有浊音，取0表示当前帧没有浊音，K₁为f_strong-wind(p,l)＝0的频段范围，θ_th4为第四比较门限，θ_th4的值可以预先设定。

在本发明一个实施例中，可选地，如图4所示，S130，根据清音的中高频特性，对该声音信号进行清音检测，包括：

S131，确定该声音信号的当前帧中的低频信号的总能量和该声音信号的当前帧中的中高频信号的总能量；

S132，若该声音信号的当前帧中的中高频信号的总能量与该声音信号的当前帧中的低频信号的总能量的比值大于第五比较门限，则确定该声音信号的当前帧有清音，若该声音信号的当前帧中的中高频信号的总能量与该声音信号的当前帧中的低频信号的总能量的比值不大于第五比较门限，则确定该声音信号的当前帧没有清音。

具体而言，语音中的清音信号常出现在语音的起始端，其频域特性为主要能量集中在中高频，大概在2kHz以上，低频能量较弱。因此可以利用清音的中高频特性进行语音清音检测。

可选地，可以根据以下等式确定该声音信号的当前帧中的低频信号的总能量P_X,low(k,l)和该声音信号的当前帧中的中高频信号的总能量P_X,high(k,l)，

P_{X, low} (k, l) = Σ_{k = 1}^{k_{mid}} P_{X} (k, l) - - - (12)

P_{X, high} (k, l) = Σ_{k = k_{mid} + 1}^{N} P_{X} (k, l) - - - (13)

其中，k_mid为清音低频门限，可以取1kHz～2kHz范围对应的频点。

可选地，可以根据以下等式判定该声音信号中的清音，

f_{unvoiced} (l) = \{\begin{matrix} 1, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} > θ_{th 5} \\ 0, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} \leq θ_{th 5} \end{matrix} - - - (14)

其中，f_unvoiced(l)为清音判定标志，取1表示当前帧有清音，取0表示当前帧没有清音，θ_th5为第五比较门限，θ_th5的值可以预先设定。

在本发明实施例中，在完成了风噪声检测、浊音检测和清音检测后，根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对声音信号进行增益控制。

可选地，在本发明一个实施例中，根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对该声音信号进行增益控制，包括：

也就是说，本发明实施例根据风噪声检测的结果、浊音检测的结果和清音检测的结果确定既可以抑制风噪声又可以保护语音的滤波器增益函数，利用该滤波器增益函数对该声音信号进行增益控制。

可选地，在本发明一个实施例中，根据风噪声检测的结果、浊音检测的结果和清音检测的结果，确定保护语音抑制风噪声的滤波器增益函数，包括：

根据风噪声检测的结果确定原始风噪抑制增益函数；

根据浊音检测的结果确定浊音保护增益函数；

根据清音检测的结果确定清音保护增益函数；

具体而言，在本发明实施例中，最终使用的滤波器增益函数为原始风噪抑制增益函数、浊音保护增益函数和清音保护增益函数中的最大者。这样，在没有语音时，能够实现对风噪声的抑制；在有语音时，能够实现对语音的保护。

可选地，可以根据以下等式确定原始风噪抑制增益函数G₁(k,l)，

G_{1} (k, l) = \frac{P_{X} (k, l) - P_{I} (k, l)}{P_{X} (k, l)} - - - (15)

其中，P_X(k,l)为声音信号的功率谱，P_I(k,l)为声音信号中的风噪声的功率谱。

可选地，可以根据以下等式确定浊音保护增益函数G_{voiced-protect}(k,l)，

其中，k_min为谐频波峰的最小频点，可由等式(10)得到。

可选地，可以根据以下等式确定清音保护增益函数G_{unvoiced-protect}(k,l)，

可选地，可以根据以下等式确定该滤波器增益函数G(k,l)，

G(k,l)＝max{G₁(k,l),G_{voiced-protect}(k,l),G_{unvoiced-protect}(k,l)} (18)

其中，max{}表示取最大值。

利用G(k,l)对声音信号进行增益控制，最终输出信号为：

\tilde{s} (n) = IFFT {G (k, l) X (k, l)} - - - (19)

本发明实施例的声音信号处理的方法，利用风噪声起始于低频、由低频持续至高频的特性来估计风噪声，可以动态地估计不同风速时的风噪声频谱，在各种风速情况下有效完整地估计风噪声的频谱，因而可以达到更准确的风噪声估计；同时，利用语音中浊音的谐频特性和清音的中高频特性，可以达到对浊音和清音的有效检测，进而有效地保护语音信号，避免语音失真，从而能够提高语音质量。

应理解，本发明实施例中的具体的例子只是为了帮助本领域技术人员更好地理解本发明实施例，而非限制本发明实施例的范围。

还应理解，在本发明的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

上文中详细描述了根据本发明实施例的声音信号处理的方法，下面将描述根据本发明实施例的声音信号处理的装置。

图5示出了根据本发明实施例的声音信号处理的装置500的示意性框图。如图5所示，该装置500包括：

风噪声检测模块510，用于根据风噪声的频谱连续性和起始于低频的特性，对声音信号进行风噪声检测；

浊音检测模块520，用于根据浊音的谐频特性，对该声音信号进行浊音检测；

清音检测模块530，用于根据清音的中高频特性，对该声音信号进行清音检测；

增益控制模块540，用于根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对该声音信号进行增益控制。

本发明实施例的声音信号处理的装置，通过对声音信号进行风噪声检测、浊音检测和清音检测，根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对声音信号进行增益控制，既能够抑制风噪声，又能够保护语音，从而能够提高语音质量。

应理解，浊音检测模块和清音检测模块也可以合并为一个语音检测模块，也就是说，该语音检测模块可同时具有浊音检测模块和清音检测模块的功能。

在本发明实施例中，可选地，该风噪声检测模块510具体用于：

根据以下等式对该声音信号进行高能区域判定，

m_{High - energy} (k, l) = \{\begin{matrix} 1, P_{X} (k, l) > θ_{th 1} \cdot P_{N} (k, l) \\ 0, P_{X} (k, l) \leq θ_{th 1} \cdot P_{N} (k, l) \end{matrix},

根据以下等式判定该声音信号中的风噪声，

其中，m_int(k,l)为风噪声判定标志，k_low为风噪声低频门限；

根据以下等式确定该声音信号中的风噪声的功率谱P_I(k,l)，

P_{I} (k, l) = \{\begin{matrix} P_{X} (k, l), & m_{int} (k, l) = 1 \\ 0, & m_{int} (k, l) = 0 \end{matrix} .

在本发明实施例中，可选地，该浊音检测模块520具体用于：

将该声音信号的频带分为多个子带；

在本发明实施例中，可选地，该浊音检测模块520具体用于：

将该声音信号的频带分为P个子带，P为正整数且P≥2；

根据以下等式确定每个子带是否存在强风噪，

f_{strong - wind} (p, l) = \{\begin{matrix} 1, P_{X, p} (k, l) &GreaterEqual; θ_{th 2} \cdot P_{S - av, p} (k, l) \\ 0, P_{X, p} (k, l) < θ_{th 2} \cdot P_{S - av, p} (k, l) \end{matrix},

根据以下等式确定谐频波峰P_X,peak(k_i,l),

根据以下等式判定该声音信号中的浊音，

在本发明实施例中，可选地，该清音检测模块530具体用于：

P_{X, low} (k, l) = Σ_{k = 1}^{k_{mid}} P_{X} (k, l),

P_{X, high} (k, l) = Σ_{k = k_{mid} + 1}^{N} P_{X} (k, l),

根据以下等式判定该声音信号中的清音，

f_{unvoiced} (l) = \{\begin{matrix} 1, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} > θ_{th 5} \\ 0, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} \leq θ_{th 5} \end{matrix},

其中，f_unvoiced(l)为清音判定标志，θ_th5为第五比较门限。

在本发明实施例中，可选地，该增益控制模块540具体用于：

根据风噪声检测的结果确定原始风噪抑制增益函数；

根据浊音检测的结果确定浊音保护增益函数；

根据清音检测的结果确定清音保护增益函数；

在本发明实施例中，可选地，该增益控制模块540具体用于：

根据以下等式确定原始风噪抑制增益函数G₁(k,l)，

G_{1} (k, l) = \frac{P_{X} (k, l) - P_{I} (k, l)}{P_{X} (k, l)},

根据以下等式确定浊音保护增益函数G_{voiced-protect}(k,l)，

根据以下等式确定清音保护增益函数G_{unvoiced-protect}(k,l)，

其中，f_unvoiced(l)为清音判定标志；

根据以下等式确定该滤波器增益函数G(k,l)，

G(k,l)＝max{G₁(k,l),G_{voiced-protect}(k,l),G_{unvoiced-protect}(k,l)}。

本发明实施例的声音信号处理的装置，利用风噪声起始于低频、由低频持续至高频的特性来估计风噪声，可以动态地估计不同风速时的风噪声频谱，在各种风速情况下有效完整地估计风噪声的频谱，因而可以达到更准确的风噪声估计；同时，利用语音中浊音的谐频特性和清音的中高频特性，可以达到对浊音和清音的有效检测，进而有效地保护语音信号，避免语音失真，从而能够提高语音质量。

根据本发明实施例的声音信号处理的装置500可以为根据本发明实施例的声音处理的方法的执行主体，并且装置500中的各个模块的上述和其它操作和/或功能分别为了实现前述各个方法的相应流程，为了简洁，在此不再赘述。

图6示出了本发明的又一实施例提供的声音信号处理的装置的结构，包括至少一个处理器602(例如CPU)，至少一个网络接口605或者其他通信接口，存储器606，和至少一个通信总线603，用于实现这些部件之间的连接通信。处理器602用于执行存储器606中存储的可执行模块，例如计算机程序。存储器606可能包含高速随机存取存储器(RAM：Random AccessMemory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。通过至少一个网络接口605(可以是有线或者无线)实现与至少一个其他网元之间的通信连接。

在一些实施方式中，存储器606存储了程序6061，处理器602执行程序6061，用于执行以下操作：

根据浊音的谐频特性，对该声音信号进行浊音检测；

根据清音的中高频特性，对该声音信号进行清音检测；

可选地，处理器602用于：

根据以下等式对该声音信号进行高能区域判定，

m_{High - energy} (k, l) = \{\begin{matrix} 1, P_{X} (k, l) > θ_{th 1} \cdot P_{N} (k, l) \\ 0, P_{X} (k, l) \leq θ_{th 1} \cdot P_{N} (k, l) \end{matrix},

根据以下等式判定该声音信号中的风噪声，

其中，m_int(k,l)为风噪声判定标志，k_low为风噪声低频门限；

根据以下等式确定该声音信号中的风噪声的功率谱P_I(k,l)，

P_{I} (k, l) = \{\begin{matrix} P_{X} (k, l), & m_{int} (k, l) = 1 \\ 0, & m_{int} (k, l) = 0 \end{matrix} .

可选地，处理器602用于：

将该声音信号的频带分为多个子带；

可选地，处理器602用于：

将该声音信号的频带分为P个子带，P为正整数且P≥2；

根据以下等式确定每个子带是否存在强风噪，

f_{strong - wind} (p, l) = \{\begin{matrix} 1, P_{X, p} (k, l) &GreaterEqual; θ_{th 2} \cdot P_{S - av, p} (k, l) \\ 0, P_{X, p} (k, l) < θ_{th 2} \cdot P_{S - av, p} (k, l) \end{matrix},

根据以下等式确定谐频波峰P_X,peak(k_i,l),

根据以下等式判定该声音信号中的浊音，

可选地，处理器602用于：

P_{X, low} (k, l) = Σ_{k = 1}^{k_{mid}} P_{X} (k, l),

P_{X, high} (k, l) = Σ_{k = k_{mid} + 1}^{N} P_{X} (k, l),

根据以下等式判定该声音信号中的清音，

f_{unvoiced} (l) = \{\begin{matrix} 1, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} > θ_{th 5} \\ 0, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} \leq θ_{th 5} \end{matrix},

其中，f_unvoiced(l)为清音判定标志，θ_th5为第五比较门限。

可选地，处理器602用于：

根据风噪声检测的结果确定原始风噪抑制增益函数；

根据浊音检测的结果确定浊音保护增益函数；

根据清音检测的结果确定清音保护增益函数；

可选地，处理器602用于：

根据以下等式确定原始风噪抑制增益函数G₁(k,l)，

G_{1} (k, l) = \frac{P_{X} (k, l) - P_{I} (k, l)}{P_{X} (k, l)},

根据以下等式确定浊音保护增益函数G_{voiced-protect}(k,l)，

根据以下等式确定清音保护增益函数G_{unvoiced-protect}(k,l)，

其中，f_unvoiced(l)为清音判定标志；

根据以下等式确定该滤波器增益函数G(k,l)，

G(k,l)＝max{G₁(k,l),G_{voiced-protect}(k,l),G_{unvoiced-protect}(k,l)}。

从本发明实施例提供的以上技术方案可以看出，本发明实施例通过对声音信号进行风噪声检测、浊音检测和清音检测，根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对声音信号进行增益控制，既能够抑制风噪声，又能够保护语音，从而能够提高语音质量。

应理解，在本发明实施例中，术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系。例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种声音信号处理的方法，其特征在于，包括：

根据浊音的谐频特性，对所述声音信号进行浊音检测；

根据清音的中高频特性，对所述声音信号进行清音检测；

根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对所述声音信号进行增益控制。

2.根据权利要求1所述的方法，其特征在于，所述根据风噪声的频谱连续性和起始于低频的特性，对声音信号进行风噪声检测，包括：

若所述声音信号的当前帧当前频点信号在高能区域且当前频点小于风噪声低频门限，则确定所述声音信号的当前帧当前频点信号是风噪声；

若所述声音信号的当前帧当前频点信号在高能区域，当前频点不小于风噪声低频门限，且当前频点相邻的低频点信号是风噪声，则确定所述声音信号的当前帧当前频点信号是风噪声；

若所述声音信号的当前帧当前频点信号在高能区域，当前频点不小于风噪声低频门限，且当前频点相邻的低频点信号不是风噪声，则确定所述声音信号的当前帧当前频点信号不是风噪声；

若所述声音信号的当前帧当前频点信号不在高能区域，则确定所述声音信号的当前帧当前频点信号不是风噪声；

若所述声音信号的当前帧当前频点信号是风噪声，则确定所述声音信号的当前帧当前频点的风噪声的功率等于所述声音信号的当前帧当前频点信号的功率；

若所述声音信号的当前帧当前频点信号不是风噪声，则确定所述声音信号的当前帧当前频点的风噪声的功率等于零。

3.根据权利要求1或2所述的方法，其特征在于，所述根据浊音的谐频特性，对所述声音信号进行浊音检测，包括：

将所述声音信号的频带分为多个子带；

对于每个子带，若所述每个子带上所述声音信号的能量与语音长时平均能量的比值不小于第二比较门限，则确定所述每个子带存在强风噪，若所述每个子带上所述声音信号的能量与语音长时平均能量的比值小于第二比较门限，则确定所述每个子带不存在强风噪；

确定所述声音信号的功率谱在所有不存在强风噪的子带组成的频段范围内的局部最大值和局部最小值；

对于每个局部最大值，若所述每个局部最大值与所述每个局部最大值相邻的局部最小值的比值大于第三比较门限，则确定所述局部最大值为谐频波峰；

若所有谐频波峰的总能量与所有不存在强风噪的子带的总能量的比值大于第四比较门限，则确定所述声音信号的当前帧有浊音，若所有谐频波峰的总能量与所有不存在强风噪的子带的总能量的比值不大于第四比较门限，则确定所述声音信号的当前帧没有浊音。

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述根据清音的中高频特性，对所述声音信号进行清音检测，包括：

确定所述声音信号的当前帧中的低频信号的总能量和所述声音信号的当前帧中的中高频信号的总能量；

若所述声音信号的当前帧中的中高频信号的总能量与所述声音信号的当前帧中的低频信号的总能量的比值大于第五比较门限，则确定所述声音信号的当前帧有清音，若所述声音信号的当前帧中的中高频信号的总能量与所述声音信号的当前帧中的低频信号的总能量的比值不大于第五比较门限，则确定所述声音信号的当前帧没有清音。

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述根据风噪声的频谱连续性和起始于低频的特性，对声音信号进行风噪声检测，包括：

根据以下等式对所述声音信号进行高能区域判定，

m_{High - energy} (k, l) = \{\begin{matrix} 1, P_{X} (k, l) > θ_{th 1} \cdot P_{N} (k, l) \\ 0, P_{X} (k, l) < θ_{th 1} \cdot P_{N} (k, l) \end{matrix},

其中，k为频点，l为帧数，m_High-energy(k,l)为高能区域标志，P_X(k,l)为所述声音信号的功率谱，P_N(k,l)为所述声音信号中的平稳态噪声的功率谱，θ_th1为第一比较门限；

根据以下等式判定所述声音信号中的风噪声，

其中，m_int(k,l)为风噪声判定标志，k_low为风噪声低频门限；

根据以下等式确定所述声音信号中的风噪声的功率谱P_I(k,l)，

P_{I} (k, l) = \{\begin{matrix} P_{X} (k, l), & m_{int} (k, l) = 1 \\ 0, & m_{int} (k, l) =0 \end{matrix} .

6.根据权利要求1至5中任一项所述的方法，其特征在于，所述根据浊音的谐频特性，对所述声音信号进行浊音检测，包括：

将所述声音信号的频带分为P个子带，P为正整数且P≥2；

根据以下等式确定每个子带是否存在强风噪，

f_{string - wind} (p, l) = \{\begin{matrix} 1, P_{X, p} (k, l) &GreaterEqual; θ_{th 2} \cdot P_{S - av, p} (k, l) \\ 0, P_{X, p} (k, l) < θ_{th 2} \cdot P_{S - av, p} (k, l) \end{matrix},

根据以下等式确定所述声音信号的功率谱在f_strong-wind(p,l)＝0的频段范围内的局部最大值P_X(k_i,l)和局部最小值P_X(k_j,l)，

根据以下等式确定谐频波峰P_X,peak(k_i,l),

根据以下等式判定所述声音信号中的浊音，

7.根据权利要求1至6中任一项所述的方法，其特征在于，所述根据清音的中高频特性，对所述声音信号进行清音检测，包括：

根据以下等式确定所述声音信号的当前帧中的低频信号的总能量P_X,low(k,l)和所述声音信号的当前帧中的中高频信号的总能量P_X,high(k,l)，

P_{X, low} (k, l) = Σ_{k = 1}^{k_{mid}} P_{X} (k, l),

P_{X, high} (k, l) = Σ_{k = k_{mid} + 1}^{N} P_{X} (k, l),

其中，k为频点，l为帧数，P_X(k,l)为所述声音信号的功率谱，k_mid为清音低频门限；

根据以下等式判定所述声音信号中的清音，

f_{unvoiced} (l) = \{\begin{matrix} 1, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} > θ_{th 5} \\ 0, \frac{P_{X, high} (k . l)}{P_{X, low} (k, l)} \leq θ_{th 5} \end{matrix},

其中，f_unvoiced(l)为清音判定标志，θ_th5为第五比较门限。

8.根据权利要求1至7中任一项所述的方法，其特征在于，所述根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对所述声音信号进行增益控制，包括：

根据风噪声检测的结果、浊音检测的结果和清音检测的结果，确定保护语音抑制风噪声的滤波器增益函数，利用所述滤波器增益函数对所述声音信号进行增益控制。

9.根据权利要求8所述的方法，其特征在于，所述根据风噪声检测的结果、浊音检测的结果和清音检测的结果，确定保护语音抑制风噪声的滤波器增益函数，包括：

根据风噪声检测的结果确定原始风噪抑制增益函数；

根据浊音检测的结果确定浊音保护增益函数；

根据清音检测的结果确定清音保护增益函数；

将所述原始风噪抑制增益函数、所述浊音保护增益函数和所述清音保护增益函数中的最大者作为所述滤波器增益函数。

10.根据权利要求8或9所述的方法，其特征在于，所述根据风噪声检测的结果、浊音检测的结果和清音检测的结果，确定保护语音抑制风噪声的滤波器增益函数，包括：

根据以下等式确定原始风噪抑制增益函数G₁(k,l)，

G_{1} (k, l) = \frac{P_{X} (k, l) - P_{I} (k, l)}{P_{X} (k, l)},

其中，k为频点，l为帧数，P_X(k,l)为所述声音信号的功率谱，P_I(k,l)为所述声音信号中的风噪声的功率谱；

根据以下等式确定浊音保护增益函数G_{voiced-protect}(k,l)，

根据以下等式确定清音保护增益函数G_{unvoiced-protect}(k,l)，

其中，f_unvoiced(l)为清音判定标志；

根据以下等式确定所述滤波器增益函数G(k,l)，

G(k,l)＝max{G₁(k,l),G_{voiced-protect}(k,l),G_{unvoiced-protect}(k,l)}，

其中，max{}表示取最大值。

11.一种声音信号处理的装置，其特征在于，包括：

浊音检测模块，用于根据浊音的谐频特性，对所述声音信号进行浊音检测；

清音检测模块，用于根据清音的中高频特性，对所述声音信号进行清音检测；

增益控制模块，用于根据风噪声检测的结果、浊音检测的结果和清音检测的结果，对所述声音信号进行增益控制。

12.根据权利要求11所述的装置，其特征在于，所述风噪声检测模块具体用于：

13.根据权利要求11或12所述的装置，其特征在于，所述浊音检测模块具体用于：

将所述声音信号的频带分为多个子带；

14.根据权利要求11至13中任一项所述的装置，其特征在于，所述清音检测模块具体用于：

15.根据权利要求11至14中任一项所述的装置，其特征在于，所述风噪声检测模块具体用于：

根据以下等式对所述声音信号进行高能区域判定，

m_{High - energy} (k, l) = \{\begin{matrix} 1, P_{X} (k, l) > θ_{th 1} \cdot P_{N} (k, l) \\ 0, P_{X} (k, l) < θ_{th 1} \cdot P_{N} (k, l) \end{matrix},

根据以下等式判定所述声音信号中的风噪声，

m_int(k,l)＝(m_High-energy(k,l)∧m_int(k-1_,l))∨(m_High-energy(k,l)∧k≤k_low)，

其中，m_int(k,l)为风噪声判定标志，k_low为风噪声低频门限；

P_{I} (k, l) = \{\begin{matrix} P_{X} (k, l), & m_{int} (k, l) = 1 \\ 0, & m_{int} (k, l) =0 \end{matrix} .

16.根据权利要求11至15中任一项所述的装置，其特征在于，所述浊音检测模块具体用于：

将所述声音信号的频带分为P个子带，P为正整数且P≥2；

根据以下等式确定每个子带是否存在强风噪，

f_{string - wind} (p, l) = \{\begin{matrix} 1, P_{X, p} (k, l) &GreaterEqual; θ_{th 2} \cdot P_{S - av, p} (k, l) \\ 0, P_{X, p} (k, l) < θ_{th 2} \cdot P_{S - av, p} (k, l) \end{matrix},

根据以下等式确定谐频波峰P_X,peak(k_i,l),

根据以下等式判定所述声音信号中的浊音，

17.根据权利要求11至16中任一项所述的装置，其特征在于，所述清音检测模块具体用于：

P_{X, low} (k, l) = Σ_{k = 1}^{k_{mid}} P_{X} (k, l),

P_{X, high} (k, l) = Σ_{k = k_{mid} + 1}^{N} P_{X} (k, l),

根据以下等式判定所述声音信号中的清音，

f_{unvoiced} (l) = \{\begin{matrix} 1, \frac{P_{X, high} (k, l)}{P_{X, low} (k, l)} > θ_{th 5} \\ 0, \frac{P_{X, high} (k . l)}{P_{X, low} (k, l)} \leq θ_{th 5} \end{matrix},

其中，f_unvoiced(l)为清音判定标志，θ_th5为第五比较门限。

18.根据权利要求11至17中任一项所述的装置，其特征在于，所述增益控制模块具体用于：

19.根据权利要求18所述的装置，其特征在于，所述增益控制模块具体用于：

根据风噪声检测的结果确定原始风噪抑制增益函数；

根据浊音检测的结果确定浊音保护增益函数；

根据清音检测的结果确定清音保护增益函数；

20.根据权利要求18或19所述的装置，其特征在于，所述增益控制模块具体用于：

根据以下等式确定原始风噪抑制增益函数G₁(k,l)，

G_{1} (k, l) = \frac{P_{X} (k, l) - P_{I} (k, l)}{P_{X} (k, l)},

根据以下等式确定浊音保护增益函数G_{voiced-protect}(k,l)，

根据以下等式确定清音保护增益函数G_{unvoiced-protect}(k,l)，

其中，f_unvoiced(l)为清音判定标志；

根据以下等式确定所述滤波器增益函数G(k,l)，

G(k,l)＝max{G₁(k,l),G_{voiced-protect}(k,l),G_{unvoiced-protect}(k,l)}_，

其中，max{}表示取最大值。