CN103903629B

CN103903629B - 基于隐马尔科夫链模型的噪声估计方法和装置

Info

Publication number: CN103903629B
Application number: CN201210586423.7A
Authority: CN
Inventors: 谢单辉; 许云峰; 王彦
Original assignee: Leadcore Technology Co Ltd
Current assignee: Leadcore Technology Co Ltd
Priority date: 2012-12-28
Filing date: 2012-12-28
Publication date: 2017-02-15
Anticipated expiration: 2032-12-28
Also published as: CN103903629A

Abstract

本发明涉及语音通信领域，公开了一种基于隐马尔科夫链模型的噪声估计方法和装置。本发明中，根据预先建立的HMM，确定当前帧中语音存在的概率；并根据该语音存在的概率，计算平滑因子；接着根据平滑因子，计算当前帧中噪声的方差估计值。本发明利用隐马尔科夫链状态转移来确定语音存在的概率，并利用该概率去控制噪声更新的大小，从而在噪声抑制中能快速估计噪声的变化，可以准确估计快速变化的非稳态环境中的噪声，最终提升噪声抑制的性能。

Description

基于隐马尔科夫链模型的噪声估计方法和装置

技术领域

本发明涉及语音通信领域，特别涉及单麦克噪声抑制内的基于隐马尔科夫链模型的噪声估计方法和装置。

背景技术

单麦克噪声抑制算法通常采用短时频域衰减方法，流程图如图1所示。主要模块包括快速傅里叶变换（FFT）频域分解、噪声估计、计算先/后验信噪比、计算衰减因子、频域衰减、反傅里叶变换以及重叠相加。

图1中y,x,n分别表示时域带噪语音、干净语音和噪声信号，对应的大写字母则对应各自频谱，带帽子(^)的符号表示对应变量的估计值，f表示某个函数，下角标m,l,k分别代表帧序号、帧内时间序号和频点序号。ξ_k(m)和γ_k(m)分别表示先验信噪比和后验信噪比：

衰减因子G_k根据估计的先、后验信噪比的数值控制衰减程度：当信噪比都比较大的时候，就认为是语音，衰减因子G_k就接近于1，不衰减Y_k；反之，当信噪比比较小的时候，就认为是噪声，衰减因子G_k就远远小于1，对Y_k进行衰减。

从公式1不难看出，信噪比的大小是严重依赖于当前估计的噪声值。若当前估计不足，则使得信噪比偏大，可能导致噪声被当成语音保留；若估计过多，则使得信噪比偏小，可能导致语音被当成噪声衰减。

噪声估计通常有两种方法：一种是硬判决方法：通常采用平滑非语音时的带噪语音估计，采用话音激活检测器（Voice Active Detector，简称“VAD”）来区分语音和非语音，见公式2，μ为平滑系数0<μ<1。

采用VAD的噪声估计方法的主要缺陷：

1.VAD在低信噪比下准确率很低，尤其是在嘈杂的非稳态噪声环境下，容易将噪声误判为语音，导致噪声估计不足。

2.很难跟踪发生在语音间的噪声变化。

一种是软判决的方法：寻找一段时间窗口（一般取2~3s）内，最小的带噪语音|Y_k|²值，作为噪声估计的基础，再通过一定的算法计算一个偏差值，将偏差值乘以最小值，作为当前帧的噪声估计。采用最小统计量的软判决方法主要的缺点是跟踪速度过慢，由于需要搜索2s左右时间窗口的最小值，导致存在较大的跟踪延时，无法快速跟踪噪声特性的变化。

发明内容

本发明的目的在于提供一种基于隐马尔科夫链模型的噪声估计方法和装置，使得在噪声抑制中能快速估计噪声的变化，准确估计快速变化的非稳态环境中的噪声，提升噪声抑制的性能。

为解决上述技术问题，本发明的实施方式提供了一种基于隐马尔科夫链模型的噪声估计方法，包含以下步骤：

根据预先建立的HMM，确定当前帧中语音存在的概率；其中，所述HMM的观测向量由至少一帧带噪语音的频谱组成；

根据所述语音存在的概率，计算平滑因子；其中，所述平滑因子与当前观测向量条件下当前帧中语音存在的概率成线性关系；

根据所述平滑因子、前一帧中噪声的方差估计值和当前帧带噪语音的功率谱，计算当前帧中噪声的方差估计值。

本发明的实施方式还提供了一种基于隐马尔科夫链模型的噪声估计装置，包含：语音存在概率计算模块、平滑因子计算模块、噪声估计模块；

所述语音存在概率计算模块用于根据预先建立的HMM，确定当前帧中语音存在的概率；其中，所述HMM的观测向量由至少一帧带噪语音的频谱组成；

所述平滑因子计算模块用于根据所述语音存在的概率，计算平滑因子；其中，所述平滑因子与当前观测向量条件下当前帧中语音存在的概率成线性关系；

所述噪声估计模块用于根据所述平滑因子、前一帧中噪声的方差估计值和当前帧带噪语音的功率谱，计算当前帧中噪声的方差估计值。

本发明实施方式相对于现有技术而言，根据预先建立的HMM，确定当前帧中语音存在的概率；并根据该语音存在的概率，计算平滑因子；接着根据平滑因子，计算当前帧中噪声的估计值。本发明利用隐马尔科夫链状态转移来确定语音存在的概率，并利用该概率去控制噪声更新的大小，从而在噪声抑制中能快速估计噪声的变化，可以准确估计快速变化的非稳态环境中的噪声，提升噪声抑制的性能。

另外，通过以下公式，根据所述语音存在的概率，计算平滑因子：

μ_N=μ+(1-μ)p(q_m=H₁|Ψ_m)

其中，μ_N为平滑因子；μ为固定常数，0<μ<1；p(q_m=H₁|Ψ_m)为当前观测向量Ψ_m条件下当前帧中语音存在的概率；H₁为语音存在状态，Ψ_m={Y_k(m),Y_k(m-1),…,Y_k(1)}为当前观测向量，m代表帧序号。

通过语音存在的概率控制噪声更新的大小，可以快速估计噪声的变化。

另外，通过以下公式，根据所述平滑因子μ_N、前一帧中噪声的方差估计值和当前帧带噪语音的功率谱|Y_k(m)|²，计算当前帧中噪声的方差估计值

其中，k代表频点序号。

通过对每一帧带噪语音计算平滑因子，可以准确估计快速变化的非稳态环境中的噪声大小，从而提升噪声抑制的性能。

另外，所述当前观测向量条件下当前帧中语音存在的概率p(H₁|Ψ_m)通过以下公式计算：

其中，Λ_k(m)为当前帧的似然比，p(Ψ_m|q_m=H₁)是当前帧包含语音时观测序列Ψ_m出现的条件概率，p(q_m=H₁)是当前帧包含语音的概率，p(Ψ_m|q_m=H₀)是当前帧不含语音时观测序列Ψ_m出现的条件概率，p(q_m=H₀)是当前帧不含语音的概率。

通过计算当前帧的似然比，可以简化语音存在的概率的计算，降低计算复杂度。

另外，所述HMM为两状态的一阶HMM；其中，所述HMM的两个状态为：语音存在时为状态H₁，语音不存在时为状态H₀；

所述HMM的状态转移矩阵为：

其中，a_ij为状态转移概率：a_ij=p{q_m=H_j|q_m-1=H_i} i,j∈{0,1}；

状态序列为{q_m,q_m-1…q₁}；下角标m代表帧序号；

所述a_ij根据噪声环境选择。

通过采用两状态的一阶HMM，使噪声估计更简单实用，从而可以进一步快速估计噪声的变化。

另外，所述当前帧的似然比Λ_k(m)通过以下公式计算：

其中，Λ_k(m-1)为前一帧的似然比；

ξ_k(m)和γ_k(m)分别为当前帧的先验信噪比和后验信噪比。

通过当前帧的先验信噪比和后验信噪比计算似然比，可以使语音存在概率更易于获取，从而可以进一步快速估计噪声的变化。

另外，所述当前帧的似然比Λ_k(m)通过以下公式计算：

其中，Λ_k(m-1)为前一帧的似然比；

ξ_k(m-i)，γ_k(m-i)，i＝1,2,3,…,M，分别为前M帧的先验信噪比和后验信噪比；所述M为预设值。

通过多个观察向量，可以获得更为准确的语音存在概率，可以进一步准确地估计快速变化的非稳态环境中的噪声，从而提升噪声抑制的性能。

附图说明

图1是现有的频域噪声抑制算法的流程图；

图2是根据本发明第一实施方式的基于HMM的噪声估计方法的流程图；

图3是根据本发明第一实施方式的两状态一阶HMM的状态转移图；

图4是干净语音信号和0dB下带street噪声的语音信号的时域波形图；

图5是基于VAD判决方法和本发明第二实施方式的方法处理结果的语谱对比图；

图6是基于最小统计量方法和本发明第二实施方式的方法处理结果的语谱对比图；

图7是根据本发明第三实施方式的基于HMM的噪声估计装置的结构框图；

图8是是根据本发明第四实施方式的基于HMM的噪声估计装置的一种实现框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明的各实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本发明各实施方式中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施方式的种种变化和修改，也可以实现本申请各权利要求所要求保护的技术方案。

本发明的第一实施方式涉及一种基于隐马尔科夫链模型的噪声估计方法，具体流程如图2所示，包含以下步骤：

步骤201，根据预先建立的HMM，确定当前帧中语音存在的概率；其中，该HMM的观测向量由一帧带噪语音的频谱组成。

HMM建模广泛应用于语音识别中，是目前主流的语音识别算法，但考虑到识别率，其HMM往往比较复杂。而在噪声抑制中，考虑到简单实用性，需要简化HMM建模，因此，本实施方式中，采用一阶马尔科夫链模型。

HMM的两个状态为：语音存在时为状态H₁，语音不存在时为状态H₀。

H₁:Y_k(m)=X_k(m)+N_k(m) （3）

H₀:Y_k(m)=N_k(m)

语音和噪声通常采用零均值的复高斯分布建模，此处省略了帧号m：

公式4中方差和分别对应于当前频点k处的语音方差和噪声方差，即公式1中先验信噪比ξ_k的分子和分母。

状态间转移如图3所示，状态序列为{q_m,q_m-1...q₁}，根据图3，状态转移概率：p{q_m=H_j|q_m-1=H_i}=a_iji,j∈{0,1} （5）

状态转移矩阵为：

其中，下角标m代表帧序号。

事实上，对于语音信号，若前一帧为语音信号，则当前帧继续为语音的概率也很大，因此，公式5的状态转移矩阵中可以取p{q_m=H₁|q_m-1=H₁}>p{q_m=H₁}。也就是说a₁₁是通常取大于a₀₀的值。增大a₁₁会倾向于保存语音，但与此同时，噪声可能也会被保留。因此，这些参数需要根据噪声环境选择。例如在嘈杂环境中往往希望噪声抑制比较多，a₁₁就取偏向0。而在安静环境下，为了避免过多的语音失真，从而需要保存语音更多点，a₁₁就取偏向1。

步骤202，根据语音存在的概率，计算平滑因子；其中，平滑因子与当前观测向量条件下当前帧中语音存在的概率成线性关系。

可以通过以下公式，根据语音存在的概率，计算平滑因子μ_N：

μ_N=μ+(1-μ)p(H₁|Ψ_m)

其中，μ为固定常数，0<μ<1；p(H₁|Ψ_m)为当前观测向量Ψ_m条件下当前帧中语音存在的概率；H₁为语音存在状态，Ψ_m={Y_k(m),Y_k(m-1),…,Y_k(1)}为当前观测向量，m代表帧序号。

条件概率p(H₁|Ψ_m)可通过贝叶斯公式计算：

公式7中的似然比为：

其中，p(Ψ_m|H₁)是当前帧包含语音时观测序列Ψ_m出现的条件概率，p(H₁)是当前帧包含语音的概率，p(Ψ_m|H₀)是当前帧不含语音时观测序列Ψ_m出现的条件概率，p(H₀)是当前帧不含语音的概率。

为了表述方便，令α_m(0)=p(q_m=H₀,Ψ_m)，似然比为可以改写为：

由于HMM的观测向量由一帧带噪语音的频谱组成，根据上述马尔科夫链的转移矩阵，可以很容易的获得：

α_m(0)＝{α_m-1(0)a₀₀+α_m-1(1)a₁₀}p(Y_k(m)|q_m＝H₀)

(9)

α_m(1)＝{α_m-1(0)a₀₁+α_m-1(1)a₁₁}p(Y_k(m)|q_m＝H₁)

因此，似然比：

根据假设的复高斯模型，可以很容易获得：

（11）

公式11是基于单个观测向量Y_k(m)的似然比，ξ_k(m)和γ_k(m)分别为当前帧的先验信噪比和后验信噪比，由于先验信噪比变化比较缓慢，实际在计算公式11时中往往采用前一帧的ξ_k(m-1)，γ_k(m-1)近似来近似估计当前帧的信噪比ξ_k(m)，γ_k(m)。

步骤203，根据平滑因子、前一帧中噪声的方差估计值和当前帧带噪语音的功率谱，计算当前帧中噪声的方差估计值。

可以通过以下公式，根据平滑因子μ_N、前一帧中噪声的方差估计值和当前帧带噪语音的功率谱|Y_k(m)|²，计算当前帧中噪声的方差估计值

其中，k代表频点序号。

由上式可以看出，μ_N越大，在计算时，倾向越多；而(1-μ_N)越小，|Y_k(m)|²参与计算的成分越少；而平滑因子μ_N与当前帧中语音存在的概率成正比，也就是说，当前帧中语音存在的概率越大，则更倾向于使用前一帧噪声的方差估计值，当前帧带噪语音的功率谱更新噪声越少；当前帧中语音存在的概率越小，则更倾向于采用当前帧带噪语音的功率谱更新噪声越多，从而快速、准确地更新噪声的变化。

上述μ_N和的计算式，可以通过以下步骤推导得到：

根据上述假设，公式2的噪声估计就可以写成：

公式12中的μ为某个固定常数，0<μ<1。

假设根据当前观测向量Ψ_m={Y_k(m),Y_k(m-1),…,Y_k(1)}的条件概率分别为p(q_m=H₁|Ψ_m)和p(q_m=H₀|Ψ_m)，可通过期望的方式估计噪声：

公式13中μ_N=(μ+(1-μ)p(q_m=H₁|Ψ_m))，p(q_m=H₁|Ψ_m)=1-p(q_m=H₀|Ψ_m) （14）

与现有技术相比，本实施方式根据预先建立的HMM，确定当前帧中语音存在的概率p(H₁|Ψ_m)；并根据该语音存在的概率，计算平滑因子μ_N；接着根据平滑因子，计算当前帧中噪声的方差估计值本实施方式利用隐马尔科夫链状态转移来确定语音存在的概率，并利用该概率去控制噪声更新的大小，从而在噪声抑制中能快速估计噪声的变化，可以准确估计快速变化的非稳态环境中的噪声，提升噪声抑制的性能。

本发明的第二实施方式涉及一种基于隐马尔科夫链模型的噪声估计方法。第二实施方式与第一实施方式大致相同，主要区别之处在于：在第一实施方式中，在计算当前帧中的语音存在概率时，通过采用单个观测向量计算当前帧的似然比，计算语音存在的概率；而在本发明第二实施方式中，将单个观测向量延拓至多个观测向量，以获得更加准确的语音存在信息。

具体地说，当前帧的似然比Λ_k(m)通过以下公式计算：

其中，Λ_k(m-1)为前一帧的似然比；

ξ_k(m-i)，γ_k(m-i)i＝1,2,3,…,M，分别为前M帧的先验信噪比和后验信噪比；M为预设值。

也就是说，为了简化计算复杂度，假设这M个观测向量相互独立，可近似看成是M阶马尔科夫链，那么公式11可以转化为：

（15）

为了较好地评价本实施方式，使用0dB时的含street噪声做测试，如图4所示，4A是干净语音信号的时域波形图，4B是0dB下带street噪声信号的时域波形图。仿真中，采用256点的FFT，重叠率为37.5%，汉明hamming窗，状态转移矩阵采用观测向量数目M取2。仿真结果见图5和图6，图5是基于VAD判决方法（5A）和本实施方式方法（5B）处理结果的语谱对比图，图6是基于最小统计量方法（6A）和本实施方式的方法（6B）处理结果的语谱对比图。从图5和图6不难看出：

1.基于VAD判决方法在0dBstreet噪声下基本不更新，导致基本没有抑制噪声，如501所示。

2.基于最小统计方法在前面4s内基本也没有抑制噪声，如601所示。

3.本发明对噪声抑制非常明显，如502所示是进行噪声抑制之后得到的语音。相对的，语音失真会稍大些，对主观音质影响不大。

上面各种方法的步骤划分，只是为了描述清楚，实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包含相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。

本发明第三实施方式涉及一种基于隐马尔科夫链模型的噪声估计装置，如图7所示，包含：语音存在概率计算模块、平滑因子计算模块、噪声估计模块。

其中，语音存在概率计算模块用于根据预先建立的HMM，确定当前帧中语音存在的概率；其中，HMM的观测向量由至少一帧带噪语音的频谱组成。

该语音存在概率计算模块可以采用两状态的一阶HMM；其中，该HMM的两个状态为：语音存在时为状态H₁，语音不存在时为状态H₀；

HMM的状态转移矩阵为：

其中，a_ij为状态转移概率：a_ij=p{q_m=H_j|q_m-1=H_i} i,j∈{0,1}；

状态序列为{q_m,q_m-1…q₁}；下角标m代表帧序号；a_ij根据噪声环境选择，a₁₁大于a₀₀。

平滑因子计算模块用于根据语音存在的概率，计算平滑因子；其中，平滑因子与当前观测向量条件下当前帧中语音存在的概率成线性关系。该平滑因子计算模块可以通过以下公式，根据语音存在的概率，计算平滑因子：

μ_N=(μ+(1-μ)p(q_m=H₁|Ψ_m))

语音存在概率计算模块进一步包含：似然比计算子模块，通过以下公式计算当前帧的似然比Λ_k(m)：

其中，p(Ψ_m|q_m=H₁)是当前帧包含语音时观测序列Ψ_m出现的条件概率，p(q_m=H₁)是当前帧包含语音的概率，p(Ψ_m|q_m=H₀)是当前帧不含语音时观测序列Ψ_m出现的条件概率，p(q_m=H₀)是当前帧不含语音的概率。

根据马尔科夫链的转移矩阵，将Λ_k(m)用Λ_k(m-1)状态转移概率表示为：

根据假设的复高斯模型，可以很容易获得：

其中，ξ_k(m)和γ_k(m)分别为当前帧的先验信噪比和后验信噪比。因此，在单个观测向量时，根据当前帧的先验信噪比和后验信噪比，很容易计算似然比。在实际计算中，可以采用前一帧的ξ_k(m-1)，γ_k(m-1)近似来近似估计当前帧的信噪比ξ_k(m)，γ_k(m)。

语音存在概率计算模块则可以通过以下公式计算当前观测向量条件下当前帧中语音存在的概率p(H₁|Ψ_m)：

噪声估计模块用于根据平滑因子、前一帧中噪声的方差估计值和当前帧带噪语音的功率谱，计算当前帧中噪声的方差估计值。该噪声估计模块通过以下公式，根据平滑因子μ_N、前一帧中噪声的方差估计值和当前帧带噪语音的功率谱|Y_k|²，计算当前帧中噪声的方差估计值

其中，k代表频点序号。

不难发现，本实施方式为与第一实施方式相对应的系统实施例，本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效，为了减少重复，这里不再赘述。相应地，本实施方式中提到的相关技术细节也可应用在第一实施方式中。

值得一提的是，本实施方式中所涉及到的各模块均为逻辑模块，在实际应用中，一个逻辑单元可以是一个物理单元，也可以是一个物理单元的一部分，还可以以多个物理单元的组合实现。此外，为了突出本发明的创新部分，本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入，但这并不表明本实施方式中不存在其它的单元。

本发明第四实施方式涉及一种基于隐马尔科夫链模型的噪声估计装置。第四实施方式与第三实施方式大致相同，主要区别之处在于：在第三实施方式中，似然比计算子模块采用单个观测向量计算似然比。而在本发明第四实施方式中，似然比计算子模块采用多个观测向量计算似然比，以获得更加准确的语音存在信息。

具体地说，似然比计算子模块通过以下公式计算当前帧的似然比Λ_k(m)：

其中，Λ_k(m-1)为前一帧的似然比；

如图8所示是结合本实施方式的整体噪声抑制结构示意图，在进行噪声估计时，采用HMM计算语音存在概率，结合多个观测向量（Multi-Observation，简称“MO”）共同确定语音存在概率，并利用该概率去控制噪声更新的大小，从而快速估计噪声的变化。

由于第二实施方式与本实施方式相互对应，因此本实施方式可与第二实施方式互相配合实施。第二实施方式中提到的相关技术细节在本实施方式中依然有效，在第二实施方式中所能达到的技术效果在本实施方式中也同样可以实现，为了减少重复，这里不再赘述。相应地，本实施方式中提到的相关技术细节也可应用在第二实施方式中。

本领域的普通技术人员可以理解，上述各实施方式是实现本发明的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本发明的精神和范围。

Claims

1.一种基于隐马尔科夫链模型HMM的噪声估计方法，其特征在于，包含以下步骤：

2.根据权利要求1所述的基于HMM的噪声估计方法，其特征在于，通过以下公式，根据所述语音存在的概率，计算平滑因子μ_N：

μ_N=μ+(1-μ)p(q_m=H₁|Ψ_m)

其中，μ为固定常数，0<μ<1；p(q_m=H₁|Ψ_m)为当前观测向量Ψ_m条件下当前帧中语音存在的概率；H₁为语音存在状态，Ψ_m={Y_k(m),Y_k(m-1),…,Y_k(1)}为当前观测向量，m代表帧序号。

3.根据权利要求1所述的基于HMM的噪声估计方法，其特征在于，通过以下公式，根据所述平滑因子μ_N、前一帧中噪声的方差估计值和当前帧带噪语音的功率谱|Y_k(m)|²，计算当前帧中噪声的方差估计值

{\hat{σ}}_{N, k}^{2} (m) = μ_{N} {\hat{σ}}_{N, k}^{2} (m - 1) + (1 - μ_{N}) {| Y_{k} (m) |}^{2}

其中，k代表频点序号。

4.根据权利要求1至3任一项所述的基于HMM的噪声估计方法，其特征在于，所述当前观测向量条件下当前帧中语音存在的概率p(q_m=H₁|Ψ_m)通过以下公式计算：

p (q_{m} = H_{1} | Ψ_{m}) = \frac{Λ_{k} (m)}{1 + Λ_{k} (m)}

其中，Λ_k(m)为当前帧的似然比，

Λ_{k} (m) = \frac{p (Ψ_{m} | q_{m} = H_{1}) p (q_{m} = H_{1})}{p (Ψ_{m} | q_{m} = H_{0}) p (q_{m} = H_{0})};

p(Ψ_m|q_m=H₁)是当前帧包含语音时观测序列Ψ_m出现的条件概率，p(q_m=H₁)是当前帧包含语音的概率，p(Ψ_m|q_m=H₀)是当前帧不含语音时观测序列Ψ_m出现的条件概率，p(q_m=H₀)是当前帧不含语音的概率。

5.根据权利要求4所述的基于HMM的噪声估计方法，其特征在于，所述HMM为两状态的一阶HMM；其中，所述HMM的两个状态为：语音存在时为状态H₁，语音不存在时为状态H₀；

所述HMM的状态转移矩阵为：

A = [\begin{matrix} a_{00} & a_{01} \\ a_{10} & a_{11} \end{matrix}]

其中，a_ij为状态转移概率：a_ij=p{q_m=H_j|q_m-1=H_i} i,j∈{0,1}；

状态序列为{q_m,q_m-1…q₁}；下角标m代表帧序号；

所述a_ij根据噪声环境选择。

6.根据权利要求5所述的基于HMM的噪声估计方法，其特征在于，所述a₁₁大于所述a₀₀。

7.根据权利要求5所述的基于HMM的噪声估计方法，其特征在于，所述当前帧的似然比Λ_k(m)通过以下公式计算：

Λ_{k} (m) = \frac{a_{01} + Λ_{k} (m - 1) a_{11}}{a_{00} + Λ_{k} (m - 1) a_{10}} Λ_{k}

其中，Λ_k(m-1)为前一帧的似然比；

Λ_{k} = \frac{1}{1 + ξ_{k} (m)} \exp {\frac{ξ_{k} (m) γ_{k} (m)}{1 + ξ_{k} (m)}},

ξ_k(m)和γ_k(m)分别为当前帧的先验信噪比和后验信噪比。

8.根据权利要求5所述的基于HMM的噪声估计方法，其特征在于，所述当前帧的似然比Λ_k(m)通过以下公式计算：

Λ_{k} (m) = \frac{a_{01} + Λ_{k} (m - 1) a_{11}}{a_{00} + Λ_{k} (m - 1) a_{10}} {Λ^{'}}_{k}

其中，Λ_k(m-1)为前一帧的似然比；

{Λ^{'}}_{k} = Π_{i = 0}^{M - 1} \frac{1}{1 + ξ_{k} (m - i)} \exp {\frac{ξ_{k} (m - i) γ_{k} (m - i)}{1 + ξ_{k} (m - i)}},

ξ_k(m-i)，γ_k(m-i)，i＝0,1,2,3,…,M，分别为前M帧的先验信噪比和后验信噪比；所述M为预设值。

9.一种基于HMM的噪声估计装置，其特征在于，包含：语音存在概率计算模块、平滑因子计算模块、噪声估计模块；

10.根据权利要求9所述的基于HMM的噪声估计装置，其特征在于，所述平滑因子计算模块通过以下公式，根据所述语音存在的概率，计算平滑因子：

μ_N=μ+(1-μ)p(q_m=H₁|Ψ_m)

11.根据权利要求9所述的基于HMM的噪声估计装置，其特征在于，所述噪声估计模块通过以下公式，根据所述平滑因子μ_N、前一帧中噪声的方差估计值和当前帧带噪语音的功率谱|Y_k(m)|²，计算当前帧中噪声的方差估计值

{\hat{σ}}_{N, k}^{2} (m) = μ_{N} {\hat{σ}}_{N, k}^{2} (m - 1) + (1 - μ_{N}) {| Y_{k} (m) |}^{2}

其中，k代表频点序号。

12.根据权利要求9至11任一项所述的基于HMM的噪声估计装置，其特征在于，所述语音存在概率计算模块包含：似然比计算子模块，通过以下公式计算当前帧的似然比Λ_k(m)：

Λ_{k} (m) = \frac{p (Ψ_{m} | q_{m} = H_{1}) p (q_{m} = H_{1})}{p (Ψ_{m} | q_{m} = H_{0}) p (q_{m} = H_{0})};

其中，p(Ψ_m|q_m=H₁)是当前帧包含语音时观测序列Ψ_m出现的条件概率，p(q_m=H₁)是当前帧包含语音的概率，p(Ψ_m|q_m=H₀)是当前帧不含语音时观测序列Ψ_m出现的条件概率，p(q_m=H₀)是当前帧不含语音的概率；

所述语音存在概率计算模块通过以下公式计算所述当前观测向量条件下当前帧中语音存在的概率p(q_m=H₁|Ψ_m)：

p (q_{m} = H_{1} | Ψ_{m}) = \frac{Λ_{k} (m)}{1 + Λ_{k} (m)} .

13.根据权利要求12所述的基于HMM的噪声估计装置，其特征在于，所述语音存在概率计算模块采用的HMM为两状态的一阶HMM；其中，所述HMM的两个状态为：语音存在时为状态H₁，语音不存在时为状态H₀；

所述HMM的状态转移矩阵为：

A = [\begin{matrix} a_{00} & a_{01} \\ a_{10} & a_{11} \end{matrix}]

其中，a_ij为状态转移概率：a_ij=p{q_m=H_j|q_m-1=H_i} i,j∈{0,1}；

状态序列为{q_m,q_m-1…q₁}；下角标m代表帧序号；

所述a_ij根据噪声环境选择。

14.根据权利要求13所述的基于HMM的噪声估计方法，其特征在于，所述a₁₁大于所述a₀₀。

15.根据权利要求13所述的基于HMM的噪声估计装置，其特征在于，所述似然比计算子模块通过以下公式计算所述当前帧的似然比Λ_k(m)：

Λ_{k} (m) = \frac{a_{01} + Λ_{k} (m - 1) a_{11}}{a_{00} + Λ_{k} (m - 1) a_{10}} Λ_{k}

其中，Λ_k(m-1)为前一帧的似然比；

Λ_{k} = \frac{1}{1 + ξ_{k} (m)} \exp {\frac{ξ_{k} (m) γ_{k} (m)}{1 + ξ_{k} (m)}},

ξ_k(m)和γ_k(m)分别为当前帧的先验信噪比和后验信噪比。

16.根据权利要求13所述的基于HMM的噪声估计装置，其特征在于，所述似然比计算子模块通过以下公式计算所述当前帧的似然比Λ_k(m)：

Λ_{k} (m) = \frac{a_{01} + Λ_{k} (m - 1) a_{11}}{a_{00} + Λ_{k} (m - 1) a_{10}} {Λ^{'}}_{k}

其中，Λ_k(m-1)为前一帧的似然比；

{Λ^{'}}_{k} = Π_{i = 0}^{M - 1} \frac{1}{1 + ξ_{k} (m - i)} \exp {\frac{ξ_{k} (m - i) γ_{k} (m - i)}{1 + ξ_{k} (m - i)}},