CN101111888A

CN101111888A - 信号处理方法和装置

Info

Publication number: CN101111888A
Application number: CNA2005800476036A
Authority: CN
Inventors: 松原光良; 大谷猛; 远藤香绪里; 大田恭士
Original assignee: Fujitsu Ltd
Current assignee: FICT Ltd
Priority date: 2005-02-02
Filing date: 2005-02-02
Publication date: 2008-01-23
Anticipated expiration: 2025-02-02
Also published as: JP4519169B2; EP1845520A1; CN100593197C; US20070265840A1; JPWO2006082636A1; EP1845520A4; WO2006082636A1

Abstract

本发明提供了一种信号处理方法和装置，该信号处理方法和装置在噪声电平的急剧上升分段中提高了所估算的噪声的跟踪速度，并且在语音分段中很少产生由于语音的影响而导致的噪声频谱的估算误差，在该信号处理方法和装置中，提取作为输入信号的抽样数据的时域信号，按帧将该时域信号转换成频域信号，并计算输入频谱。此外，获得输入频谱的最小值，以估算噪声频谱，所述噪声频谱是包括在输入语音信号中的噪声分量的频域信号。此外，将该输入频谱与该噪声频谱进行比较，以确定分段是在噪声分段还是混合了语音与噪声的混合分段中。

Description

信号处理方法和装置

技术领域

本发明涉及信号处理方法和装置，具体地说，涉及例如用于数字移动电话的噪声消除器、VAD(语音活动检测)等中的语音信号处理所需的方法和装置。

背景技术

作为一种在数字移动电话等中抑制通信语音中的背景噪声以使得能够容易地听到语音的技术，噪声消除器可以被提及。同样，作为一种通过根据语音的存在/不存在而打开/关闭发射输出来节省发射部的电力的技术，VAD可以被提及。对于噪声消除器、VAD等，需要在通信过程中确定语音存在的分段或者没有语音存在的分段。

作为确定这分段的方法，例如可以提及下述的方法，即，通过将过去计算出的长期的平均功率看作噪声的功率，将噪声功率与当前分段中的功率进行比较，以将功率较大的当前分段确定或判定为语音分段。然而，仅通过这种简单的功率比较，当背景噪声电平很高并且信噪比SNR_n很小时，存在语音被错认为噪声的情况。

作为对于这种情况的措施，已经提出了通过利用语音的频域信号来执行分段确定的方法(例如参见专利文献1)。在下文中，将对这种技术进行描述。

对输入信号周期性地执行时间-频率转换。计算输入信号的频域信号(在下文中，称为输入频谱)。把过去计算出的长期的平均输入频谱看作噪声频谱(在下文中，称为平均噪声频谱)。为平均噪声频谱和输入频谱中的每一个计算每带宽的信噪比SNR_n，以便在所需带宽下计算每带宽的信噪比SNR_n的平均值、正(负)变化量、离差值(dispersion value)等。通过利用这些值，来执行分段确定。同样，仅在通过上述分段确定将该分段确定为噪声分段时，才利用输入频谱对平均噪声频谱进行更新。因此，实现了更精确的分段确定。

专利文献1：日本专利申请特开No.2001-265367

发明内容

然而，如在专利文献1中所述的现有技术中，仅在噪声分段中对平均噪声频谱进行更新。因此，当噪声电平急剧上升时，噪声分段被错认为语音分段，此后不对平均噪声频谱进行更新，从而不利地持续错误的确定。

为了避免这种错误的确定，专利文献1还公开了下述的方法，即，根据每带宽的信噪比SNR_n来控制噪声更新的时间常数，以与分段确定的结果无关地对噪声进行更新。

然而，当在语音分段中对平均噪声频谱进行更新时，由于语音的影响而对平均噪声频谱明显估计过高。因此，出现了一个新的问题，即，低电平的语音分段很容易被错认为噪声分段。

因此，本发明的一个目的是提供一种信号处理方法和装置，其中，在具有急剧上升的噪声电平的分段中，提高所估算的噪声的跟踪速度(following speed)，以使得在信号分段中几乎不产生由于语音的影响而导致的噪声频谱的估算误差。

(1)为了实现上述目的，根据本发明的信号处理方法包括：时域信号提取步骤，用于提取时域信号，所述时域信号是输入信号的抽样数据；频域信号分析步骤，用于按帧将所述时域信号转换成频域信号，并计算输入频谱；以及噪声估算步骤，通过利用所述输入频谱的最小分量来估算噪声频谱，所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号。将参照附图对这种方法进行描述。

首先，采用如图1所示的输入信号(叠加了噪声的语音)作为示例。在图1中，分段(i)与(iv)是“噪声独占分段”(在下文中，称为噪声分段)。在分段(iii)中，出现了噪声电平的急剧上升。分段(ii)与(v)是“混合了语音与噪声的混合分段”(在下文中称为混合分段)。图2示出了上述分段(i)、(ii)、(iv)以及(v)的典型输入频谱。

当将图2中的分段(i)的输入频谱A与分段(ii)的输入频谱A进行比较时，分段(ii)中的“语音和噪声的混合分段”中的输入频谱A的最小部分(图2中的实心圆)被所叠加的噪声屏蔽，其中噪声的贡献程度很高。因此，这些最小部分变得在值方面等于作为“噪声独占分段”的分段(i)中的输入频谱的最小部分。对于噪声电平增加的情况也是一样，以使得作为“噪声独占分段”的分段(iv)中的频谱的最小部分的值变得等于作为“语音和噪声的混合分段”的分段(v)中的频谱的最小部分的值。在下文中，用直线来连接输入频谱的最小部分，这将被称为如图2所示的最小频谱B。

基于这种原理，在本发明的时域信号提取步骤与频域信号分析步骤中，根据预定分段的时域的输入信号计算作为频域信号的输入频谱A。在噪声估算步骤中，通过利用输入频谱A的最小值来获得最小频谱B，以估算作为当前帧内的噪声分量的频域信号的噪声频谱。

因此，在本发明中通过利用频谱的最小部分来计算所估算的噪声，以使得几乎不产生由于语音信号的影响而导致的噪声频谱的估算误差，并且可以在噪声电平的急剧上升分段中提高所估算的噪声的跟踪速度。

(2)在上述的(1)中，在噪声估算步骤中，可以获得每帧的瞬时噪声频谱作为噪声频谱。

因此，由于在该帧内结束或完成了噪声频谱的估算步骤，所以使得较高敏感度的噪声估算成为可能。同样，利用相对小规模的电路结构的实现也成为可能。

(3)在上述的(2)中，在噪声估算步骤中，可以获得多个帧的瞬时噪声频谱的平均噪声频谱作为噪声频谱。

因此，在长时间内对所估算的噪声频谱进行平均，以使得更稳定的噪声估算成为可能。

(4)上述(1)-(3)中的任何一个可以进一步包括分段确定步骤，用于对所述噪声频谱与所述输入频谱进行比较，并确定该帧是在混合了语音和噪声的分段中还是在没有语音的噪声分段中。

也就是说，如图1和2所示，对基于输入频谱A和最小频谱B的瞬时噪声频谱相互进行比较，由此可以指定混合分段和噪声分段，并且可以构造在噪声抑制和节能方面优异的系统。

(5)在上述的(4)中，在噪声估算步骤中，当在分段确定步骤中直到最后一帧的确定结果表示混合分段时，可以通过利用瞬时噪声频谱来获得平均噪声频谱，而当确定结果表示噪声分段时，可以通过利用输入频谱来获得平均噪声频谱。

也就是说，当在分段确定步骤中直到最后一帧的确定结果表示混合分段时，通过如上所述利用瞬时噪声频谱来获得平均噪声频谱。另一方面，当确定结果表示噪声分段时，不需要利用瞬时噪声频谱而只需要利用输入频谱。因此，基于输入频谱来获得平均噪声频谱。

(6)上述的(4)可以进一步包括抑制量计算步骤，用于在考虑了分段确定步骤中的确定结果的情况下，基于噪声频谱与输入频谱对输入信号计算每带宽的抑制量，并抑制输入信号的噪声。

因此，基于噪声频谱与输入频谱计算输入信号的抑制量。然而，考虑到分段确定步骤中的确定结果，如果在例如混合分段的情况下减小抑制量，而在噪声分段的情况下增大抑制量，则可以进行更有效的噪声抑制。

因此，具有灵敏度与稳定性之间的平衡的噪声估算成为可能。

(7)在上述(1)-(6)中的任何一个中，输入信号可以包括语音信号。在这种情况下，可以提供有效的应用。

应当注意，可以实现用于分别执行在上述(1)-(7)中描述的信号处理方法的信号处理装置。

根据本发明，在噪声电平的急剧上升分段中提高了所估算的噪声的跟踪速度，并且在混合分段中减小了由于语音的影响而导致的噪声频谱的估算误差，从而可以执行精确的分段确定。

附图说明

图1是用于说明本发明的原理的波形图，其示出了每分段的输入语音信号的变化；

图2是示出了图1中的每分段的输入语音信号的频谱的频谱图；

图3是示出了根据本发明的第一实施方式的信号处理装置的构造框图；

图4是示出了由本发明的第一实施方式的信号处理装置计算出的最小频谱的示例的频谱图；

图5是用于说明校正系数的计算的频谱图，该校正系数用于与由根据本发明的第一实施方式的信号处理装置计算出的最小频谱相乘；

图6是用于说明校正系数的计算的关系图，该校正系数用于与由根据本发明的第一实施方式的信号处理装置计算出的最小频谱相乘；

图7是示出了根据本发明的第二实施方式的信号处理装置的构造框图；

图8是示出了本发明的第三实施方式的信号处理装置的配置框图；

图9是示出了用作本发明的第四实施方式的噪声抑制装置的信号处理装置的构造框图。

标号的说明

1时域信号提取部

2频域信号分析部

3a、3b、3c噪声估算装置

4a、4b、4c分段确定装置

5抑制量计算部

7时域信号合成部

31瞬时噪声估算部

32b、32c平均噪声估算部

41a、41b、41c用于噪声/语音确定的参数计算部

42噪声/语音确定部

在所有附图中，相同的标号表示相同或相应的组件。

具体实施方式

在下文中，将参照附图对本发明的实施方式进行描述。

第一实施方式

图3是示出了根据本发明的第一实施方式的信号处理装置的构造框图，该信号处理装置用作噪声估算装置和噪声分段确定装置。该信号处理装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3a、以及分段确定装置4a。在下文中，将对该信号处理装置的各个块进行详细描述。

时域信号提取部1对模拟输入语音信号进行量化，并从中提取时域信号x_n(k)(其中“n”表示帧编号)作为每单位时间(帧)的抽样数据。同样，频域信号分析部2通过利用例如FFT(快速傅立叶变换)来执行对时域信号x_n(k)的频率分析，并计算输入频谱X_n(f)(与图2中的输入频谱A相对应)，输入频谱X_n(f)是输入信号的频谱幅值。在“Digital signalprocessing series vol.1：Digital signal processing(Tujii & Kamata)，P94-P120，Shoukoudou”、“Computer music(Curtis Roads著，Aoyagi等编译)，P452-P457，Tokyo Denki University Press”等中对FFT进行了详细描述。

应当注意，输入频谱X_n(f)可以被分成多个带宽，在各个带宽中可以用通过加权平均等计算出的带宽频谱来替代输入频谱。

同样，可以用通过BPF(带通滤波器)计算出的每带宽的输入振幅

来替代输入频谱X_n(f)。通过下列过程来计算每带宽的输入振幅

首先，通过下列方程将输入信号x_n(t)分成带宽信号

{\hat{x}}_{n} (i, t) = Σ_{j = 0}^{M - 1} (BPF (i, j) \times x_{n} (t - j))

方程(1)

BPF(i，j)：用于带宽划分的FIR滤波器系数

M：FIR滤波器级数(degree)

i：带宽号

然后，按帧通过下列方程计算每带宽的输入幅值

{\hat{X}}_{n} (i) = \frac{1}{N} Σ_{l = 0}^{N - 1} {\hat{x}}_{n}^{2} (i, t - l)

(N：帧长)方程(2)

向噪声估算装置3a和分段确定装置4a中输入这样获得的输入频谱。

噪声估算装置3a具有瞬时噪声估算部31，瞬时噪声估算部31根据输入频谱X_n(f)的近似形式来估算瞬时噪声频谱N_n(f)，该瞬时噪声频谱N_n(f)是当前帧的噪声频谱，该输入频谱X_n(f)是由频域信号分析部2计算的。通过下列过程来计算瞬时噪声频谱N_n(f)：

首先，从输入频谱X_n(f)中选择频谱的最小值m_n(k)。例如，选择满足下列条件式的输入频谱X_n(f)作为最小值m_n(k)：

X_n(f)＜X_n(f-1)并且X_n(f)＜X_n(f+1) 方程(3)

然后，根据最小值m_n(k)计算最小频谱M_n(f)(与图2中的最小频谱B相对应)。如果假定第k个频率是m_n(k)，则可以用最小值m_n(k)与f_k的函数来表示最小频谱M_n(f)。例如，当例如最小频谱M_n(f)是如图4所示的函数时，可以用下列方程来表示最小频谱M_n(f)：

M_{n} (f) = m_{n} (k - 1) + \frac{(m_{n} (k) - m_{n} (k - 1))}{(f_{k} - f_{k - 1})} \times (f - f_{k - 1})

方程(4)

应当注意，虽然图4示出了利用非线性函数来计算最小频谱M_n(f)的示例，但是也可以利用高阶多项式方程、线性函数等。

然后，通过利用这样获得的最小频谱M_n(f)来计算瞬时噪声频谱N_n(f)。应当注意，可以通过将校正系数α_n(f)与最小频谱M_n(f)相加或相乘来具体计算瞬时噪声频谱N_n(f)。

校正系数α_n(f)可以是预先根据经验从实际噪声中获得的常数(考虑到噪声的离差等)，或者可以是对每帧计算的变量。在下文中，α_n(f)是变量的情况被表示为计算示例1和2。

作为计算示例1，在被随后的噪声/语音确定部42确定为噪声分段的过去的分段中，初步计算输入频谱X_n(f)的离差值σ_n(f)，以根据离差值σ_n(f)计算校正系数α_n(f)。可以计算每频率带宽的离差值σ_n(f)，或者可以在某个特定的带宽中通过加权平均等计算离差值σ_n(f)。

作为用离差值σ_n(f)计算校正系数α_n(f)的一个示例，可以利用下列方程：

α_n(f)＝γ_n(f)×σ_n(f) 方程(5)

系数γ_n(f)是通过实验获得的经验值。

作为计算示例2，根据输入频谱X_n(f)与最小频谱M_n(f)之间的比率的积分值Rxm_n来计算校正系数α_n(f)。用下列方程来表示积分值Rxm_n：

Rx m_{n} = Σ_{f = 0}^{L - 1} (\frac{X_{n} (f)}{M_{n} (f)})

(L：频率带宽的数量) 方程(6)

积分值Rxm_n与图5中的阴影区域的面积相对应。在图5(1)示出的噪声独占分段中，积分值Rxm_n很小，而在图5(2)示出的语音和噪声的混合分段中，积分值Rxm_n很大。因此，将校正系数α_n(f)规定为例如图6所示的积分值Rxm_n的函数，基于瞬时噪声计算的校正系数α_n(f)根据语音信号在输入信号中的贡献程度而改变，以使得可以估算更接近于实际情况的噪声频谱。

此时，可以在某个特定的带宽中计算积分值Rxm_n。同样，可以对频率带宽中的Rxm-1、Rxm-2、α-1(f)以及α-2(f)使用不同的值，或者可以在某个特定的带宽中使用相同的值。应当进行适当的选择，以便与实际的噪声频谱相对应。

从噪声估算装置3a输出由瞬时噪声估算部31这样估算出的瞬时噪声频谱N_n(f)。

同时，向分段确定装置4a发送瞬时噪声频谱N_n(f)，分段确定装置4a具有噪声/语音确定部42和用于噪声/语音确定的参数计算部41a。用于噪声/语音确定的参数计算部41a通过利用瞬时噪声估算部31计算出的瞬时噪声频谱N_n(f)和来自频域信号分析部2的输入频谱X_n(f)来计算用于分段确定的参数。

作为用于分段确定的参数，根据例如输入频谱X_n(f)计算输入信号的功率，并且根据瞬时噪声频谱N_n(f)计算瞬时噪声的功率。根据各个功率计算出的信噪比SNR_n被用作用于分段确定的参数。同样，根据输入频谱X_n(f)和瞬时噪声频谱N_n(f)计算出的每带宽的信噪比的积分值R_n等也可以被用作用于分段确定的参数。可以用下列方程来表示积分值R_n：

R_{n} = Σ_{f = 0}^{L - 1} (\frac{X_{n} (f)}{N_{n} (f)})

(L：频率带宽的数量) 方程(7)

应当注意，用于获得积分值R_n的频率的积分范围可以被限于用于计算的某个特定的带宽。

噪声/语音确定部42通过对分段确定参数和阈值进行比较来执行分段确定，并输出确定结果vad_flag，该分段确定参数是由用于噪声/语音确定的参数计算部41a计算的。也就是说，如果确定结果vad_flag是FALSE，则意味着该帧是包括语音的混合分段，而如果确定结果vad_flag是TRUE，则意味着该帧是没有语音的噪声分段。

作为分段确定参数，可以使用由用于噪声/语音确定的参数计算部41a计算出的信噪比SNR_n或者使用积分值R_n。为了更有效的实现，可以将用于噪声/语音确定的参数计算部41a设置为计算信噪比SNR_n和积分值R_n两者，其中，分段确定参数被计算为信噪比SNR_n和积分值R_n的函数，以用于确定。

第二实施方式

图7示出了根据本发明的第二实施方式的信号处理装置，该信号处理装置用作噪声估算装置和噪声分段确定装置。以与根据第一实施方式的信号处理装置相同的方式，该信号处理装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3b、以及分段确定装置4b。在该第二实施方式中，与第一实施方式不同，未发生变化的瞬时噪声频谱不被假定为估算噪声频谱，而是被用来计算平均噪声频谱，该平均噪声频谱被输出为估算噪声频谱。应当注意，具有与图3中相同的标号的块与第一实施方式中的块相同，因此将在下文中省略对其的描述。

也就是说，噪声估算装置3b中的平均噪声估算部32b通过利用由瞬时噪声估算部31计算出的瞬时噪声频谱N_n(f)来计算平均噪声频谱

在下文中，作为平均噪声频谱

的实施方式，可以提及下列的计算1和2。

作为计算示例1，通过利用FIR滤波器来计算平均噪声频谱

此时，通过对包括当前帧的过去的K帧的瞬时噪声频谱N_n(f)进行加权平均来计算平均噪声频谱

这可以用下列方程来表示：

{\overset{&OverBar;}{N}}_{n} (f) = Σ_{n = 0}^{K - 1} β_{n} (f) \times N_{n} (f)

β_n(f)：加权系数方程(8)

加权系数β_n(f)可以被设定为对于每一频率不同的值。

作为计算示例2，通过IIR滤波器来计算平均噪声频谱。此时，以瞬时噪声频谱N_n(f)的长期平均来计算平均噪声频谱

这可以用下列方程来表示：

{\overset{&OverBar;}{N}}_{n} (f) = λ (f) \times {\overset{&OverBar;}{N}}_{n - 1} (f) + (1 - λ (f)) \times N_{n} (f)

λ(f)：加权系数方程(9)

加权系数λ_n(f)可以被设定为对于每一频率不同的值。

已接收到由平均噪声估算部32b这样获得的平均噪声频谱

的用于噪声/语音确定的参数计算部41b可以通过利用平均噪声频谱而不是瞬时噪声频谱N_n(f)来类似地计算在第一实施方式的用于噪声/语音确定的参数计算部41a中描述的信噪比SNR_n和每频带的信噪比的积分值R_n。噪声/语音确定部42中的后续处理与第一实施方式中的相同。

第三实施方式

图8示出了本发明的第三实施方式的用作噪声估算装置和噪声分段确定装置的信号处理装置。以与根据第一实施方式的信号处理装置相同的方式，该信号处理装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3c、以及分段确定装置4c。然而，该实施方式与第二实施方式的不同之处在于，被确定为噪声分段的分段的输入频谱未发生变化地用于后续帧中的平均噪声频谱的计算。应当注意，具有与图3中相同的标号的块与第一实施方式中的块相同，因此将在下文中省略对其的描述。平均噪声估算部32c计算平均噪声频谱

为了计算平均噪声频谱

在分段确定装置4c中通过利用输入频谱X_n(f)和直到最后一帧的平均噪声频谱

来执行分段确定。

结果，在被确定为混合分段(vad_flag＝FALSE)的分段中利用瞬时噪声频谱N_n(f)来计算平均噪声频谱

并且在被确定为噪声分段(vad_flag＝TRUE)的分段中利用输入频谱X_n(f)来计算平均噪声频谱

也就是说，当确定结果表示噪声分段时，输入信号是噪声分量本身，因此如上所述，只需要利用输入频谱而不需要利用瞬时噪声频谱。

用于噪声/语音确定的参数计算部41c通过用在平均噪声估算部32c中计算的直到最后一帧的平均噪声频谱

代替瞬时噪声频谱N_n(f)来计算由第一实施方式的用于噪声/语音确定的参数计算部41a计算的信噪比SNR_n和每频带的信噪比的积分值R_n。

第四实施方式(噪声抑制装置)

图9示出了根据本发明的第四实施方式的用作噪声抑制装置的信号处理装置。该噪声抑制装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3a、以及分段确定装置4a，这些组件都已在根据第一实施方式的信号处理装置中进行了描述。根据第四实施方式的噪声抑制装置进一步具有抑制量计算部5、抑制部6、以及时域信号合成部7。

首先，频域信号分析部2通过利用FFT来产生输入频谱X_n(f)。抑制量计算部5通过利用由频域信号分析部2计算出的输入频谱X_n(f)和由瞬时噪声估算部31计算出的瞬时噪声频谱N_n(f)来计算每带宽的抑制系数G_n(f)。通过下列方程来计算抑制系数G_n(f)：

G_{n} (f) = W_{n} (f) (1 - \frac{N_{n} (f)}{X_{n} (f)})

(0＜G_n(f)＜1) 方程(10)

应当注意，当噪声/语音确定部42中的确定结果vad_flag表示混合分段时，减小方程(10)中的系数W_n(f)，并且当确定结果表示噪声分段时，增大系数W_n(f)，从而使得噪声分段中的抑制系数变得大于混合分段中的抑制系数。因此，可以增加抑制量。

抑制部6通过利用输入频谱X_n(f)和由抑制量计算部5计算出的抑制系数G_n(f)而在噪声抑制后计算每带宽的振幅谱Y_n(f)。通过下列方程计算振幅谱Y_n(f)：

Y_n(f)＝X_n(f)×G_n(f) 方程(11)

时域信号合成部7通过IFFT(快速傅立叶逆变换)把振幅谱Y_n(f)从频域逆变换到时域，以计算输出信号y_n(t)。

虽然图9利用了第一实施方式中示出的噪声估算装置3a和分段确定装置4a，但是也可以利用在第二实施方式和第三实施方式中示出的噪声估算装置3a和分段确定装置4a。此时，抑制量计算部5通过用平均噪声频谱代替瞬时噪声频谱N_n(f)来计算抑制系数G_n(f)。

虽然已通过上述的实施方式对本发明进行了详细描述，但是显而易见的是，本发明不限于上述实施方式。在不脱离权利要求的描述所确定的目的和范围的情况下，本发明的装置可以被实现为经修正的和经修改的方式。

例如，在根据本发明的第四实施方式的噪声抑制装置中，当用FIR滤波器计算出的每带宽的输入幅值

代替用FFT计算出的输入频谱X_n(f)时，可以通过利用与每带宽的输入幅值相对应的逆变换而不是IFFT来计算时域的输出信号y_n(t)。

Claims

1.一种信号处理方法，该信号处理方法包括：

时域信号提取步骤，用于提取时域信号，所述时域信号是输入信号的抽样数据；

频域信号分析步骤，用于按帧将所述时域信号转换成频域信号并计算输入频谱；以及

噪声估算步骤，用于通过利用所述输入频谱的最小分量来估算噪声频谱，所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号。

2.根据权利要求1所述的信号处理方法，其中，所述噪声估算步骤包括获得每帧的瞬时噪声频谱作为所述噪声频谱。

3.根据权利要求2所述的信号处理方法，其中，所述噪声估算步骤包括获得多个帧的瞬时噪声频谱的平均噪声频谱作为所述噪声频谱。

4.根据权利要求1到3中的任意一项所述的信号处理方法，该方法还包括分段确定步骤，用于对所述噪声频谱与所述输入频谱进行比较，并确定所述帧是在混合了语音和噪声的分段中还是在没有语音的噪声分段中。

5.根据权利要求4所述的信号处理方法，其中，当在所述分段确定步骤中直到最后一帧的确定结果表示混合分段时，所述噪声估算步骤包括通过利用所述瞬时噪声频谱来获得所述平均噪声频谱，而当所述确定结果表示噪声分段时，所述噪声估算步骤包括通过利用所述输入频谱来获得所述平均噪声频谱。

6.根据权利要求4所述的信号处理方法，该方法还包括抑制量计算步骤，用于考虑了所述分段确定步骤的确定结果的情况下，基于所述噪声频谱和所述输入频谱对所述输入信号计算每带宽的抑制量，并抑制所述输入信号的噪声。

7.根据权利要求1到6中的任意一项所述的信号处理方法，其中，所述输入信号包括语音信号。

8.一种信号处理装置，该信号处理装置包括：

时域信号提取部，用于提取时域信号，所述时域信号是输入信号的抽样数据；

频域信号分析部，用于按帧将所述时域信号转换成频域信号并计算输入频谱；以及

噪声估算部，用于通过利用所述输入频谱的最小分量来估算噪声频谱，所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号。

9.根据权利要求8所述的信号处理装置，其中，所述噪声估算部获得每帧的瞬时噪声频谱作为所述噪声频谱。

10.根据权利要求9所述的信号处理装置，其中，所述噪声估算部获得多个帧的瞬时噪声频谱的平均噪声频谱作为所述噪声频谱。

11.根据权利要求8到10中的任意一项所述的信号处理装置，该信号处理装置还包括分段确定部，用于对所述噪声频谱和所述输入频谱进行比较，并确定所述帧是在混合了语音和噪声的分段中还是在没有语音的噪声分段中。

12.根据权利要求11所述的信号处理装置，其中，当在所述分段确定部中直到最后一帧的确定结果表示混合分段时，所述噪声估算部通过利用所述瞬时噪声频谱来获得所述平均噪声频谱，而当所述确定结果表示噪声分段时，所述噪声估算部通过利用所述输入频谱来获得所述平均噪声频谱。

13.根据权利要求11所述的信号处理装置，该信号处理装置还包括抑制量计算部，用于在考虑了所述分段确定部的确定结果情况下，基于所述噪声频谱和所述输入频谱对所述输入信号计算每带宽的抑制量，并抑制所述输入信号的噪声。

14.根据权利要求8到13中的任意一项所述的信号处理装置，其中，所述输入信号包括语音信号。