CN101300623A - 用于抑制噪声的方法、设备和计算机程序 - Google Patents

用于抑制噪声的方法、设备和计算机程序 Download PDF

Info

Publication number
CN101300623A
CN101300623A CNA2006800407045A CN200680040704A CN101300623A CN 101300623 A CN101300623 A CN 101300623A CN A2006800407045 A CNA2006800407045 A CN A2006800407045A CN 200680040704 A CN200680040704 A CN 200680040704A CN 101300623 A CN101300623 A CN 101300623A
Authority
CN
China
Prior art keywords
signal
noise
amplitude
frequency
rejection coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800407045A
Other languages
English (en)
Other versions
CN101300623B (zh
Inventor
杉山昭彦
加藤正德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN101300623A publication Critical patent/CN101300623A/zh
Application granted granted Critical
Publication of CN101300623B publication Critical patent/CN101300623B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Telephone Function (AREA)

Abstract

本发明提出了一种方法、一种设备和一种计算机程序,能够以较小的计算量来抑制低频范围内的分量,并能够实现高质量的噪声抑制。通过以下操作来抑制输入信号中叠加在所需信号上的噪声:将所述输入信号转换为频域信号;修正所述频域信号的幅度,以获得幅度修正信号;使用所述幅度修正信号,来获得估计噪声;使用所述估计噪声和所述幅度修正信号,来确定抑制系数;以及以所述抑制系数对所述幅度修正信号进行加权。

Description

用于抑制噪声的方法、设备和计算机程序
技术领域
本发明涉及一种噪声抑制方法、一种用于抑制叠加在所需语音信号上的噪声的噪声抑制设备、以及一种用于抑制所述噪声的计算机程序。
背景技术
噪声抑制器(噪声抑制系统)是一种用于抑制叠加在所需语音信号上的噪声的系统,通常通过以下操作来抑制混合在所需语音信号中的噪声:通过将输入信号转换到频域来估计噪声分量的功率谱;以及从输入信号中扣除所估计出的功率谱。噪声抑制器也可以用于通过连续估计噪声分量的功率谱来抑制不规则噪声。例如,噪声抑制器可以是一种北美便携式电话标准所采用的方法,可参见非专利文献1(技术要求(TR45).ENHANCED VARIABLE RATE CODEC,SPEECH SERVICEOPTION 3 FOR WIDEBAND SPREAD SPECTRUM DIGITAL SYSTEMS)和专利文献1(日本未审公开专利申请No.2002-204175)。
通常,将通过对用于收集声波的麦克风的输出信号进行模拟-数字(AD)转换而得到的数字信号作为输入信号传送至噪声抑制器。通常,将高通滤波器放置在AD转换器和噪声抑制器之间,主要用于抑制在麦克风中收集声音时和在对该声音进行AD转换时所引入的低频范围内的分量。例如,在专利文献2(美国专利No.5,659,622)中公开了上述结构示例。
图1示出了将专利文献1的噪声抑制器与专利文献2的高通滤波器进行组合的结构。
将含噪声的话音信号(其中所需语音信号与噪声相混合的信号)作为采样值序列传送至输入端11。将含噪声的话音信号采样传送至高通滤波器17,并在对其低频范围内的分量进行抑制之后,将其传送至分帧器(frame divider)1。对于保持输入含噪声话音的线性以及实现充分的信号处理性能而言,抑制低频范围内的分量是绝对必要的。分帧器1将含噪声的话音信号采样分为其单位是特定数目的帧,并将所述帧传送至窗口处理器2。窗口处理器2将已分为帧的、含噪声的话音信号采样与窗口函数相乘,并将结果传送至傅立叶变换器3。
傅立叶变换器3对窗口处理过的、含噪声的话音信号采样进行傅立叶变换,以便将所述信号采样分为多个频率分量,并对幅度值进行复用,以将所述多个频率分量传送至估计噪声计算器52、噪声抑制系数发生器82和复用乘法器16。将相位传送至逆傅立叶变换器9。估计噪声计算器52估计所传送的多个频率分量中的每一个的噪声,并将所述噪声传送至噪声抑制系数发生器82。一种噪声估计方法的示例是以过去的信号噪声比对含噪声的话音进行加权以将其指定为噪声分量的方法,在专利文献1中描述了上述方法的细节。
噪声抑制系数发生器82产生噪声抑制系数,以便通过将含噪声的话音与估计噪声相乘来获得已针对多个频率分量中的每一个抑制了噪声的增强语音。作为产生噪声抑制系数的示例,广泛地采用了用于使增强语音的平均平方功率最小化的最小均方短时谱幅度方法,在专利文献1中描述了上述方法的细节。
将针对每个频率而产生的噪声抑制系数传送至复用乘法器16。针对每个频率,复用乘法器16将从傅立叶变换器3传送过来的含噪声的话音与从噪声抑制系数发生器82传送过来的噪声抑制系数相乘,并将乘积传送至逆傅立叶变换器9,作为增强语音的幅度。逆傅立叶变换器9通过将从复用乘法器16传送过来的增强语音幅度与含噪声的话音的相位(所述相位来自傅立叶变换器3)进行组合来执行逆傅立叶变换,并将逆傅立叶变换后的信号传送至帧合成器10,作为增强语音信号采样。帧合成器10通过使用相邻帧的增强语音采样来合成相应帧的输出语音采样,以将合成后的采样传送至输出端12。
发明内容
高通滤波器17抑制直流附近的频率分量。通常,其频率等于或高于100Hz到120Hz的分量通过高通滤波器17而未被抑制。当高通滤波器17的结构可以被归类为有限冲激响应(FIR)型或无限冲激响应(IIR)型滤波器时,需要尖锐的通带端接特性,因此通常采用I IR型滤波器。对于IIR型滤波器,已知的是:传递函数被表达为有理函数,且对分母系数的敏感度极高。因此,存在以下问题:在将高通滤波器17实现为有限字长计算时,需要频繁地使用双精度计算来实现足够的精确性,因此计算量较大。另一方面,如果去除高通滤波器17以降低计算量,则难以维持输入信号的线性,而不能实现高质量的噪声抑制。
本发明的目的在于提供一种噪声抑制方法和一种噪声抑制设备,其能够以较小的计算量来抑制低频范围内的分量并实现高质量的噪声抑制。
根据本发明的噪声抑制方法将输入信号转换为频域信号,修正频域信号的幅度以获得幅度修正信号,通过使用幅度修正信号来获得估计噪声,通过使用估计噪声和幅度修正信号来确定抑制系数,以及以抑制系数对幅度修正信号进行加权。
另一方面,根据本发明的噪声抑制设备具有:转换器,用于将输入信号转换为频域信号;幅度修正器,用于修正频域信号的幅度以获得幅度修正信号;噪声估计器,用于通过使用幅度修正信号来获得估计噪声;抑制系数发生器,用于通过使用估计噪声和幅度修正信号来确定抑制系数;以及乘法器,用于以抑制系数对幅度修正信号进行加权。
根据本发明的一种用于噪声抑制的信号处理计算机程序包括:将输入信号转换为频域信号的处理,修正频域信号的幅度以获得幅度修正信号的处理,通过使用幅度修正信号来获得估计噪声的处理,通过使用估计噪声和幅度修正信号来确定抑制系数的处理,以及以抑制系数对幅度修正信号进行加权的处理。
具体地,根据本发明的噪声抑制方法和设备的特征在于抑制傅立叶变换后的信号的低频范围内的分量。更具体地,所述设备的特征在于包括:幅度修正器,用于抑制傅立叶变换后的输出的幅度的低频范围内的分量;以及相位修正器,用于修正与低频范围内的分量的幅度调整相对应的相位,以修正傅立叶变换后的输出的相位。
根据本发明,将转换到频域的信号的幅度与一常数相乘,将一常数与相位相加,从而能够以单一的精确计算来实现所述方法和设备,并能够以较小的计算量来实现高质量的噪声抑制。
附图说明
图1是示出了传统噪声抑制设备的结构示例的方框图;
图2是示出了本发明第一典型实施例的方框图;
图3是示出了包括在本发明第一典型实施例中的幅度修正器的结构的方框图;
图4是示出了包括在图3中的语音存在概率计算器的结构的方框图;
图5是示出了本发明第二典型实施例的方框图;
图6是示出了本发明第三典型实施例的方框图;
图7是示出了包括在本发明第三典型实施例中的复用乘法器的结构的方框图;
图8是示出了包括在本发明第三典型实施例中的加权噪声话音计算器的结构的方框图;
图9是示出了包括在图8中的频域SNR计算器的结构的方框图;
图10是示出了包括在图8中的复用非线性处理器的结构的方框图;
图11是示出了非线性处理器的非线性函数的示例的曲线图;
图12是示出了包括在本发明第三典型实施例中的估计噪声计算器的结构的方框图;
图13是示出了包括在图12中的频域估计噪声计算器的结构的方框图;
图14是示出了包括在图13中的更新判决器的结构的方框图;
图15是示出了包括在本发明第三典型实施例中的估计先验SNR计算器的结构的方框图;
图16是示出了包括在图15中的多值域限制器的结构的方框图;
图17是示出了包括在图15中的复用加权加法器的结构的方框图;
图18是示出了包括在图17中的加权加法器的结构的方框图;
图19是示出了包括在本发明第三典型实施例中的噪声抑制系数发生器的结构的方框图;
图20是示出了包括在本发明第三典型实施例中的抑制系数修正器的结构的方框图;以及
图21是示出了包括在图20中的频域抑制系数修正器的结构的方框图。
符号说明
1                         分帧器
2、20                     窗口处理器
3                         傅立叶变换器
4、5049                   计数器
5、52                     估计噪声计算器
6、1042                   频域SNR计算器
7                         估计先验SNR计算器
8、82                     噪声抑制系数发生器
9                         逆傅立叶变换器
10                        帧合成器
11                        输入端
12                        输出端
13、16、704、705、1404    复用乘法器
14                        加权噪声话音计算器
15                        抑制系数修正器
17                        高通滤波器
18                        幅度修正器
19                       相位修正器
21                       语音缺失概率存储器
22                       偏移消除器
501、502、1302、1303     分离器
1422、1423、1495、1502   分离器
1503、1801、1901         分离器
7013、7072、7074         分离器
503、1304、1424、1475    复用器
1504、1803、1903         复用器
7014、7075               复用器
5040至504K-1             频域估计噪声计算器
520                      更新判决器
701                      多值域限制器
702                      后验SNR存储器
703                      抑制系数存储器
706                      权重存储器
707                      复用加权加法器
708、5046、7092、7094    加法器
811                      MMSE STSA增益函数值计算器
812                      广义似然比计算器
814                      抑制系数计算器
921                      瞬时估计SNR
9210至921K-1             频域瞬时估计SNR
922                      以往估计SNR
9220至922K-1             以往频域估计SNR
923                      权重
924                      估计先验SNR
9240至924K-1             频域估计先验SNR
13010至1301K-1           乘法器
1597、7091、7093         乘法器
1401、5042              估计噪声存储器
1405                    复用非线性处理器
14210至1421K-1、5048    除法器
14850至1485K-1          非线性处理器
15010至1501K-1          频域抑制系数修正器
1591、70120至7012K-1    最大值选择器
1592                    抑制系数下限值存储器
1593、5204、5206        阈值存储器
1594、5203、5205        比较器
1595、5044              开关
1596                    修正值存储器
18020至1802K-1          加权处理器
19020至1902K-1          相位旋转器
5041                    寄存器长度存储器
5045                    移位寄存器
5047                    最小值选择器
5201                    逻辑或计算器
5207                    阈值计算器
7011                    常数存储器
70710至7071K-1          加权加法器
7095                    常数乘法器
具体实施方式
图2是示出了本发明第一典型实施例的方框图。除了高通滤波器17、幅度修正器18、相位修正器19和窗口处理器20以外,图2所示结构与图1所示结构(传统示例)相同。以下的详细讨论将集中在这些不同点上。
在图2中,删除了图1所示的高通滤波器17,而代替地设置了幅度修正器18、相位修正器19和窗口处理器20。设置幅度修正器18和相位修正器19,以将高通滤波器的频率响应施加于被转换至频域的信号上。将函数f的绝对值(幅度频率响应)在幅度修正器18中施加于输入信号,以及将函数f的相位(相位频率响应)在相位修正器19中施加于输入信号,其中通过将z=exp(j·2πf)施加于高通滤波器17的传递函数来获得所述函数f。
通过上述操作,可以获得与将高通滤波器17施加于输入信号相同的效果。也就是说,代替在时域上将高通滤波器17的传递函数与输入信号进行卷积,在傅立叶变换器3中被转换为频域信号之后,将所述函数与频率响应相乘。
将幅度修正器18的输出传送至估计噪声计算器52、噪声抑制系数发生器82和复用乘法器16。将相位修正器19的输出传送至逆傅立叶变换器9。
随后的操作与参照图1所描述的操作相同。如专利文献3(日本未审公开专利申请No.2003-131689)所公开的那样,设置窗口处理器20以抑制帧边界处的间断声音。
图3示出了幅度修正器18的结构示例。将来自傅立叶变换器3的复用噪声话音幅度谱传送至分离器1801。分离器1801将复用噪声话音幅度谱分解为各个频率分量,并将所述频率分量传送至加权处理器18020至1802K-1。加权处理器18020至1802K-1以相应的幅度频率响应对被分解为各个频率分量的每个噪声话音幅度谱进行加权,并将所述谱传送至复用器1803。复用器1803对来自加权处理器18020至1802K-1的信号进行复用,以输出复用信号,作为修正噪声话音幅度谱。
图4示出了相位修正器19的结构示例。将从傅立叶变换器3传送过来的复用噪声话音相位谱传送至分离器1901。分离器1901将复用噪声话音相位谱分解为各个频率分量,并将各个频率分量传送至相位旋转器19020至1902K-1。每个相位旋转器19020至1902K-1根据相应的相位频率响应对被分解为各个频率分量的噪声话音相位谱进行旋转,并将所述谱传送至复用器1903。复用器1903对来自相位旋转器19020至1902K-1的信号进行复用,以输出复用信号,作为修正噪声话音相位谱。相位修正器19的存在并不如幅度修正器18那样重要,因此可以省略相位修正器19。原因在于:已知相位修正器19的存在仅影响输出信号的相位,而对于理解语音内容而言,相位信息比幅度信息次要得多。
图5是示出了本发明第二典型实施例的方框图。图5所示结构与作为第一典型实施例的图2所示结构的区别在于偏移消除器22。偏移消除器22消除窗口处理后的噪声话音的偏移,以输出语音。最简单的偏移消除方法是针对每一帧获得噪声话音的平均值,以将所述平均值指定为偏移,将从对应帧中的所有采样中扣除此偏移。或者,针对多个帧,对每一帧的平均值进行平均,并将所获得的数值作为偏移从采样中扣除。通过消除偏移,可以在傅立叶变换器3中提高转换精度,并能够改善将要输出的增强语音的声音质量。
图6是示出了本发明第三典型实施例的方框图。将含噪声的话音信号(所需语音信号与噪声相混合的信号)作为采样值序列传送至输入端11。将含噪声的话音信号采样传送至分帧器1,并以K/2个采样为单位分割成帧。这里,假设K是偶数。将被分割成帧的噪声话音信号采样传送至窗口处理器2,并与窗口函数w(t)相乘。通过对第n帧的输入信号yn(t)(t=0,1,…,K/2-1)进行窗口处理而获得的信号yn(t)可以如下等式表示。
[等式1]
yn(t)=w(t)yn(t)    (1)
此外,在将要进行窗口处理的、两个连续帧彼此交叠的部分中广泛执行上述操作。如果假设交叠长度是帧长度的50%,对于t=0,1,…,K/2-1,
[等式2]
yn(t)=w(t)yn-1(t+K/2)
                              (2)
yn(t+K/2)=w(t+K/2)yn(t)
通过上述等式获得的yn(t)(t=0,1,…,K /2-1)作为窗口处理器2的输出。将左右对称的窗口函数用于实数信号。设计窗口函数,从而使输入信号和输出信号彼此对应,以排除当抑制系数被设置为“1”时所导致的计算误差。这意味着w(t)+w(t+K/2)=1。
下面,将继续作为示例来描述其中要进行窗口处理的两个连续帧的50%彼此交叠的情况。例如,可以将以如下等式表示的汉宁窗(Hanning Window)用作w(t)。
[等式3]
w ( t ) = 0.5 + 0.5 cos ( &pi; ( t - K / 2 ) K / 2 ) , 0 &le; t < K 0 , K &le; t - - - ( 3 )
除了上述等式外,诸如汉明窗(Hamming Window)、凯瑟窗(KayserWindow)和布莱克曼窗(Blackman Window)等多种窗口函数是已知的。将窗口处理后的输出yn(t)传送至偏移消除器22,并对偏移进行消除。偏移消除的细节与参照图5所描述的内容相同。
将已经消除了偏移的信号传送至傅立叶变换器3,并转换为噪声话音谱Yn(k)。将噪声话音谱Yn(k)分离为相位和幅度,将噪声话音相位谱argYn(k)通过相位修正器19传送至逆傅立叶变换器9,以及将噪声话音幅度谱|Yn(k)|通过幅度修正器18传送至复用乘法器13和复用乘法器16。相位修正器19和幅度修正器18的操作与参照图2所描述的内容相同。
复用乘法器13通过使用其幅度已被修正的噪声话音幅度谱来计算噪声话音功率谱,并将所述噪声话音功率谱传送至估计噪声计算器5、频域SNR(信号噪声比)计算器6和加权噪声话音计算器14。加权噪声话音计算器14通过使用从复用乘法器13传送过来的噪声话音功率谱来计算加权噪声话音功率谱,并将所述加权噪声话音功率谱传送至估计噪声计算器5。
估计噪声计算器5通过使用噪声话音功率谱、加权噪声话音功率谱和来自计数器4的计数值来估计噪声的功率谱,并噪声的功率谱作为估计噪声功率谱传送至频域SNR计算器6。频域SNR计算器6通过使用输入的噪声话音功率谱和输入的估计噪声功率谱来计算每个频率的SNR,并将所述SNR作为后验SNR传送至估计先验SNR计算器7和噪声抑制系数发生器8。
估计先验SNR计算器7通过使用输入的后验SNR和来自抑制系数修正器15的修正抑制系数来估计先验SNR,并将先验SNR作为估计先验SNR传送至噪声抑制系数发生器8。噪声抑制系数发生器8通过使用作为输入而传送过来的后验SNR和估计先验SNR、以及通过使用从语音缺失概率存储器21传送过来的语音缺失概率来产生噪声抑制系数,并将噪声抑制系数作为抑制系数传送至抑制系数修正器15。抑制系数修正器15通过使用输入的估计先验SNR和抑制系数来修正抑制系数,并将修正后的抑制系数作为修正抑制系数Gn(k)传送至复用乘法器16。复用乘法器16通过以从抑制系数修正器15传送过来的修正抑制系数Gn(k)对从傅立叶变换器3通过幅度修正器18传送过来的修正噪声话音幅度谱进行加权来获得增强语音幅度谱|Xn(k)|,并将增强语音幅度谱传送至逆傅立叶变换器9。
|Xn(k)|可以由以下等式表示。
[等式4]
|Xn(k)|=Gn(k)Hn(k)|Yn(k)|    (4)
这里,Hn(k)是幅度修正器18中的修正增益,并作为图1所示的高通滤波器的幅度频率响应而获得。
逆傅立叶变换器9通过将从复用乘法器16传送过来的增强语音幅度谱|Xn(k)|与从傅立叶变换器3通过相位修正器19传送过来的修正噪声话音相位谱arg Yn(k)+arg Hn(k)相乘来获得增强语音Xn(k)。即,执行以下等式。
[等式5]
Xn(k)=|Xn(k)|·{arg Yn(k)+arg Hn(k)}    (5)
这里,arg Hn(k)是相位修正器19中的修正相位,并作为图1所示的高通滤波器的相位频率响应而获得。
逆傅立叶变换器9对所获得的增强语音Xn(k)进行逆傅立叶变换,并将增强语音Xn(k)传送至窗口处理器20,作为时域采样序列xn(t)(t=0,1,…,K-1),所述时域采样序列xn(t)的帧配置有K个采样。窗口处理器20将从逆傅立叶变换器9传送过来的时域采样序列xn(t)与窗口函数w(t)相乘。以如下等式表示信号xn(t),通过以w(t)对第n帧的输入信号xn(t)(t=0,1,…,K/2-1)进行窗口处理来获得信号xn(t)。
[等式6]
xn(t)=w(t)xn(t)    (6)
此外,在将要进行窗口处理的、两个连续帧彼此交叠的部分中广泛执行上述操作。如果假设交叠长度是帧长度的50%,对于t=0,1,…,K/2-1,
[等式7]
xn(t)=w(t)xn-1(t+K/2)    (7)
xn(t+K/2)=w(t+K/2)xn(t)
通过上述等式获得的yn(t)(t=0,1,…,K-1)作为窗口处理器20的输出,并传送至帧合成器10。
帧合成器10从两个相邻的帧xn(t)的每一个中取出K/2个采样,以对这些采样进行交叠,并通过使用以下等式来获得增强语音
Figure A20068004070400151
[等式8]
x ^ n ( t ) = x &OverBar; n - 1 ( t + K / 2 ) + x &OverBar; n ( t ) - - - ( 8 )
将所获得的增强语音
Figure A20068004070400153
传送至输出端12,作为帧合成器10的输出。
图7是示出了图6所示的复用乘法器13的结构的方框图。复用乘法器13包括乘法器13010至1301K-1、分离器1302和1303以及复用器1304。在分离器1302和1303中,将从图6的幅度修正器18传送过来的、已被复用的修正噪声话音幅度谱分解为每个频率K个采样,并将其分别传送至乘法器13010至1301K-1。乘法器13010至1301K-1分别对输入信号进行平方运算,并分别将平方信号传送至复用器1304。复用器1304对输入信号进行复用,以输出复用信号,作为噪声话音功率谱。
图8是示出了加权噪声话音计算器14的结构的方框图。加权噪声话音计算器14包括估计噪声存储器1401、频域SNR计算器1402、复用非线性处理器1405和复用乘法器1404。估计噪声存储器1401存储从图6的估计噪声计算器5传送过来的估计噪声功率谱,并将前一帧的估计噪声功率谱输出至频域SNR计算器1402。
频域SNR计算器1402通过使用从估计噪声存储器1401传送过来的估计噪声功率谱和从图6的复用乘法器13传送过来的噪声话音功率谱,来获得每个频率的SNR,并将SNR输出至复用非线性处理器1405。复用非线性处理器1405通过使用从频域SNR计算器1402传送过来的SNR,来计算权重系数矢量,并将权重系数矢量输出至复用乘法器1404。
针对每一频率,复用乘法器1404计算从图6的复用乘法器13传送过来的噪声话音功率谱和从复用非线性处理器1405传送过来的权重系数矢量的乘积,并将加权噪声话音功率谱输出至图6的估计噪声计算器5。复用乘法器1404的结构与参照图7所描述的复用乘法器13的结构相同,所以将省略对其的详细描述。
图9是示出了包括在图8中的频域SNR计算器1402的结构的方框图。频域SNR计算器1402包括除法器14210至1421K-1、分离器1422和1423以及复用器1424。将从图6的复用乘法器13传送过来的噪声话音功率谱传送至分离器1422。将从图8的估计噪声存储器1401传送过来的估计噪声功率谱传送至分离器1423。在分离器1422和1423中,将噪声话音功率谱和估计噪声功率谱分别分解为与频率分量相对应的K个采样,并分别将其传送至除法器14210至1421K-1
在除法器14210至1421K-1中,根据以下等式,通过将传送过来的噪声话音功率谱除以估计噪声功率谱,获得频域SNR
Figure A20068004070400161
并将其传送至复用器1424。
[等式9]
&gamma; ^ n ( k ) = | Y n ( k ) | 2 &lambda; n - 1 ( k ) - - - ( 9 )
这里,λn-1(k)是前一帧中的估计噪声功率谱。复用器1424对传送过来的K个频域SNR进行复用,并将复用SNR传送至图8的复用非线性处理器1405。
接下来,将参照图10,对图8的复用非线性处理器1405的结构和操作进行详细描述。图10是示出了包括在加权噪声话音计算器14中的复用非线性处理器1405的结构的方框图。复用非线性处理器1405包括分离器1495、非线性处理器14850至1485K-1和复用器1475。分离器1495将从图8的频域SNR计算器1402传送过来的SNR分解为频域SNR,并将分解后的SNR传送至非线性处理器14850至1485K-1。非线性处理器14850至1485K-1分别包括用于根据输入值而输出实数值的非线性函数。
图11示出了非线性函数的示例。如果f1是输入值,则可以通过以下等式获得图11所示的非线性函数的输出值f2
[等式10]
f 2 = 1 , f 1 &le; a f 1 - b a - b , a < f 1 &le; b 0 , b < f 1 - - - ( 10 )
这里,a和b是任意实数。
回到图10,非线性处理器14850至1485K-1利用非线性函数来处理从分离器1495传送过来的频域SNR,以获得加权系数,并将加权系数输出至复用器1475。即,非线性处理器14850至1485K-1根据SNR来输出加权系数“1”至“0”。当SNR较小时,输出“1”,而当SNR较大时,输出“0”。复用器1475对从非线性处理器14850至1485K-1输出的加权系数进行复用,并将复用加权系数作为加权系数矢量输出至复用乘法器1404。
在图8复用乘法器1404中与噪声话音功率谱相乘的加权系数是与SNR对应的值,当SNR较大,即包含在含噪声的话音中的语音分量较大时,加权系数的值较小。虽然通常将噪声话音功率谱用于更新估计噪声,但是通过根据SNR,对用于更新估计噪声的噪声话音功率谱进行加权,可以使包含在噪声话音功率谱中的语音分量的影响较小,并能够实现更为精确的噪声估计。同时,虽然描述了利用非线性函数来计算加权系数的示例,但是也可以使用除非线性函数以外的SNR的其他函数,该函数可以表示为另一等式,如线性函数或高阶多项式等。
图12是示出了图6所示的估计噪声计算器5的结构的方框图。估计噪声计算器5包括分离器501和502、复用器503和频域估计噪声计算器5040至504K-1
在图12中,分离器501将从图6的加权噪声话音计算器14传送过来的加权噪声话音功率谱分解为每个频率的加权噪声话音功率谱,并将这些功率谱分别传送至频域估计噪声计算器5040至504K-1。分离器502将从图6的复用乘法器13传送过来的噪声话音功率谱分解为每个频率的噪声话音功率谱,并将这些功率谱分别输出至频域估计噪声计算器5040至504K-1
频域估计噪声计算器5040至504k-1根据从分离器501传送过来的频域加权噪声话音功率谱、从分离器502传送过来的频域噪声话音功率谱和从图6的计数器4传送过来的计数值,计算频域估计噪声功率谱,并这些功率谱输出至复用器503。复用器503对从频域估计噪声计算器5040至504K-1传送过来的频域估计噪声功率谱进行复用,并将估计噪声功率谱输出至图6的频域SNR计算器6以及加权噪声话音计算器14。将参照图13,对频域估计噪声计算器5040至504K-1的结构和操作进行详细描述。
图13是示出了图12所示的频域估计噪声计算器5040至504K-1的结构的方框图。频域估计噪声计算器504包括更新判决器520、寄存器长度存储器5041、估计噪声存储器5042、开关5044、移位寄存器5045、加法器5046、最小值选择器5047、除法器5048和计数器5049。
将频域加权噪声话音功率谱从图12的分离器501传送至开关5044。当开关5044闭合时,将频域加权噪声话音功率谱传送至移位寄存器5045。移位寄存器5045响应于从更新判决器520传送过来的控制信号,年个内部寄存器的存储值移位至相邻的寄存器。寄存器长度与稍后描述的寄存器长度存储器5041中所存储的数值相同。将移位寄存器5045的所有寄存器输出传送至加法器5046。加法器5046对传送过来的所有寄存器输出进行求和,并将求和结果传送至除法器5048。
另一方面,向更新判决器520传送计数值、频域噪声话音功率谱和频域估计噪声功率谱。在计数值达到预定值之前,更新判决器520总是输出“1”,在计数值达到预定值之后,当更新判决器520确定输入噪声话音信号是噪声时,更新判决器520输出“1”,而在其他情况下,更新判决器520输出“0”。将更新判决器520的输出传送至计数器5049、开关5044和移位寄存器5045。
当从更新判决器520传送过来的信号是“1”时,开关5044闭合,而当该信号为“0”时,开关5044断开。当从更新判决器520传送过来的信号是“1”时,计数器5049增加计数值,而当该信号为“0”时,计数器5049不改变计数值。当从更新判决器520传送过来的信号是“1”时,移位寄存器5045输入从开关5044传送过来的一个信号采样,与此同时,将内部寄存器的存储值移位至相邻的寄存器。向最小值选择器5047传送计数器5049的输出和寄存器长度存储器5041的输出。
最小值选择器5047选择传送过来的计数值或寄存器长度(二者中较小的一个),并将所选择的数值传送至除法器5048。除法器5048将从加法器5046传送过来的频域噪声话音功率谱的求和值除以计数值或寄存器长度(二者中较小的一个),并输出所得的商,作为频域估计噪声功率谱λn(k)。如果Bn(k)(n=0,1,…,N-1)是存储在移位寄存器5045中的噪声话音功率谱的采样值,则可以通过以下等式获得λn(k)
&lambda; n ( k ) = 1 N &Sigma; n = 0 N - 1 B n ( k ) - - - ( 11 )
在以上等式中,N是计数值或寄存器长度(二者中较小的一个)。由于计数值从“0”开始单调递增,所以首先使用计数值来执行除法操作,然后才使用寄存器长度来执行除法操作。针对以寄存器长度为除数的除法,需要获得存储在移位寄存器中的数值的平均值。首先,由于在移位寄存器5045中并未存储足够多的数值,所以使用实际存储有数值的寄存器的数目来执行除法操作。当计数值小于寄存器长度时,实际存储有数值的寄存器的数目等于计数值,而当计数值变得大于寄存器长度时,实际存储有数值的寄存器的数目等于寄存器长度。
图14是示出了图13所示的更新判决器520的结构的方框图。更新判决器520包括逻辑或计算器5201、比较器5203和5205、阈值存储器5204和5206以及阈值计算器5207。
将从图6的计数器4传送过来的计数值传送至比较器5203。同时,还将阈值(阈值存储器5204的输出)传送至比较器5203。比较器5203将传送过来的计数值与阈值进行比较,并在计数值小于阈值时,向逻辑或计算器5201传送“1”,而在计数值大于阈值时,向逻辑或计算器5201传送“0”。另一方面,阈值计算器5207根据从图13的估计噪声存储器5042传送过来的频域估计噪声功率谱来计算阈值,并将计算值作为阈值输出至阈值存储器5206。最简单的阈值计算方法是将频域估计噪声功率谱与常数相乘。作为另一方法,也可以使用高阶多项式和非线性函数来计算阈值。
阈值存储器5206存储从阈值计算器5207输出的阈值,并将一帧前已存储的阈值输出至比较器5205。比较器5205将从阈值存储器5206传送过来的阈值与从图12的分离器502传送过来的频域噪声话音功率谱进行比较,并在频域噪声话音功率谱小于阈值时,向逻辑或计算器5201传送“1”,而在频域噪声话音功率谱大于阈值时,向逻辑或计算器5201传送“0”。即,根据估计噪声功率谱的幅度来确定含噪声的话音信号是否是噪声。逻辑或计算器5201计算比较器5203的输出值和比较器5205的输出值的逻辑或,并将计算结果输出至图13的开关5044、移位寄存器5045和计数器5049。
如上所述,在初始状态或静音间隔中以及当非静音间隔中含噪声的话音功率较小时,更新判决器520输出“1”。即,对估计噪声进行更新。由于针对每一频率来计算阈值,可以针对每一频率来更新估计噪声。
图15是示出了图6所示的估计先验SNR计算器7的结构的方框图。估计先验SNR计算器7包括多值域限制器701、后验SNR存储器702、抑制系数存储器703、复用乘法器704和705、权重存储器706、复用加权加法器707以及加法器708。
将从图6的频域SNR计算器6传送过来的后验SNRγn(k)(k=0,1,…,K-1)传送至后验SNR存储器702和加法器708。后验SNR存储器702存储第n帧的后验SNRγn(k),并将第n-1帧的后验SNRγn-1(k)传送至复用乘法器705。将从图6的抑制系数修正器15传送过来的修正抑制系数Gn(k)(k=0,1,…,K-1)传送至抑制系数存储器703。抑制系数存储器703存储第n帧的修正抑制系数Gn(k),并将第n-1帧的修正抑制系数Gn-1(k)传送至复用乘法器704。
复用乘法器704对传送过来的Gn(k)进行平方,以获得Gn 2(k),并将Gn-1 2(k)传送至复用乘法器705。复用乘法器705将Gn-1 2(k)与γn-1(k)(k=0,1,…,K-1)相乘以获得Gn-1 2(k)γn-1(k),并将所获得的结果作为以往估计SNR 922传送至复用加权加法器707。由于复用乘法器704和705的结构与参照图7所描述的复用乘法器13的结构相同,所以将省略对其的详细描述。
向加法器708的另一端传送“-1”,并将求和结果γn(k)-1传送至多值域限制器701。多值域限制器701对从加法器708传送过来的求和结果γn(k)-1施加值域限制运算符P[·]的运算,并将结果P[γn(k)-1]作为瞬时估计SNR 921传送至复用加权加法器707。P[x]由以下等式定义。
[等式12]
P [ x ] = x , x > 0 0 , x &le; 0 - - - ( 12 )
还向复用加权加法器707传送来自权重存储器706的权重923。复用加权加法器707通过使用传送过来的瞬时估计SNR 921、以往估计SNR922和权重923,来获得估计先验SNR 924。如果假设权重923为α,为估计先验SNR,则可以通过以下等式来计算
Figure A20068004070400213
[等式13]
&xi; ^ n ( k ) = &alpha;&gamma; n - 1 ( k ) G &OverBar; n - 1 2 ( k ) + ( 1 - &alpha; ) P [ &gamma; n ( k ) - 1 ] - - - ( 13 )
这里,假设 G &OverBar; - 1 2 ( k ) &gamma; - 1 ( k ) = 1 .
图16是示出了图15所示的多值域限制器701的结构的方框图。多值域限制器701包括常数存储器7011、最大值选择器70120至7012k-1、分离器7013和复用器7014。向分离器7013传送来自图15的加法器708的γn(k)-1。分离器7013将传送过来的γn(k)-1分解为K个频域分量,并将这些频域分量传送至最大值选择器70120至7012K-1。向最大值选择器70120至7012K-1的另一输入传送来自常数存储器7011的“0”。最大值选择器70120至7012K-1将γn(k)-1与“0”进行比较,以将较大的数值传送至复用器7014。此最大选择计算对应于以上等式12。复用器7014对这些数值进行复用和输出。
图17是示出了图15所示的复用加权加法器707的结构的方框图。复用加权加法器707包括加权加法器70710至7071K-1、分离器7072和7074以及复用器7075。向分离器7072传送来自图15的多值域限制器701的、作为瞬时估计SNR 921的P[γn(k)-1]。分离器7072将P[γn(k)-1]分解为K个频域分量,并将这些频域分量作为频域瞬时估计SNR 9210至92k-1传送至加权加法器70710至7071K-1。向分离器7074传送来自图15的复用乘法器705的、作为以往估计SNR 922的Gn-1 2(k)γn-1(k)。
分离器7074将Gn-1 2(k)γn-1(k)分解为K个频域分量,并将这些频域分量作为以往频域估计SNR 9220至922k-1传送至加权加法器70710至7071K-1。另一方面,还向加权加法器70710至7071K-1传送权重923。加权加法器70710至7071K-1执行由上述等式13表示的加权加法,并将频域估计先验SNR 9240至924K-1传送至复用器7075。复用器7075对频域估计先验SNR 9240至924K-1进行复用,并输出复用SNR,作为估计先验SNR 924。接下来,将参照图18,对加权加法器70710至7071K-1的操作和结构进行描述。
图18是示出了图17所示的加权加法器7071的结构的方框图。加权加法器7071包括乘法器7091和7093以及加法器7092和7094。作为每一输入,向加权加法器7071传送来自图16的分离器7072的频域瞬时估计SNR921、来自图17的分离器7074的以往频域SNR 922、和来自图15的权重存储器706的权重923。将包括数值α的权重923传送至常数乘法器7095和乘法器7093。常数乘法器7095将通过将输入信号与“-1”相乘所获得的-α传送至加法器7094。
向加法器7094的另一输入传送“1”,因此加法器7094的输出为1-α(二者之和)。将1-α传送至乘法器7091,并与另一输入(频域瞬时估计SNRP[γn(k)-1])相乘,并将乘积(1-α)P[γn(k)-1]传送至加法器7092。另一方面,乘法器7093将作为权重923传送过来的α与以往估计SNR 922相乘,并将乘积αGn-1 2(k)γn-1(k)传送至加法器7092。加法器7092输出(1-α)P[γn(k)-1]与αGn-1 2(k)γn-1(k)的和,作为频域估计先验SNR904。
图19是示出了图6所示的噪声抑制系数发生器8的结构的方框图。噪声抑制系数发生器8包括MMSE STSA增益函数值计算器811、广义似然比计算器812和抑制系数计算器814。下面,将根据在非专利文献2(IEEE TRANSACTIONS ON ACOUSTICS,SPEECH,AND SIGNALPROCESSING,VOL.32,NO.6,第1109~1121页,1984年12月)中所描述的计算等式,来描述抑制系数的计算方法。
假设帧数为n,频率数为k,γn(k)是从图6的频域SNR计算器6传送过来的频域后验SNR,
Figure A20068004070400231
是从图6的估计先验SNR计算器7传送过来的频域估计先验SNR,以及q是从图6的语音缺失概率存储器21传送过来的语音缺失概率。此外,假设
&eta; n ( k ) = &xi; ^ n ( k ) / ( 1 - q )
vn(k)=(ηn(k)γn(k))/(1+ηn(k))
MMSE STSA增益函数值计算器811根据从图6的频域SNR计算器6传送过来的后验SNR γn(k)、从图6的估计先验SNR计算器7传送过来的估计先验SNR
Figure A20068004070400233
以及从图6的语音缺失概率存储器21传送过来的语音缺失概率q,计算每一频率的MMSE STSA增益函数值,并将MMSESTSA增益函数值输出至抑制系数计算器814。
每一频率的MMSE STSA增益函数值Gn(k)由以下等式表示。
[等式14]
G n ( k ) = &pi; 2 v n ( k ) &gamma; n ( k ) exp ( - v n ( k ) 2 ) [ ( 1 + v n ( k ) ) I 0 ( v n ( k ) 2 ) + v n ( k ) I 1 ( v n ( k ) 2 ) ] - - - ( 14 )
这里,I0(z)是0阶修正贝塞尔函数,以及I1(z)是1阶修正贝塞尔函数。在非专利文献3(MATHEMATICS DICTIONARY,IWANAMI BOOK SHOP,第374.G页,1985年)中描述了修正贝塞尔函数。
广义似然比计算器812根据从图6的频域SNR计算器6传送过来的后验SNRγn(k)、从图6的估计先验SNR计算器7传送过来的估计先验SNR
Figure A20068004070400235
以及从图6的语音缺失概率存储器21传送过来的语音缺失概率q,来计算每一频率的广义似然比,并将广义似然比输出至抑制系数计算器814。
每一频率的广义似然比Λn(k)由以下等式表示。
[等式15]
&Lambda; n ( k ) = 1 - q q exp ( v n ( k ) ) 1 + &eta; n ( k ) - - - ( 15 )
抑制系数计算器814根据从MMSE STSA增益函数值计算器811传送过来的MMSE STSA增益函数值Gn(k)和从广义似然比计算器812传送过来的广义似然比Λn(k),计算每一频率的抑制系数,并将抑制系数输出至图6的抑制系数修正器15。每一频率的抑制系数Gn(k)由以下等式表示。
[等式16]
G &OverBar; n ( k ) = &Lambda; n ( k ) &Lambda; n ( k ) + 1 G n ( k ) - - - ( 16 )
代替计算每一频率的SNR,也可以计算和使用在包括多个频率在内的频带内公用的SNR。
图20是示出了图6所示的抑制系数修正器15的结构的方框图。抑制系数修正器15包括频域抑制系数修正器15010至1501K-1、分离器1502和1503以及复用器1504。
分离器1502将从图6的估计先验SNR计算器7传送过来的估计先验SNR分解为频域分量,并将这些频域分量分别输出至频域抑制系数修正器15010至1501K-1。分离器1503将从图6的噪声抑制系数发生器8传送过来的抑制系数分解为频域分量,并将这些频域分量分别输出至频域抑制系数修正器15010至1501K-1
频域抑制系数修正器15010至1501K-1根据从分离器1502传送过来的频域估计先验SNR和从分离器1503传送过来的频域抑制系数,来计算频域修正抑制系数,并将频域修正抑制系数输出至复用器1504。复用器1504对从频域抑制系数修正器15010至1501K-1传送过来的频域修正抑制系数进行复用,并将复用频域修正抑制系数作为修正抑制系数输出至图6的复用乘法器16和估计先验SNR计算器7。
接下来,将参照图21,对频域抑制系数修正器15010至1501K-1的结构和操作进行详细描述。
图21是示出了包括在抑制系数修正器15中的频域抑制系数修正器15010至1501K-1的结构的方框图。频域抑制系数修正器1501包括最大值选择器1591、抑制系数下限值存储器1592、阈值存储器1593、比较器1594、开关1595、修正值存储器1596和乘法器1597。
比较器1594将从阈值存储器1593传送过来的阈值与从图20的分离器1502传送过来的频域估计先验SNR进行比较,当频域估计先验SNR大于阈值时,比较器1594向开关1595传送“0”,而当频域估计先验SNR小于阈值时,比较器1594向开关1595传送“1”。当比较器1594的输出值为“1”时,开关1595将从图20的分离器1503传送过来的频域抑制系数输出至乘法器1597,以及当输出值为“0”时,将频域抑制系数输出至最大值选择器1591。即,当频域估计先验SNR小于阈值时,对抑制系数进行修正。乘法器1597计算开关1595的输出值与修正值存储器1596的输出值的乘积,并将所述乘积输出至最大值选择器1591。
另一方面,抑制系数下限值存储器1592向最大值选择器1591传送所存储的抑制系数的下限值。最大值选择器1591将从图20的分离器1503传送过来的频域抑制系数或由乘法器1597计算出的乘积与从抑制系数下限值存储器1592传送过来的抑制系数下限值进行比较,并将较大的数值输出至图20的复用器1504。即,抑制系数必将变为比抑制系数下限值存储器1592所存储的下限值大的数值。
在所有上述典型实施例中,虽然假设采用最小均方短时谱幅度方法作为噪声抑制方法,但是这些实施例也可以应用于其他噪声抑制方法。这些噪声抑制方法的示例包括:在非专利文献4(PROCEEDINGS OFTHE IEEE,VOL.67,NO.12,第1586~1604页,1979年12月)中所公开的维纳滤波器方法;以及在非专利文献5(IEEE TRANSACTIONS ONACOUSTICS,SPEECH,AND SIGNAL PROCESSING,VOL.27,NO.2,第113~120页,1979年4月)中所公开的谱扣除方法,这里省略了对上述方法结构示例的详细描述。
上述每一典型实施例的噪声抑制设备均可以计算机设备来进行配置,所述计算机设备包括:用于蓄积程序等的存储设备、设置有按键和开关的操作单元、诸如LCD等的显示设备、以及通过接收来自操作单元的输入来控制每一部件的操作的控制设备。当控制设备执行存储在存储设备中的程序时,将实现上述每一典型实施例的噪声抑制设备的操作。程序可以预先存储在存储设备中,或者可以将其写入诸如CD-ROM等记录介质来提供给用户。也可以通过网络来提供所述程序。

Claims (9)

1.一种噪声抑制方法,用于抑制包括在输入信号中的噪声,其特征在于包括:
将所述输入信号转换为频域信号;
修正所述频域信号的幅度,以获得幅度修正信号;
使用所述幅度修正信号,来获得估计噪声;
使用所述估计噪声和所述幅度修正信号,来确定抑制系数;以及
以所述抑制系数对所述幅度修正信号进行加权。
2.根据权利要求1所述的噪声抑制方法,其特征在于包括:
修正所述频域信号的相位,以获得相位修正信号;以及
将通过以所述抑制系数对所述幅度修正信号进行加权所获得的结果和所述相位修正信号转换为时域信号。
3.根据权利要求1或2所述的噪声抑制方法,其特征在于包括:
消除所述输入信号的偏移,以获得偏移消除信号;以及
将所述偏移消除信号转换为所述频域信号。
4.一种噪声抑制设备,用于抑制包括在输入信号中的噪声,其特征在于包括:
转换器,用于将所述输入信号转换为频域信号;
幅度修正器,用于修正所述频域信号的幅度,以获得幅度修正信号;
噪声估计器,用于使用所述幅度修正信号,来获得估计噪声;
抑制系数发生器,用于使用所述估计噪声和所述幅度修正信号,来确定抑制系数;以及
乘法器,用于以所述抑制系数对所述幅度修正信号进行加权。
5.根据权利要求4所述的噪声抑制设备,其特征在于包括:
相位修正器,用于修正所述频域信号的相位,以获得相位修正信号;以及
逆转换器,用于将通过以所述抑制系数对所述幅度修正信号进行加权所获得的结果和所述相位修正信号转换为时域信号。
6.根据权利要求4或5所述的噪声抑制设备,其特征在于包括:
偏移消除器,用于消除所述输入信号的偏移,以获得偏移消除信号;以及
转换器,用于将所述偏移消除信号转换为所述频域信号。
7.一种计算机程序,用于对信号进行处理,以抑制包括在输入信号中的噪声,所述计算机程序使计算机执行以下处理:
将所述输入信号转换为频域信号;
修正所述频域信号的幅度,以获得幅度修正信号;
使用所述幅度修正信号,来获得估计噪声;
使用所述估计噪声和所述幅度修正信号,来确定抑制系数;以及
以所述抑制系数对所述幅度修正信号进行加权。
8.根据权利要求7所述的计算机程序,使计算机还执行以下处理:
修正所述频域信号的相位,以获得相位修正信号;以及
将通过以所述抑制系数对所述幅度修正信号进行加权所获得的结果和所述相位修正信号转换为时域信号。
9.根据权利要求7或8所述的计算机程序,使计算机还执行以下处理:
消除所述输入信号的偏移,以获得偏移消除信号;以及
将所述偏移消除信号转换为所述频域信号。
CN2006800407045A 2005-09-02 2006-08-28 用于抑制噪声的方法、设备和计算机程序 Expired - Fee Related CN101300623B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP255669/2005 2005-09-02
JP2005255669 2005-09-02
PCT/JP2006/316849 WO2007029536A1 (ja) 2005-09-02 2006-08-28 雑音抑圧の方法及び装置並びにコンピュータプログラム

Publications (2)

Publication Number Publication Date
CN101300623A true CN101300623A (zh) 2008-11-05
CN101300623B CN101300623B (zh) 2011-07-27

Family

ID=37835657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800407045A Expired - Fee Related CN101300623B (zh) 2005-09-02 2006-08-28 用于抑制噪声的方法、设备和计算机程序

Country Status (6)

Country Link
US (3) US8233636B2 (zh)
EP (1) EP1930880B1 (zh)
JP (1) JP5092748B2 (zh)
KR (1) KR101052445B1 (zh)
CN (1) CN101300623B (zh)
WO (1) WO2007029536A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075789A1 (zh) * 2008-12-31 2010-07-08 华为技术有限公司 信号处理方法及装置
CN102576543A (zh) * 2010-07-26 2012-07-11 松下电器产业株式会社 多输入噪声抑制装置、多输入噪声抑制方法、程序以及集成电路
CN103250208A (zh) * 2010-11-24 2013-08-14 日本电气株式会社 信号处理装置、信号处理方法和信号处理程序
WO2014084000A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
WO2014083999A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
CN104134444A (zh) * 2014-07-11 2014-11-05 福建星网视易信息系统有限公司 一种基于mmse的歌曲去伴奏方法和装置
CN106910511A (zh) * 2016-06-28 2017-06-30 阿里巴巴集团控股有限公司 一种语音去噪方法和装置
CN107170461A (zh) * 2017-07-24 2017-09-15 歌尔科技有限公司 语音信号处理方法及装置
CN114333882A (zh) * 2022-03-09 2022-04-12 深圳市友杰智新科技有限公司 基于幅度谱的语音降噪方法、装置、设备及存储介质
CN114360559A (zh) * 2021-12-17 2022-04-15 北京百度网讯科技有限公司 语音合成方法、装置、电子设备和存储介质

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1982324B1 (en) * 2006-02-10 2014-09-24 Telefonaktiebolaget LM Ericsson (publ) A voice detector and a method for suppressing sub-bands in a voice detector
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
JP5147730B2 (ja) * 2007-01-12 2013-02-20 パナソニック株式会社 受信装置及び受信方法
JP5668923B2 (ja) * 2008-03-14 2015-02-12 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
TWI459828B (zh) * 2010-03-08 2014-11-01 Dolby Lab Licensing Corp 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統
US8724828B2 (en) * 2011-01-19 2014-05-13 Mitsubishi Electric Corporation Noise suppression device
JP6070953B2 (ja) 2011-02-26 2017-02-01 日本電気株式会社 信号処理装置、信号処理方法、及び記憶媒体
GB2493327B (en) 2011-07-05 2018-06-06 Skype Processing audio signals
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
GB2495131A (en) 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
GB2495129B (en) 2011-09-30 2017-07-19 Skype Processing signals
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
CN102984323A (zh) * 2011-12-08 2013-03-20 斯凯普公司 处理音频信号
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
JP6432597B2 (ja) 2014-03-17 2018-12-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
US10149047B2 (en) * 2014-06-18 2018-12-04 Cirrus Logic Inc. Multi-aural MMSE analysis techniques for clarifying audio signals
JP6520276B2 (ja) 2015-03-24 2019-05-29 富士通株式会社 雑音抑圧装置、雑音抑圧方法、及び、プログラム
CN106161125B (zh) * 2015-03-31 2019-05-17 富士通株式会社 非线性特性的估计装置及方法
US11303346B2 (en) 2015-08-25 2022-04-12 Cellium Technologies, Ltd. Systems and methods for transporting signals inside vehicles
US10027374B1 (en) * 2015-08-25 2018-07-17 Cellium Technologies, Ltd. Systems and methods for wireless communication using a wire-based medium

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02272499A (ja) * 1989-04-13 1990-11-07 Ricoh Co Ltd 音声認識装置
US5680508A (en) 1991-05-03 1997-10-21 Itt Corporation Enhancement of speech coding in background noise for low-rate speech coder
JP3277398B2 (ja) 1992-04-15 2002-04-22 ソニー株式会社 有声音判別方法
US5536902A (en) 1993-04-14 1996-07-16 Yamaha Corporation Method of and apparatus for analyzing and synthesizing a sound by extracting and controlling a sound parameter
JP3338573B2 (ja) 1994-11-01 2002-10-28 ユナイテッド・モジュール・コーポレーション サブバンド分割演算回路
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
JPH11133996A (ja) * 1997-10-30 1999-05-21 Victor Co Of Japan Ltd 音程変換装置
JPH11289312A (ja) 1998-04-01 1999-10-19 Toshiba Tec Corp マルチキャリア無線通信装置
US6088668A (en) * 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing
JP4308345B2 (ja) 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6366880B1 (en) 1999-11-30 2002-04-02 Motorola, Inc. Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
DE10017646A1 (de) * 2000-04-08 2001-10-11 Alcatel Sa Geräuschunterdrückung im Zeitbereich
WO2001080423A2 (en) * 2000-04-14 2001-10-25 Harman International Industries, Incorporated Method and apparatus for dynamic sound optimization
DE10020756B4 (de) * 2000-04-27 2004-08-05 Harman Becker Automotive Systems (Becker Division) Gmbh Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
JP4282227B2 (ja) 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
EP2239733B1 (en) 2001-03-28 2019-08-21 Mitsubishi Denki Kabushiki Kaisha Noise suppression method
JP2003131689A (ja) * 2001-10-25 2003-05-09 Nec Corp ノイズ除去方法及び装置
JP3858668B2 (ja) * 2001-11-05 2006-12-20 日本電気株式会社 ノイズ除去方法及び装置
JP2003339709A (ja) * 2002-05-22 2003-12-02 Ge Medical Systems Global Technology Co Llc ドップラ信号処理装置および超音波診断装置
US7343283B2 (en) * 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
JP4608650B2 (ja) * 2003-05-30 2011-01-12 独立行政法人産業技術総合研究所 既知音響信号除去方法及び装置
US7970150B2 (en) * 2005-04-29 2011-06-28 Lifesize Communications, Inc. Tracking talkers using virtual broadside scan and directed beams
US8126161B2 (en) * 2006-11-02 2012-02-28 Hitachi, Ltd. Acoustic echo canceller system
BRPI0721079A2 (pt) 2006-12-13 2014-07-01 Panasonic Corp Dispositivo de codificação, dispositivo de decodificação e método dos mesmos
US7873114B2 (en) * 2007-03-29 2011-01-18 Motorola Mobility, Inc. Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770775B (zh) * 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
US8468025B2 (en) 2008-12-31 2013-06-18 Huawei Technologies Co., Ltd. Method and apparatus for processing signal
WO2010075789A1 (zh) * 2008-12-31 2010-07-08 华为技术有限公司 信号处理方法及装置
US8824700B2 (en) 2010-07-26 2014-09-02 Panasonic Corporation Multi-input noise suppression device, multi-input noise suppression method, program thereof, and integrated circuit thereof
CN102576543A (zh) * 2010-07-26 2012-07-11 松下电器产业株式会社 多输入噪声抑制装置、多输入噪声抑制方法、程序以及集成电路
CN102576543B (zh) * 2010-07-26 2014-09-10 松下电器产业株式会社 多输入噪声抑制装置、多输入噪声抑制方法以及集成电路
CN103250208A (zh) * 2010-11-24 2013-08-14 日本电气株式会社 信号处理装置、信号处理方法和信号处理程序
CN103250208B (zh) * 2010-11-24 2015-06-17 日本电气株式会社 信号处理装置和信号处理方法
WO2014083999A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
WO2014084000A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
CN104134444A (zh) * 2014-07-11 2014-11-05 福建星网视易信息系统有限公司 一种基于mmse的歌曲去伴奏方法和装置
CN104134444B (zh) * 2014-07-11 2017-03-15 福建星网视易信息系统有限公司 一种基于mmse的歌曲去伴奏方法和装置
CN106910511A (zh) * 2016-06-28 2017-06-30 阿里巴巴集团控股有限公司 一种语音去噪方法和装置
CN106910511B (zh) * 2016-06-28 2020-08-14 阿里巴巴集团控股有限公司 一种语音去噪方法和装置
CN107170461A (zh) * 2017-07-24 2017-09-15 歌尔科技有限公司 语音信号处理方法及装置
CN114360559A (zh) * 2021-12-17 2022-04-15 北京百度网讯科技有限公司 语音合成方法、装置、电子设备和存储介质
CN114333882A (zh) * 2022-03-09 2022-04-12 深圳市友杰智新科技有限公司 基于幅度谱的语音降噪方法、装置、设备及存储介质
CN114333882B (zh) * 2022-03-09 2022-08-19 深圳市友杰智新科技有限公司 基于幅度谱的语音降噪方法、装置、设备及存储介质

Also Published As

Publication number Publication date
US8233636B2 (en) 2012-07-31
EP1930880B1 (en) 2019-09-25
US8477963B2 (en) 2013-07-02
JP5092748B2 (ja) 2012-12-05
US8489394B2 (en) 2013-07-16
KR20080042166A (ko) 2008-05-14
CN101300623B (zh) 2011-07-27
US20090196434A1 (en) 2009-08-06
JPWO2007029536A1 (ja) 2009-03-19
US20120288115A1 (en) 2012-11-15
EP1930880A1 (en) 2008-06-11
WO2007029536A1 (ja) 2007-03-15
US20120290296A1 (en) 2012-11-15
EP1930880A4 (en) 2009-08-26
KR101052445B1 (ko) 2011-07-28

Similar Documents

Publication Publication Date Title
CN101300623B (zh) 用于抑制噪声的方法、设备和计算机程序
CN101091209A (zh) 抑制噪声的方法、装置和计算机程序
CN100492493C (zh) 噪声抑制方法和设备
Allen Short term spectral analysis, synthesis, and modification by discrete Fourier transform
CN1892822B (zh) 噪声抑制方法和设备
US7719446B2 (en) Method and apparatus for computing interpolation factors in sample rate conversion systems
EP3257173B1 (en) Multi-rate system for audio processing
JPH10200594A (ja) ディジタル復調器におけるシンボルタイミング復元回路
CN106601266A (zh) 回声消除方法、装置及系统
US20150049880A1 (en) Low Delay Real-to-Complex Conversion in Overlapping Filter Banks for Partially Complex Processing
WO2012070670A1 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP2003140700A (ja) ノイズ除去方法及び装置
JPS6196817A (ja) フイルタ−
JPS6051017A (ja) アナログ信号の解析及び検索方法及び装置
JP5029357B2 (ja) 適応ディジタルフィルタ、信号処理方法、fm受信機およびプログラム
Huang et al. Resolution doubled co-prime spectral analyzers for removing spurious peaks
CN101546992A (zh) 一种滤波方法及滤波器
JPWO2008123317A1 (ja) 信号処理装置、エコーキャンセラ、信号処理方法
JP2006246397A (ja) エコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体
WO2014047854A1 (zh) 基于误差子带的自适应滤波方法及系统
KR20120129003A (ko) 2 이상의 샘플링 채널을 사용하여 신호의 복소 샘플링을 수행하고 이들 채널들 간에 시간지연을 계산하기 위한 방법 및 시스템
CN118451332A (zh) 用于相位噪声测量的设备和方法
Pillai et al. Two reconstructors for M-channel time-interleaved ADCs with missing samples
Kalvikkarasi et al. An economical modified VLSI architecture for computing power spectral density supported welch method
Cheng et al. Underwater Acoustic Frequency Demodulation System Based on High-Q Filter

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110727

CF01 Termination of patent right due to non-payment of annual fee