CN1258368A - 噪声衰减设备以及噪声衰减方法 - Google Patents
噪声衰减设备以及噪声衰减方法 Download PDFInfo
- Publication number
- CN1258368A CN1258368A CN98805620A CN98805620A CN1258368A CN 1258368 A CN1258368 A CN 1258368A CN 98805620 A CN98805620 A CN 98805620A CN 98805620 A CN98805620 A CN 98805620A CN 1258368 A CN1258368 A CN 1258368A
- Authority
- CN
- China
- Prior art keywords
- amplitude
- noise
- spectrum
- frame
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000001228 spectrum Methods 0.000 claims abstract description 86
- 230000003595 spectral effect Effects 0.000 claims abstract description 37
- 230000006870 function Effects 0.000 claims description 19
- 230000008859 change Effects 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 15
- 238000007493 shaping process Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 238000011410 subtraction method Methods 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 11
- 230000008901 benefit Effects 0.000 description 10
- 238000005070 sampling Methods 0.000 description 9
- 206010038743 Restlessness Diseases 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006866 deterioration Effects 0.000 description 3
- 230000003292 diminished effect Effects 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 230000003313 weakening effect Effects 0.000 description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 230000005534 acoustic noise Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009342 intercropping Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
Abstract
一种噪声衰减方法,利用谱减法滤波器从使在一定帧长度上切出的输入信号进行正交变换得到的振幅谱中,减去推定噪声振幅谱,得到输出,在这样的谱减法噪声衰减方法中,备有振幅调整滤波器部6,用以根据所述推定噪声振幅谱使谱减法滤波器的缩减率可变。该振幅调整滤波器部6对每帧谱减法滤波器产生的减算输出,乘上由振幅谱9的功率和推定噪声振幅谱10的功率确定的振幅调整系数,获得所要求的输出。
Description
本发明涉及语音信号的噪声衰减方法,应用于在具有背景噪声环境下使用的语音通信系统以及语音识别系统中,从输入语音信号中除去噪声,以此作噪声抑制;还涉及使用抑制噪声区间振幅的噪声衰减方法。
过去,作为衰减背景噪声的措施,公知的方法如以下图15所示。即,对在语音上迭加背景噪声的输入信号作A/D(模拟/数字)变换,分割成一定区间(帧),为了在该每帧得到噪声衰减的信号输出,对包括一定区间信号(下称帧信号)的输入信号串作离散傅立叶变换,一旦变换成频谱,则将其分割成振幅谱和相位谱,使用减法滤波器从该输入信号的振幅谱减去从无声区域推定的推定噪声振幅谱,以此推定衰减背景噪声的语音振幅谱(输出振幅谱),与前面的相位谱相加形成背景噪声衰减的语音频谱,将该语音频谱作反向离散傅立叶变换得到输出信号,这就是谱相减法的方法。此方案公开于STEVEN F.BALL“Supprssion of acustic noise in speech using spectralsubtraction,”IEEE Trans.Acoust.,Speesh and signal Proc.,vol.ASSP-29,pp.113-120,Apr.1979中。
图15是表示该噪声衰减方法构成的方框图。首先根据图15说明整体的工作。
按规定的帧长度切出的输入信号107在傅立叶变换部101变换成频率区域,输出输入相位谱108和输入振幅谱109。并且,输入信号利用噪声区间判定部102进行判定,若是大于阀值TH则为语音帧(区间),若是小于上述值则为噪声帧(区间)。
当判定现帧为噪声帧,则推定噪声振幅谱算出部103输出将该时的输入振幅谱109(在到那时的推定噪声振幅上)作加权更新后的推定噪声振幅谱110。
减法滤波器部104其代表的传递函数具有用式1表示的特性。
F(ω):减法滤波器
S(ω):输入振幅谱
E(N(ω)):推定噪声振幅谱
r:缩减率
在式中,S(ω)是输入信号振幅谱项,E(N(ω))是推定噪声振幅谱项,r是表示推定噪声振幅的缩减率的常数。如r大,则噪声抑制量变大,反之,如r小,则噪声抑制量变小。
在减法滤波器部104中,根据一定的式子求缩减率r。
还有,根据该缩减率r,同式(1)一样,使输入振幅谱与推定噪声振幅谱相减,输出其差的输出振幅谱111。
即减法滤波器部104中,在噪声帧和子音等的能量小的帧中减小缩减率,削弱噪声抑制。
输出在逆傅立叶变换部105中返回时间区域的输出信号。
在第1已有的谱减法的方法中,在语音升高和下降和子音的能量小的帧中,其缺点是语音削减使品质变差。若上述的r加大,则语音削减变得更大。
为了解决该问题,在每帧中减法滤波器的缩减率可变的方法公开在特开平8-221092中。在该方法中,作为减法滤波器,在使用式1的F(ω)情况下,当以输入加大情况为例则r变大,当输入小时,则r小使语音削弱减轻。
作为第2个已有的谱减法方法,为了提高噪声衰减效果,使用在时间轴确定区间,对傅立叶变换对象信号乘以称为窗口函数的函数进行加权的方法。例如,帧信号和与其连接的一定长度的信号(迭加信号)乘以窗口函数并作傅立叶变换,逆傅立叶变换的输出帧信号在最前的1以下加权的取样上加前面帧的逆傅立叶变换输出的迭加信号作为输出的方式,在北美CDMA汽车电话系统(TIA/EIA,IS-127,“Enhanced Variable Rate Codec Service Option 3 for WidebandSpread Spectrum Digital Systems”)中已得到应用。图16表示其中所用的窗口函数。
这里,为了使对应帧信号与迭加信号相加时的取样的加权和为1,还使用傅立叶变换对象信号两端平滑地接近0的窗口函数。通过进行这样的窗口函数产生的加权,取得了噪声振幅谱推定精度提高的效果,其结果可提高噪声衰减效果。
而且,作为第3个已有的谱减法方法,有不进行根据窗口函数加权而对帧信号和与其连接的一定长度信号(迭加信号)进行傅立叶变换的方法,并在特开平9-34497中公开的噪声衰减装置中使用。在该情况下,为了使输出在帧间平滑连接,对于逆傅立叶变换输出的帧信号对紧接前面帧的逆傅立叶变换输出的迭加信号在三角窗作重合的波形整形处理并输出,保存逆傅立叶变换输出的迭加信号,以便下一个帧迭加处理。这时用(2)式表示波形整形处理:
Oj=(j·Dj+(L-j)·Zj)/L (j=O~L-1)
Oj=Dj (j=L~L+M-1)
Zj=OM+j (j=O~L-1) (2)
其中
Oj:输出信号
Dj:帧信号
Zj:迭加信号
M:帧长度
L:迭加信号长度
下面说明该方法的优点。
为了实现谱减法方法,在原理上大多使用运算精度限定为16位固定小数运算数字信号处理(固定小数点DSP)。该固定小数点DSP通过加倍精度运算和根据移位产生的进位可提高运算精度,但是有因此使运算量增加的问题。
傅立叶变换和逆傅立叶变换的基本运算量大,有时希望牺牲一些运算精度来实现减少运算量。使用该方法的情况下,由于不在傅立叶变换的帧信号上作根据窗口函数的加权,所以动态范围不展宽,经过限制运算精度的傅立叶变换和逆傅立叶变换的输出帧信号精度的较少降低。因此使用可以小的运算量的固定小数点DSP。
使用第4个已有的谱减法的噪声衰减方法是,为了算出推定噪声振幅谱,首先推定噪声功率,将此作为噪声判定区间的阀值。然后,当输入功率小于该阀值时,判定为噪声帧。还有,推定噪声振幅谱一般用平均算出判定为噪声的区间的多个帧的输入信号,即噪声信号振幅谱的方法是。例如,在特开平8-221092等中的谱减法中使用着该方法。
作为第5个已有的背景噪声衰减方法是,通过对噪声区间作振幅抑制减少噪声感。通过表示信号状态的预定的有限状态决定现帧的状态,在该状态对应于噪声帧状态的情况下,进行一定强度抑制振幅的方法公开于特开平7-38454中。
在第1个已有的谱减法方法中,其缺点是噪声区间变形,成为称为音乐(ミュ-ジカル)噪声的令人不快残留噪声,这在实用中是最大的问题。
这在该噪声区间中发生的是,形成减去推定噪声振幅谱的输出振幅谱在一部分频率中集中功率的形状,而且,该功率集中的频率在每帧上作不规则变化。作为解决音乐噪声的方法,所用的方法是使推定噪声振幅谱的缩减率可变化,在噪声帧中虽然也可使缩减量变小,但在噪声区间中噪声抑制量不足,这就是所存在的问题。
在第2个已有的谱减法方法中,如果利用窗口函数使两端接近零的进行了加权的信号作傅立叶变换,则提高噪声衰减能力。但是用固定小数点DSP实现时,由于两端信号精度下降,所以存在逆傅立叶变换的输出信号的两端变坏,在帧边界上引起异常噪声的课题。
如第3个已有例中,相反,如对不加权的信号作傅立叶变换,则在用固定小数点DSP实现时容易取得精度,但是,在输入振幅谱中包含的噪声振幅谱成分的帧间变动比在已加权情况下要大,结果噪声衰减能力要劣于加权的情况。
在第4个已有的谱减法的噪声区间判定中,问题是,在噪声功率变化大的情况下,如若高设定噪声区间判定阀值以便正确地判定噪声帧时,则某程度语音帧也误判定为噪声帧,在推定噪声振幅谱上漏入语音谱,成为语音削减的原因。相反,问题是,为了防止出现该问题,如若低设定噪声区间判定阀值,使语音帧不判定为噪声帧,则把噪声帧判定为语音帧,推定噪声振幅谱的更新不能正确进行,结果噪声衰减能力变差。
在通过使第5个噪声区间进行振幅抑制来衰减噪声感的方法中,问题是,从表示信号状态的预定有限状态确定现帧的帧的状态,在该帧状态是噪声帧状态下,如若采取进行一定强度的振幅抑制的方式,则根据输入噪声种类在短时时间的期间,帧状态在语音帧状态和噪声帧状态之间频繁移动,振幅抑制强度随此频繁变化,结果输出功率不稳定,听感差。
为了解决上述问题,本发明目的在于得到一种即使往或从噪声帧频繁移动,每帧的谱偏向一部分频率,也可使令人不快的残留噪声减少的噪声衰减的方法。
根据本发明的噪声衰减设备,利用谱减法滤波器从将在一定长度上切出的输入信号进行正交变换得到的振幅谱中,减去推定噪声振幅谱得到输出,该噪声衰减设备的特征是,备有振幅调整滤波器,用以对每帧中所述谱减法滤波器产生的减算输出,乘上用上述振幅谱功率和以所述推定噪声振幅谱功率确定的振幅调整系数,得到所需要的输出。
谱减法滤波器根据所述推定噪声振幅谱使推定噪声振幅谱的减算缩减率可变化;振幅调整滤波器部特征是根据缩减率使振幅调整系数可变化。
所述振幅调整滤波器部特征是在缩减率加大的情况下,利用振幅调整系数加大,在语音区间增强噪声抑制,并且,加大输出信号的输出值,同时,所述振幅调整滤波器部在缩减率减小的情况下,通过减小振幅调整系数,在噪声区间减弱噪声抑制,并且,减小输出信号的输出值。
振幅滤波器部特征是对根据谱减法滤波器的减算输出进行逆正交变换的时间区域振幅谱,乘振幅调整系数。
振幅调整滤波器部特征是于每个帧在频率区域,对振幅谱乘上振幅调整系数并进行逆正交变换,以得到输出。
振幅调整系数特征是把在前帧得到的振幅调整系数值进行加权后相加到根据现帧的输入信号振幅谱的功率与现帧推定噪声振幅谱的功率之差得到的现帧的振幅调整系数上的值。
根据本发明的噪声衰减设备,利用谱减法滤波器从将在一定帧长度上切出的输入信号进行正交变换得到的振幅谱中,减去推定噪声振幅谱得到输出,其特征是,备有输入信号生成部,用以在乘1以下的加权函数之后,附加在现帧前后,以便切出现帧前后设定区域,使其端接近零,把该输入信号生成部的输出作为输入信号,求振幅谱。
根据本发明的噪声衰减设备,其特征是,备有波形整形处理部,用以利用乘1的加权函数的前帧后的设定区间,进行现帧的波形整形。
本发明的噪声衰减设备,利用谱减法滤波器从对在一定帧长度上切出的输入信号进行正交变换得到的振幅谱中,减去推定噪声振幅谱得到输出,其特征是,备有缩减率计算部,用以从所述推定噪声振幅谱的多个帧求平均噪声功率,与噪声帧的判定阀值比较,得到缩减率;把在所述谱减法滤波器的减算中使用的缩减率作为所述缩减率。
本发明的噪声衰减设备,其特征是,备有平均噪声功率计算部,用以从推定噪声振幅谱的多个帧中求平均噪声功率;振幅调整滤波器部在每帧对谱减法滤波器产生的减算输出,乘上由振幅谱功率和所述求得的平均噪声振幅功率确定的振幅调整系数,得到所要求的输出。
本发明的噪声衰减的方法,利用谱减法滤波器从使在一定长度上切出的输入信号进行正交变换得到的振幅谱中,减去推定噪声振幅谱得到输出,其特征是具有以下工序:
根据所述推定噪声振幅谱,使所述谱减法滤波器的缩减率可变化的工序;
每帧中对所述谱减法滤波器产生的减算输出,乘上用上述振幅谱功率和以所述推定噪声振幅谱功率确定的振幅调整系数,得到所需要的输出的工序。
本发明的噪声衰减的方法,利用谱减法滤波器从使在一定帧长度上切出的输入信号进行正交变换得到的振幅谱中,减去推定噪声振幅谱得到输出,其特征是具有以下工序:
从所述推定噪声振幅谱的多个帧求平均噪声功率,与噪声帧的判定阀值比较,得到缩减率的缩减率计算工序;
把所述谱减法滤波器的缩减率作为所述缩减率的工序。
图1是表示本发明实施例1的谱减法方法的构成方框图;
图2是在实施例1的噪声衰减方法中振幅调整滤波器进行的工作流程图;
图3是说明实施例1的噪声区间判定部进行的工作的图;
图4是说明实施例1的振幅调整滤波器进行的工作的图;
图5是说明实施例1的谱减法方法的输出信号图;
图6是表示本发明实施例2的谱减法方法的构成方框图;
图7是表示本发明实施例3的谱减法方法的构成方框图;
图8是表示实施例3的噪声衰减方法的输入信号例子的图;
图9是表示在实施例3的噪声衰减方法中,输入信号生成部乘算的加权函数例子的图;
图10是表示实施例3的噪声衰减方法的逆傅立叶变换部的输出信号例子的图;
图11是表示本发明实施例4的谱减法方法的构成方框图;
图12是说明实施例4的噪声衰减方法的工作的图;
图13是表示本发明实施例5的谱减法方法的构成图;
图14是说明实施例5的噪声衰减方法的工作的图;
图15是表示已有的噪声衰减方法构成图;
图16是表示在已有的噪声衰减方法中使用的窗口函数的图;
图17是实施例1的动作比较图;
图18是表示实施例3的波形整形处理图。
实施发明的最佳形态
实施例1
下面说明这样的本发明实施例1的噪声衰减方法,使谱减法滤波器的缩减率可变化,备有振幅调整滤波器部,从通常的输出再进行依赖于其缩减率的振幅减算。
图1是本实施例的噪声衰减方法构成的方框图;图2是图1的振幅调整滤波器部的工作流程图。图17是表示对于语音区间和噪声区间工作的比较图。
首先根据图1说明整体工作。
切成一定帧长度的输入信号7在傅立叶变换部1中作正交变换,变换成频率区域,输出输入相位谱8和输入振幅谱9。输入信号通过噪声区间判定部2在大于阀值TH时判定为语音帧(区间)、小于阀值TH时判定为噪声帧(区间)。这里,若下面式(3)成立,则可置换成新的阀值THnew。
Pin<2.0TH (3)
THnew=0.9TH+0.1Pin (4)
其中,Pin是输入信号功率,TH是更新前的噪声区间判定阀值,THnew是更新后的噪声区间判定阀值。
这样,得到图3所示的关系。推定噪声振幅谱计算部3一旦把现帧判定为噪声帧,则对那时的输入振幅谱9例如(对那时的推定噪声振幅谱)进行象式(5)所示的加权计算,输出更新的推定噪声振幅谱10。
E(N(ω))=Eold(N(ω))α+S(ω)·(1-α) (5)
其中:
E(N(ω))是更新后的推定噪声振幅谱,
Eold(N(ω))是更新前的推定噪声振幅谱,
S(ω)是输入信号振幅谱,
0<α<1
在减法滤波器部4中,根据下一个式(6)求缩减率r,作为噪声缩减强度13输出。
r=min{1.0,rTH·POWS/POWN} (6)
其中:
POWS是现帧的全频输入信号振幅谱的功率,
POWN是现帧的全频推定噪声振幅谱的功率,
0<rTH<1
还有根据该缩减率r,与式(1)一样减去输入振幅谱和推定噪声振幅谱,输出差的输出振幅谱11。
即,在减法滤波器部4(谱减法滤波器)中,在噪声帧和子音等的功率小的帧中,减小缩减率而削弱噪声抑制。
在逆傅立叶变换部5中返回时间区域的输出振幅12,由于在功率小的帧中在下一个振幅调整滤波器部6中振幅调整系数变小,所以振幅抑制加强。
即,振幅调整滤波器部6进行图2的步骤S1至S3的工作。在最初的S1中,输入噪声缩减强度13(缩减率r)。然后,从现帧的输入信号的语音区域的振幅谱功率与现帧的推定噪声振幅谱功率之差,用(7)式求每帧的振幅抑制系数G,
(POWS-POWN≥0、并且,POWS-r·POWN>0)
G=0
(POWS-POWN<0、或,POWS-r·POWN≤0)
这里,POWS是现帧输入信号的全频率振幅谱的功率;POWN是现帧的全频率推定噪声振幅谱的功率;G是现帧振幅抑制系数;r是缩减率。如图17所示,如缩减率r大,则振幅抑制系数G大,如缩减率r小,则振幅抑制系数G小。
还有在S2中,用下式(8)求每个取样的振幅调整系数g(n),
g(n)=g(n-1)AR+G(1-AR) (8)
其中:0<AR<1
并且,g(n)是现帧的第n取样的振幅调整系数;n-1是表示其前的取样。如图17所示,如缩减率r大,则振幅抑制系数G大,振幅调整系数g(n)变大,如缩减率r小,则振幅抑制系数G小,振幅调整系数g(n)变小。
还有,在S3中,用Sin表示从逆傅立叶变换部5的输出振幅12,利用下式(9)乘振幅调整系数g(n),得到输出信号14,
Sout(n)=Sin(n)Xg(n) (9)
图4是表示振幅调整滤波器部6的输入输出特性的图,在噪声区间,由于缩减率r小,所以振幅调整系数g(n)小,在输出侧抑制加大,输出值变小,在语音区间则相反,由于缩减率r大,所以振幅调整系数g(n)大,在输出侧抑制变小,输出值相对变大。
根据该实施例,在噪声帧和子音等的功率小的语音帧中,由于使频率区域的噪声缩减量减小,所以,在噪声帧中抑制音乐噪声发生,可防止语音区间的削减。图5是表示在这时的缩减前,缩减后的噪声帧的振幅谱状态。
设缩减率r为1.0,在缩减大噪声情况下,只是缩减后的噪声振幅谱强的频率成分成为残留音乐噪声的基础。设缩减率r为0.5,在减弱缩减的情况下,减轻对缩减后的噪声振幅谱的一部分频率的振幅偏差,音乐噪声不发生。在削减了该缩减量的帧中,由于据此进行振幅抑制,所以能防止噪声抑制量不足。并且,在本实施例的振幅调整滤波器部6中,根据式(8),振幅调整系数即使在一个帧内也要每个取样按顺序在时间轴方向慢慢变化,所以即便进行语音区间增加等急剧的振幅调整也得到自然的输出。
实施例2
在频率区域也可实施振幅调整。即在傅立叶变换后,设置振幅调整滤波器部,形成逆傅立叶变换振幅调整后的信号的结构。
根据附图说明本发明实施例2的方法。
图6是表示涉及实施例的谱减法方法的构成的方框图。
根据图6说明本方法的工作
图6的构成是在紧接着减法滤波器4之后移动图1的振幅调整滤波器,表示在频率区域进行振幅调整的构成,其它部分的工作与实施例1的相同。
在图中,减法滤波器部4用式(6)算出缩减率,根据该缩减率从输入振幅谱9减去推定噪声振幅谱10,输出输出振幅谱。振幅调整滤波器部15根据该缩减率将算出的振幅调整系数乘输出振幅谱,输出最后的输出振幅谱。
根据该实施例,在噪声帧和子音等功率小的语音帧中,由于使缩减强度减小,所以在噪声帧中抑制音乐噪声发生,能防止子音区间变形和丧失,并且,在减少缩减量的帧中,由于据此进行振幅抑制,所以也能防止噪声抑制量不足。
并且,振幅调整系数也可在帧上一次算出,如实施例1的图2的S3,由于即使在每个信号1取样没有计算振幅调整系数,也能以少的运算量实现。
实施例3
在前面的实施例中,输入信号由于提取了以一定帧划分的每个区间上的语音,所以,在帧(区间)的变化点中输入信号不连续,往往产生异常语声感。在本实施例中,对此做了改善,使帧间信号变化平滑。
下面根据附图说明本发明实施例的方法。
图7是表示本发明实施例3的谱减法方法的构成方框图。输入信号生成部19和波形整形处理部20是新的部件,其它与图1的各部件相同。
图8是表示本实施例3噪声衰减方法的输入信号7的例子的图,图9是表示对本实施例3的噪声衰减方法的输入信号生成部所产生的输入信号进行乘算的加权函数的图。
图10是表示作为本实施例3的噪声衰减方法的逆傅立叶变换部5输出信号的5a例子的图。
根据图7的构成,说明本实施例的噪声衰减方法的工作。
在图8中表示AD变换后的输入信号7的时序振幅,将其输入到输入信号生成部19。输入信号生成部19设用现帧处理噪声抑制的帧信号为s(i)(i=n,n+1,…,n+fr)的情况下,分出在帧信号上加前后信号的s(i)(i=n-a,n-a+1,…,n+fr+sm+a)。图8的A是帧的前设定区间。图8的B和C是帧的后设定区间。接着乘图9的加权函数,如下式(10)算出加权的信号s’(i)(i=n-a,n-a+1,…,n+fr+sm+a)。在图8的A和C设定区间中,进行使端接近0的加权。在图8的B的设定区间中,与帧信号同样进行1的加权。
s’(i)=S(i)·W(i-n+a)
(i=n-a,n-a+1,…,n+fr+sm+a) (10)
傅立叶变换部1对该信号s’(i)(i=n-a,n-a+1,…,n+fr+sm+a)进行傅立叶变换。若设逆傅立叶变换部5的输出信号为u(i)(i=0,1,…,2a+fr+sm),则图10表示u(i),在时间上u(i)(i=0,1,…,2a+fr+sm)对应s(n-a+i)(i=0,1,…,2a+fr+sm)。
如图18所示,波形整形处理部20中对应帧信号的u(i)(i=a,a+1,…,a+fr)用逆傅立叶变换后的信号在帧间非不连续进行波形整形处理并输出。下式(11)是表示当设前帧后的设定区域B的逆傅立叶变换输出的u(i)(i=a+fr,a+fr+1,…,a+fr+sm)为up(i)(i=0,1,…,sm)时的波形处理后的输出信号的式子。
u’(i)=(u(i)·i+up(i-a)·(sm-i))/sm
(i=a,a+1,…,a+sm) (11)
u’(i)是波形处理后的信号。
根据该实施例,由于把使端接近0的加权信号作傅立叶变换,所以噪声衰减能力提高。而且,在用固定小数点运算数字信号处理器(固定小数点DSP(数字信号处理器))实现本系统时,由于在波形整形处理中不使用因加权使精度变差的两端的信号(图18的A和C),所以容易确保输出精度,可防止在帧边界的异常噪声。
当使用DSP时,为了作16位左右短的语长的固定小数点运算,当处理动态范围大的信号时,会产生精度劣化。当为了使端接近0而加权时,由于信号的动态范围扩大,所以一使用DSP则引起精度变坏。在该实施例中,由于在波形整形处理中不使用引起精度劣化的端信号,所以提高了波形整形处理精度。
实施例4
作为提高谱减法的噪声衰减效果的方法,噪声区间的判别容易,并且,设想减轻因缩减引起语音的削弱的方法。
下面根据附图说明本发明实施例4的方法。
图11是表示本发明实施例4的谱减法方法构成方框图。在图中,作为新部件,有缩减率计算部16。其他部件是与图1同号的那些一样。
图12是说明本实施例噪声衰减方法的工作图。在图中,实线表示噪声区间的输入功率POWS,虚线表示平均噪声功率POWAVE,点划线表示噪声区间判定阀值POWTH。此外,所谓POWTH是用式(3)描述的前噪声帧中的阀值。
根据图11的整个构成图,说明本实施例的噪声衰减方法的工作。
本构成为在已有的方法的谱减法整体构成上追加缩减率计算部16。在图11中,减法滤波器部4的滤波器进行式(1)的运算。在噪声区间判定部2中,算出噪声区间判定阀值POWTH,在输入功率减少该阀值情况下,判定为噪声帧。
缩减率计算部16根据该判定结果算出接近当前的多个噪声帧的平均功率作为平均噪声功率,当根据下式(12):
设噪声区间判定阀值为POWTH,平均噪声功率为POWAVE时,计算噪声区间判定阀值17和平均噪声之比r1,将其作为噪声变动的大小输出。
把这噪声变动大小r1作为式(1)噪声谱的缩减率r。在功率变动大的噪声的情况下,噪声区间判定阀值POWTH用能正确判定为噪声区间的较高的值。相对于这时的噪声区间的输入功率变化,将平均噪声功率和噪声区间判定阀值的变化表示在图12。
根据该实施例,即便是在噪声功率变动大的情况下,如图12所示,由于噪声帧的平均噪声功率POWAVE取比噪声区间判定阀值POWTH还要小的值,所以缩减率r1取比1小的值。作为结果,获得抑制推定噪声振幅谱的缩减的效果。可减轻语音的削减,并且,推定噪声振幅谱的更新也能正常进行。
实施例5
说明对被看作噪声区间的噪声的输入信号进行振幅抑制,衰减令人不快残留噪声的方法。
下面根据附图,说明本发明实施例5的方法。
图13是表示本发明实施例5的噪声衰减方法的主要构成部的方框图。
而图14是说明本实施例的噪声衰减方法的工作的图。
本构成是通过噪声区间的振幅抑制衰减噪声的方法,取决于当前输入功率和平均噪声功率来决定进行振幅抑制的振幅调整系数。
用图13说明工作。
噪声区间判定部301由输入信号304算出用图12实线表示的输入功率POWS305,根据与实施例同样的噪声区间判定阀值POWTH进行噪声区间判定。平均噪声功率计算部302根据该噪声区间判定结果,算出接近当前帧的过去多个噪声帧的平均功率,形成用图12的虚线表示的平均噪声功率POWAVE306。
振幅调整滤波器部303通过输入信号的输入功率POWS305和平均噪声功率POWAVE306,用(13)式算出振幅抑制系数G,就这样将其作为振幅调整系数,对输入信号304乘上所得到的振幅调整系数作为输出信号307。
(POWS-POWAVE≥0)
G=0
(POWS-POWAVE<0) (13)
并且,使用通过(13)算出的振幅抑制系数G,为了在帧间使振幅调整系数作平滑变化,如式(8)所示,对于G每个取样作平滑操作,也可形成最终振幅调整系数g(n)。
图14是表示输入信号304的输入功率POWS305和振幅调整后的输出信号307的输出功率之间关系图。
图14的虚线是不使用振幅调整滤波器,照样输出输入信号的情况。即虚线表示输入信号的输入功率=输出信号的输出功率的情况。实线表示使用振幅调整滤波器情况下的输入功率POWS和输出功率的关系。表示利用振幅抑制输出比虚线小的值。而且,在输入功率比平均噪声功率POWAVE小的情况下,表示输出信号功率为零。
根据该实施例,除了缩减率可变外,还由于备有据此可改变振幅抑制程度的振幅调整滤波器部,所以,频繁地通过语音状态判定结果直接决定振幅调整系数,并且在强度上振幅抑制不变化,所以语音输出稳定。
如上所述,根据本发明,除了缩减率可变外,还由于备有据此可改变振幅抑制程度的振幅调整滤波器部,所以,针对为了防止语音区间削弱的目的,即便在噪声帧等中减小缩减强度,也因通过进行与此对应的振幅抑制来抑制噪声,所以作为整体具有得到采取平衡的易于听到的输出的效果。
还有,由于要在频率区域作振幅调整,所以具有无需对每个信号1取样计算振幅调整系数,有可减少运算量的效果。
还有,由于即使振幅调整系数在帧内也在时间轴方向慢慢变化,所以即使进行语音区间增加等急剧振幅调整,也能获得自然输出。
还有,由于备有现帧前后区间的信号也乘加权函数再作加法运算的输入信号生成部,所以使傅立叶变换的对象信号加权,噪声谱的推定精度提高,增加了噪声衰减效果,并且,把不作逆傅立叶变换输出加权的信号作为帧信号输出,即便在固定小数点运算数字信号处理器中运算也少,具有获得高信号精度的效果。
并且,由于要按照判定为噪声区间的区间的变动性调整去除噪声的强弱,所以跟踪噪声变动性大的情况,可设定正确的噪声判定阀值,而且,还具有防止混入语音成分削弱语音的效果。
再有,由于通过噪声区间的判定结果不直接决定振幅抑制量,使用缓缓变化的噪声区间平均功率,决定振幅抑制量,所以具有避开输出随噪声区间判定频繁变化导致的坏影响的效果。
Claims (12)
1.一种噪声衰减设备,利用谱减法滤波器从对在一定帧长度上切出的输入信号进行正交变换得到的振幅谱中,减去推定噪声振幅谱,得到输出,其特征是,备有振幅调整滤波器,用以在每帧中对所述谱减法滤波器产生的减算输出,乘上用上述振幅谱功率和所述推定噪声谱功率确定的振幅调整系数,得到所需要的输出。
2.根据权利要求1的噪声衰减设备,其特征是,谱减法滤波器根据所述推定噪声谱使推定噪声振幅谱的减算缩减率可变化;振幅调整滤波器部根据缩减率使振幅调整系数可变化。
3.根据权利要求2的噪声衰减设备,其特征是,所述振幅调整滤波器部在缩减率加大的情况下,利用振幅调整系数加大,在语音区间增强噪声抑制,并且,加大输出信号的输出值,同时,所述振幅调整滤波器部在缩减率减小的情况下,通过减小振幅调整系数,在噪声区间减弱噪声抑制,并且,减小输出信号的输出值。
4.根据权利要求1的噪声衰减设备,其特征是,振幅滤波器部对使谱减法滤波器的减算输出进行了逆正交变换的时间区域振幅谱,乘上振幅调整系数。
5.根据权利要求1的噪声衰减设备,其特征是,振幅调整滤波器部于每个帧在频率区域,对振幅谱乘上振幅调整系数,得到进行逆正交变换后的输出。
6.根据权利要求1的噪声衰减设备,其特征是,振幅调整系数在根据现帧的输入信号振幅谱的功率与现帧推定噪声振幅谱的功率之差得到的现帧的振幅调整系数上,对在前帧得到的振幅调整系数值作为进行加权相加后的值。
7.一种噪声衰减设备,利用谱减法滤波器从使在一定帧长度上切出的输入信号进行正交变换得到的振幅谱中,减去推定噪声振幅谱,得到输出,其特征是,备有输入信号生成部,在乘以1以下的加权函数之后,附加在现帧前后,使得切出现帧前后设定区间后,端接近零,把该输入信号生成部的输出作为输入信号,求振幅谱。
8.根据权利要求7的噪声衰减设备,其特征是,备有波形整形处理部,用以利用乘以1的加权函数后的前帧后的设定区间,进行现帧的波形整形。
9.一种噪声衰减设备,利用谱减法滤波器从使在一定帧长度上切出的输入信号进行正交变换得到的振幅谱中,减去推定噪声振幅谱,得到输出,其特征是,备有缩减率计算部,用以从所述推定噪声振幅谱的多个帧求平均噪声功率,与噪声帧的判定阀值比较,得到缩减率;把在所述谱减法滤波器的减算中使用的缩减率作为所述缩减率。
10.根据权利要求1的噪声衰减设备,其特征是,备有平均噪声功率计算部,用以从推定噪声振幅谱的多个帧中求平均噪声功率;振幅调整滤波器部在每帧对谱减法滤波器产生的减算输出,乘上由振幅谱功率和求得的所述平均噪声振幅功率确定的振幅调整系数,得到所要求的输出。
11.一种噪声衰减的方法,利用谱减法滤波器从使在一定帧长度上切出的输入信号进行正交变换得到的振幅谱中,减去推定噪声振幅谱,得到输出,其特征是具有以下工序:
根据所述推定噪声振幅谱,使所述谱减法滤波器的缩减率可变化的工序;
每帧中对所述谱减法滤波器产生的减算输出,乘上用上述振幅谱功率和所述推定噪声谱功率确定的振幅调整系数,得到所需要的输出的工序。
12.一种噪声衰减的方法,利用谱减法滤波器从使在一定帧长度上切出的输入信号进行正交变换得到的振幅谱中,减去推定噪声振幅谱,得到输出,其特征是具有以下工序:
从所述推定噪声振幅谱的多个帧求平均噪声功率,与噪声帧的判定阀值比较,得到缩减率的缩减率计算工序;
把所述谱减法滤波器的缩减率作为所述缩减率的工序。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8417498 | 1998-03-30 | ||
JP84174/1998 | 1998-03-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1258368A true CN1258368A (zh) | 2000-06-28 |
Family
ID=13823136
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN98805620A Pending CN1258368A (zh) | 1998-03-30 | 1998-12-07 | 噪声衰减设备以及噪声衰减方法 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP0992978A4 (zh) |
KR (1) | KR100314332B1 (zh) |
CN (1) | CN1258368A (zh) |
AU (1) | AU721270B2 (zh) |
CA (1) | CA2291826A1 (zh) |
WO (1) | WO1999050825A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101027719B (zh) * | 2004-10-28 | 2010-05-05 | 富士通株式会社 | 噪声抑制装置 |
CN101166232B (zh) * | 2006-10-19 | 2010-05-12 | 华晶科技股份有限公司 | 消除马达声音的方法及其数字影像撷取装置 |
CN1822092B (zh) * | 2006-03-28 | 2010-05-26 | 北京中星微电子有限公司 | 一种消除语音输入中背景噪声的方法及其装置 |
CN103238181A (zh) * | 2010-12-07 | 2013-08-07 | 三菱电机株式会社 | 用于恢复由于对测试语音信号进行噪声去除导致在测试噪声去除后语音信号中衰减的谱成分的方法 |
CN108831500A (zh) * | 2018-05-29 | 2018-11-16 | 平安科技(深圳)有限公司 | 语音增强方法、装置、计算机设备及存储介质 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4162604B2 (ja) | 2004-01-08 | 2008-10-08 | 株式会社東芝 | 雑音抑圧装置及び雑音抑圧方法 |
JP4873913B2 (ja) | 2004-12-17 | 2012-02-08 | 学校法人早稲田大学 | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
GB2422237A (en) * | 2004-12-21 | 2006-07-19 | Fluency Voice Technology Ltd | Dynamic coefficients determined from temporally adjacent speech frames |
EP1914727B1 (en) * | 2005-05-17 | 2009-08-12 | Yamaha Corporation | Noise suppression methods and apparatuses |
KR100686382B1 (ko) | 2005-07-08 | 2007-02-22 | 엔에이치엔(주) | 싱크 서버를 이용한 메신저 알림 시스템 및 방법 |
EP2192579A4 (en) * | 2007-09-19 | 2016-06-08 | Nec Corp | NOISE SUPPRESSION DEVICE, ITS METHOD AND PROGRAM |
JP6182895B2 (ja) | 2012-05-01 | 2017-08-23 | 株式会社リコー | 処理装置、処理方法、プログラム及び処理システム |
JP6216546B2 (ja) * | 2013-06-18 | 2017-10-18 | パイオニア株式会社 | ノイズ低減装置、放送受信装置及びノイズ低減方法 |
JP2015206874A (ja) | 2014-04-18 | 2015-11-19 | 富士通株式会社 | 信号処理装置、信号処理方法、及び、プログラム |
JP6687453B2 (ja) * | 2016-04-12 | 2020-04-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | ステレオ再生装置 |
JP6668995B2 (ja) * | 2016-07-27 | 2020-03-18 | 富士通株式会社 | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8801014D0 (en) * | 1988-01-18 | 1988-02-17 | British Telecomm | Noise reduction |
US5710862A (en) * | 1993-06-30 | 1998-01-20 | Motorola, Inc. | Method and apparatus for reducing an undesirable characteristic of a spectral estimate of a noise signal between occurrences of voice signals |
UA41913C2 (uk) * | 1993-11-30 | 2001-10-15 | Ейті Енд Ті Корп. | Спосіб шумозаглушення у системах зв'язку |
JP3565226B2 (ja) * | 1993-12-06 | 2004-09-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ノイズ低減システム、ノイズ低減装置及びこの装置を具える移動無線局 |
JP3437264B2 (ja) * | 1994-07-07 | 2003-08-18 | パナソニック モバイルコミュニケーションズ株式会社 | 雑音抑圧装置 |
SE505156C2 (sv) * | 1995-01-30 | 1997-07-07 | Ericsson Telefon Ab L M | Förfarande för bullerundertryckning genom spektral subtraktion |
JP3451146B2 (ja) * | 1995-02-17 | 2003-09-29 | 株式会社日立製作所 | スペクトルサブトラクションを用いた雑音除去システムおよび方法 |
JP3484801B2 (ja) * | 1995-02-17 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び装置 |
-
1998
- 1998-12-07 WO PCT/JP1998/005512 patent/WO1999050825A1/ja not_active Application Discontinuation
- 1998-12-07 AU AU13525/99A patent/AU721270B2/en not_active Ceased
- 1998-12-07 CA CA002291826A patent/CA2291826A1/en not_active Abandoned
- 1998-12-07 EP EP98957196A patent/EP0992978A4/en not_active Withdrawn
- 1998-12-07 CN CN98805620A patent/CN1258368A/zh active Pending
-
1999
- 1999-09-07 KR KR1019997008125A patent/KR100314332B1/ko not_active IP Right Cessation
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101027719B (zh) * | 2004-10-28 | 2010-05-05 | 富士通株式会社 | 噪声抑制装置 |
CN1822092B (zh) * | 2006-03-28 | 2010-05-26 | 北京中星微电子有限公司 | 一种消除语音输入中背景噪声的方法及其装置 |
CN101166232B (zh) * | 2006-10-19 | 2010-05-12 | 华晶科技股份有限公司 | 消除马达声音的方法及其数字影像撷取装置 |
CN103238181A (zh) * | 2010-12-07 | 2013-08-07 | 三菱电机株式会社 | 用于恢复由于对测试语音信号进行噪声去除导致在测试噪声去除后语音信号中衰减的谱成分的方法 |
CN103238181B (zh) * | 2010-12-07 | 2015-06-10 | 三菱电机株式会社 | 用于恢复由于对测试语音信号进行噪声去除导致在测试噪声去除后语音信号中衰减的谱成分的方法 |
CN108831500A (zh) * | 2018-05-29 | 2018-11-16 | 平安科技(深圳)有限公司 | 语音增强方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP0992978A1 (en) | 2000-04-12 |
WO1999050825A1 (fr) | 1999-10-07 |
CA2291826A1 (en) | 1999-10-07 |
EP0992978A4 (en) | 2002-01-16 |
AU1352599A (en) | 1999-10-18 |
AU721270B2 (en) | 2000-06-29 |
KR20000076037A (ko) | 2000-12-26 |
KR100314332B1 (ko) | 2001-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1192358C (zh) | 声音信号加工方法和声音信号加工装置 | |
CN1282155C (zh) | 噪声抑制装置和方法 | |
CN1258368A (zh) | 噪声衰减设备以及噪声衰减方法 | |
CN1308914C (zh) | 噪声抑制装置和方法 | |
CN1146155C (zh) | 噪声抑制装置 | |
CN1113335A (zh) | 降低语音信号中噪声的方法和检测噪声域的方法 | |
CN1127055C (zh) | 用于对宽带声音信号进行有效的编码的感觉加权设备与方法以及使用该设备的蜂窝通信系统 | |
CN1669074A (zh) | 话音增强装置 | |
CN1303585C (zh) | 噪声抑制 | |
CN1302462C (zh) | 降噪装置和降噪方法 | |
CN1083183C (zh) | 用来降低语音信号中噪声的方法和装置 | |
CN1110034C (zh) | 谱削减噪声抑制方法 | |
CN1223109C (zh) | 回波抑制系统中增强近端语音信号 | |
CN1794757A (zh) | 一种电话及在该电话中处理音频信号的方法 | |
CN1905006A (zh) | 噪声抑制系统与方法及程序 | |
CN1185620C (zh) | 声音合成装置和方法以及电话装置 | |
CN1684143A (zh) | 一种语音增强的方法 | |
CN1141698C (zh) | 对输入语音进行语音识别的音程标准化装置 | |
CN1310431C (zh) | 用于编码音频信号的设备和方法 | |
CN1918461A (zh) | 在存在背景噪声时用于语音增强的方法和设备 | |
CN1391689A (zh) | 宽带语音和音频信号解码器中的增益平滑 | |
CN1297222A (zh) | 信息处理设备、方法和记录媒体 | |
CN1451225A (zh) | 用于消除收发信机单元中回波的回波消除设备 | |
CN1969320A (zh) | 噪声抑制装置及噪声抑制方法 | |
JP2015050685A (ja) | オーディオ信号処理装置および方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |