CN100520913C - 增强语音质量的方法及其装置 - Google Patents
增强语音质量的方法及其装置 Download PDFInfo
- Publication number
- CN100520913C CN100520913C CNB2005100995665A CN200510099566A CN100520913C CN 100520913 C CN100520913 C CN 100520913C CN B2005100995665 A CNB2005100995665 A CN B2005100995665A CN 200510099566 A CN200510099566 A CN 200510099566A CN 100520913 C CN100520913 C CN 100520913C
- Authority
- CN
- China
- Prior art keywords
- speech sound
- speech
- pass filtering
- output
- filtering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 43
- 230000002708 enhancing effect Effects 0.000 title abstract description 4
- 238000001914 filtration Methods 0.000 claims abstract description 67
- 230000003044 adaptive effect Effects 0.000 claims abstract description 18
- 238000001228 spectrum Methods 0.000 claims description 28
- 230000003595 spectral effect Effects 0.000 claims description 27
- 238000000605 extraction Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 239000012634 fragment Substances 0.000 claims 1
- 230000008676 import Effects 0.000 claims 1
- 230000015556 catabolic process Effects 0.000 abstract 1
- 238000006731 degradation reaction Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Machine Translation (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Navigation (AREA)
- Magnetically Actuated Valves (AREA)
- Filters That Use Time-Delay Elements (AREA)
Abstract
本发明涉及增强语音的质量,其中,通过从无声语音中去除噪声来减少语音质量衰减。本发明包括将输入语音划分成一有声语音和一无声语音,在所述有声语音上执行自适应滤波以去除所述有声语音的噪声,并且在所述无声语音上执行频谱相减。
Description
本申请要求提交于2004年9月7日的韩国专利申请第10-2004-0071371的优先权,该申请整体结合在此作为参考。
技术领域
本发明涉及增强语音质量的方法和装置。虽然本发明适合各种各样的应用,但是它尤其适用于有效地增强语音质量。
背景技术
一般而言,已经提出了各种用于增强语音质量的方法。频谱相减法(SSM)是多种方法中有代表性的一个。下文结合图1解释频谱相减法(SSM)。
SSM是一种直接评估短时频谱幅度的方法。在SSM中,语音被建模为一种形式,其中加入了一种由一不相关随机变量所表示的噪声。该语音建模由以下的公式1来表达。
(公式1)
y[n]=s[n]+d[n]
在公式1中,y[n]是输入语音。此外,假定d[n]是s[n]的不相关噪声。因此,根据以下公式2建立了功率谱密度。
(公式2)
Sγ(ejω)=Ss(ejω)+Sd(ejω)
在公式2中,Sγ(ejω)是通过短时离散时间傅立叶变换(DTFT)由公式3表示的。
(公式3)
Sγ(ejω)=|Y(ejω)|2
相位是已知的,用来寻找语音帧本身的频谱。此外,已经证实使用实质上与噪声混合的噪声语音的相位来确定语音帧的相位是没有大的差异的。(D.L.Wang和J.S.Lim,“相位在语音增强中的不重要性”(The unimportanceof phase in speech enhancement)IEEE声学论文集,语音以及信号处理,卷ASSP30,第679—681页,1982。)
(公式4)
下文参考图2解释了多种语音质量增强方法中的一种,诸如自适应线性增强器(ALE)。首先,解释通用自适应滤波器的使用,因为ALE的发展来自一种使用自适应滤波器的方案。
当使用自适应滤波器时,在接收了两个麦克风的输入后,即,接收噪声语音作为一个麦克风的输入,并接收纯噪声作为另一个麦克风的输入,由于两个麦克风间的间距等,生成一个传递函数或其类似函数。然而,自适应滤波器移除了传递函数以获得纯净的语音。
使用自适应滤波器的方法在某些情况是非常有效的,并且已经成功地用于实际用途。然而,该方法要求安装一对麦克风。同样,在判断该对麦克风应该彼此间隔多远地放置时存在着结构性难点。这样,在诸如移动终端等用户设备上应用该方法是困难的。
ALE(自适应线性增强器)是对使用自适应滤波器的方法的改进,并且是一种通过留出等于信号之间的基音周期的差,在获取自同一麦克风的信号s[n]和d[n]上执行自适应滤波的方案。在此,基音周期对应于语音信号内的有声语音部分的周期。
对于有声语音,一个周期性脉冲序列激励一个声道。这样,ALE在有声语音上施加了一个相当可观的效果。然而,对于无声语音,对应的语音是破碎的。
下文解释了多种语音质量增强方法中的一种,诸如使用自适应梳状滤波器的方案。首先,当使用自适应梳状滤波器时,一个类似于ALE的对应方案在有声语音上有着更好的效果。
在有声语音的情况下,激励信号是周期信号。即使在脉冲序列上执行傅立叶变换,结果也表明该脉冲序列出现在频域中。这样,在有声语音的情况下,在基音频率变为多倍的部分周期性地出现波峰。理所当然的是,整体频谱轮廓是由称为共振峰的声道共振来表示的。
(公式5)
在公式5中,T0表示已提取的基音周期,ci表示梳状滤波器系数。在此,一般使用较小的值(1~6)作为值L。同时,因为噪声通常不是周期性的,因此自适应梳状滤波器在去除噪声方面是有效的。然而,相关技术的语音质量增强方法含有以下问题或缺点。
第一,如果没有语音,则在SSM中是从噪声估算的。然而,不能够可靠地测量即,如果假设噪声d[n]是稳定信号,则只能估算即使的确如此,也不能避免频谱根据时间的变化。尤其是,在移动终端或其类似物的情况下,因为四周的环境在不停变化,不能可靠地测量
第二,ALE或使用自适应梳状滤波器的方案在有声语音上显示出了优秀的性能。然而,这些方案或方法仅仅适用于有声信号。在将ALE或使用自适应梳状滤波器的方案应用于无声信号的情况下,因为有声/无声(V/UV)判断的微小偏移,性能会下降。
第三,在特定语音的情况下,有声特征出现在低频,或无声特征出现在高频,由此ALE的性能下降。
发明内容
本发明针对语音质量的增强。
以下描述将给出本发明的其它特征和优点,部分可从该描述中显而易见的,或可以通过对本发明的实践来获知。本发明的目的和其它优点可通过书面描述及其权利要求书以及附图中特别指出的结构来实现和获取。
为了得到这些和其他优点并根据本发明的目的,如所实施和广泛描述的,本发明被实施为一种用于增强语音质量的方法,该方法包括将输入语音划分成有声语音和无声语音,在有声语音上执行自适应滤波以去除有声语音的噪声,并在无声语音上执行频谱相减。
较佳地,本方法还包括在有声语音上使用自适应滤波执行自适应线性增强器处理来去移有声语音的噪声。通过自适应线性增强器处理从对应于先前的有声语音的指定帧所估算出的噪声频谱的平均值用于频谱相减。自适应滤波使用从对应于有声语音的帧中提取的基音周期。
在本发明一个方面,该方法还包括在输入语音上执行低通滤波和高通滤波的至少一个,并在高通滤波的输出上执行自适应梳状滤波,以去除输出的噪声。较佳地,当高通滤波的输出对应于有声语音时,执行自适应梳状滤波。在本发明的另一方面,低通滤波的输出被划分成有声语音和无声语音。
较佳地,从有声语音段获取的的噪声频谱数据用于频谱相减。此外,噪声频谱数据是通过对噪声频谱求平均值所得的值,该噪声频谱是由通过自适应滤波从对应于先前的有声语音的指定帧所估算的。
根据本发明另一实施例,一种用于增强语音质量的装置包括一用于将输入语音划分成有声语音和无声语音的判别块、一用于在有声语音上执行自适应线性增强器处理以去除有声语音的噪声的自适应线性增强器(ALE)块、以及一用于在无声语音上执行频谱相减的频谱相减(SS)块。
较佳地,该装置还包括一用于在输入语音上执行低通滤波以输出到判别块的低通滤波器,以及一用于在输入语音上执行高通滤波的高通滤波器。
在本发明的一个方面,该装置还包括一用于当高通滤波器的输出对应于有声语音时去除来自高通滤波器的输出的噪声的自适应梳状滤波器。较佳地,该自适应梳状滤波器使用一从有声语音提取的基音周期。
在本发明的另一方面,该装置还包括一基音提取器,用于从有声语音提取基音周期,其中,该基音提取器向ALE块提供了所提取的基音周期。
较佳地,SS块使用由ALE块估算出的噪声频谱。此外,SS块使用由ALE块从对应于先前的有声语音的指定帧估算出的噪声频谱的平均值。
根据本发明另一实施例,一种用于增强语音质量的方法包括接收输入语音;在输入语音上执行高通滤波;当高通滤波的输出对应于有声语音时,在高通滤波的输出上执行自适应梳状滤波;在输入语音上执行低通滤波;当低通滤波的输出对应于有声语音时,使用自适应梳状滤波在低通滤波的输出上执行自适应线性增强器处理;以及当低通滤波的输出对应于无声语音时,在低通滤波的输出上执行频谱相减。
可以理解的是,本发明的前述概括描述和下述详细描述是示例性和解释性的,并旨在提供对要求保护的本发明的进一步解释。
附图说明
附图被包括在内以提供对本发明的进一步理解,并结合在本说明书中且作为其一部分,该附图示出了本发明的实施例以及用于揭示本发明的原理的描述。不同附图中由相同标号引用的本发明的特征、元件和方面表示根据一个或多个实施例的相同、等价或相似的特征、元件或方面。
图1是示出了一个通用频谱相减法(SSM)的框图。
图2是示出了一个通用自适应线性增强器(ALE)的框图。
图3是根据本发明一个实施例用于增强语音质量的装置的框图。
图4是示出了根据本发明的一个实施例用于增强语音质量的方法的流程图。
具体实施方式
本发明涉及增强语音质量。
现在将详细参考本发明的较佳实施例,其示例在附图中示出。只要可能的情况下,相同的参考标号将贯穿附图来表示相同或相似的部分。
在一种根据本发明的一个实施例的增强语音质量的方法中,在有声语音上执行一指定的语音质量增强处理,而在无声语音上使用从执行指定的语音质量增强处理所获得的噪声频谱来执行频谱相减法(SSM)。
参考图3,解释了一种根据本发明的一个实施例用于增强语音质量的装置。
参考图3,一种用于增强语音质量的装置包括在输入语音y[n]上执行低通滤波的低通滤波器(LPF)51,以及在输入语音y[n]上执行高通滤波的高通滤波器(HPF)50。
该装置还包括用于处理高频分量的自适应梳状滤波器56。该装置也包括有声/无声(U/UV)判别块52、基音提取器53和处理低频分量的频谱相减块55。此外,该装置包括自适应线性增强器(ALE)块54。或者,可由用于使用不同的语音质量增强方案的装置来替换ALE块54。
HPF 50的输出被输入到自适应梳状滤波器56。LPF 51的输出根据有声或无声语音来通过使用ALE或SSM的路径。V/UV判别块52判断通过LPF 51的语音是对应于有声还是无声语音。随后根据V/UV判别块52的判别结果判断是使用ALE还是SSM。
较佳地,V/UV判别块52向使用SSM的频谱相减块55传送一个对应于语音中已经通过LPF 51的无声语音的帧。或者,一个对应于语音中已经通过LPF51的有声语音的帧可被传送给使用ALE的路径。该使用ALE的路径包括基音提取器53和ALE块54。
基音提取器53从对应于已经有声语音的帧中提取基音周期T0,并向自适应梳状滤波器56提供所提取的基音周期T0。基音提取器53也向ALE块54提供所提取的基音周期,其中ALE块54为ALE使用该基音周期T0来为对应于有声语音的帧增强语音质量。
如上文的描述中所提及的,本发明使用ALE块54作为根据本发明的一个实施例用于增强语音质量的装置。
因为其中存在基音频率的频率范围对应于50~400Hz,因此确定LPF51的截止频率要足以包括该频率范围,并允许在基音周期上含有最显著影响的一部分语音能够通过。较佳地,截止频率可被设置为大约800Hz。
在本发明一个实施例中,当应用ALE时,可通过重新组合400~4,000Hz的范围来获取含有0~4kHz带宽的语音。这对应于含有8kHz采样率的情况。为准备这种情况,本发明进一步使用自适应梳状滤波器56。
本发明的自适应梳状滤波器56去移了位于类似高频中由基音分量表示的脉冲序列的部分之间的噪声。较佳地,如果对应于有声语音的纯净信号存在于高频分量中,则自适应梳状滤波器56即运行。
同时,使用SSM的频谱相减块55使用从有声语音段获取的噪声频谱数据。较佳地,频谱相减块55使用通过对在先前的声语音的指定帧中估算出的噪声频谱求平均值所得的值。换言之,每当从有声语音获得噪声频谱时,对预定数量的帧的噪声频谱数据序列求平均值,来获得噪声频谱数据。这样,语音[n]可通过从频谱相减块55和自适应梳状滤波器56的输出中去除噪声的方式来获得。
图4是根据本发明的一个实施例增强语音质量的方法的框图。参考图4,一旦输入了指定语音y[n](S1),在输入语音y[n]上执行低通滤波(S2)和高通滤波(S3)。
其中存在基音频率的频率范围通常为50~400Hz,因此,足以包括该频率范围并在基音周期上含有最显著影响的语音部分经受低通滤波。较佳地,低通滤波的截止频率被设为大约800Hz。
随后,识别低通滤波的输出是对应于有声语音还是无声语音(S4)。如果低通滤波的输出对应于有声语音,则在对应于有声语音的帧上执行指定的语音质量增强方法。较佳地,ALE用于用于有声语音的语音质量增强方法。这样,在对应于有声语音的帧上执行ALE处理(S6)。
在ALE处理之前,理所当然的是从对应于有声语音的帧上提取基音周期(S5)。所提取的基音周期用于自适应梳状滤波(S8)和ALE处理(S6)。
然而,如果低通滤波的输出对应于无声语音,则在对应于无声语音的帧上执行频谱相减(S9)。在执行频谱相减时,使用通过对由ALE处理从先前的有声语音的指定帧估算的噪声频谱求平均值而获得的值。较佳地,使用通过每当由ALE处理从有声语音获得噪声频谱时对预定数量的帧的噪声频谱数据序列求平均值所获得的值。相应的值是从有声语音中获得的噪声频谱数据。
在输入语音y[n]上执行高通滤波所得的输出上执行自适应梳状滤波,以去除输出的噪声(S8)。这样,从来自低通滤波(S5)的输出的有声语音中提取的基音周期用于执行自适应梳状滤波。然而,在自适应梳状滤波之前,判断来自高通滤波的输出是否对应于有声语音(S7)。如果存在对应于有声语音的纯净信号,则执行自适应梳状滤波。
在本发明中,当在含有强基音特征的低通分量上执行ALE之后,自适应梳状滤波器进一步在高频分量对应于有声语音时使用。这样,如果低频和高频分别含有有声和无声特征,则本发明提供了有效的性能。
因为基于基音特征(也是语音的一般特征)增强了语音的质量,因此本发明相比其他语音质量方法(如,维纳(Wiener)滤波、频谱相减法),对多路干扰噪声及其类似物更有抵抗力。因此,本发明可用于使用移动终端的单个麦克风的噪声去除以及用于使用便携式录音机录制语音时的噪声去除。本发明还可用于通用有线/无线电话或在PDA或其类似物中录制语音时的噪声去除。
前述实施例和优点仅仅是示例性的,且不能被解释为对本发明的限制。本教导可容易地应用于于其他类型的装置。本发明的描述旨在为说明性的,并不限制权利要求书的范围。本领域的技术人员很容易得出多种替换、修改以及变形。在权利要求书中,装置加功能条项旨在覆盖在此描述的执行所述功能的结构,不仅覆盖结构上的等价物,还覆盖了等价的结构。
Claims (14)
1.一种增强语音质量的方法,其特征在于,包括:
将输入语音划分成一有声语音和一无声语音;
对所述有声语音执行自适应滤波以去除所述有声语音的噪声;以及
对所述无声语音执行频谱相减,
对所述输入语音执行低通滤波和高通滤波中的至少一个;
对所述高通滤波的输出执行自适应梳状滤波来去除所述输出的噪声;
其中当所述高通滤波的输出对应于所述有声语音时,执行所述自适应梳状滤波。
2.如权利要求1所述的方法,其特征在于,还包括对所述有声语音使用所述自适应滤波执行一自适应线性增强器处理,来去除所述有声语音的噪声。
3.如权利要求2所述的方法,其特征在于,通过所述自适应线性增强器处理从对应于先前的有声语音的指定帧所估算出的噪声频谱的平均值被用于所述频谱相减。
4.如权利要求1所述的方法,其特征在于,所述自适应滤波使用从对应于所述有声语音的帧中提取的基音周期。
5.如权利要求1所述的方法,其特征在于,所述低通滤波的输出被划分成有声语音和无声语音。
6.如权利要求1所述的方法,其特征在于,从所述有声语音的片段获取的噪声频谱数据用于所述频谱相减。
7.如权利要求6所述的方法,其特征在于,所述噪声频谱数据是通过对由所述自适应滤波从对应于先前的有声语音的指定帧所估算出的噪声频谱求平均值所得的值。
8.一种用于增强语音质量的装置,其特征在于,包括:
一判别块,用于将输入语音划分成一有声语音和一无声语音;
一自适应线性增强器块,用于对所述有声语音执行自适应线性增强器处理,以去除所述有声语音的噪声;以及
一频谱相减块,用于对所述无声语音执行频谱相减;
一低通滤波器,用于对所述输入语音执行低通滤波以向所述判别块输出;以及
一高通滤波器,用于对所述输入语音执行高通滤波;
一自适应梳状滤波器,用于当所述高通滤波器的输出对应于所述有声语音时去除来自所述高通滤波器的输出的噪声。
9.如权利要求8所述的装置,其特征在于,所述自适应梳状滤波器使用一从所述有声语音提取的基音周期。
10.如权利要求8所述的装置,其特征在于,还包括一基音提取器,用于从所述有声语音提取基音周期。
11.如权利要求10所述的装置,其特征在于,所述基音提取器向所述自适应线性增强器块提供所提取的基音周期。
12.如权利要求8所述的装置,其特征在于,所述频谱相减块使用由所述自适应线性增强器块估算出的噪声频谱。
13.如权利要求8所述的装置,其特征在于,所述频谱相减块使用由所述自适应线性增强器块从对应于先前的有声语音的指定帧中估算出的噪声频谱的平均值。
14.一种用于增强语音质量的方法,其特征在于,包括:
接收一输入语音;
对所述输入语音执行高通滤波;
当所述高通滤波的输出对应于一有声语音时,对所述高通滤波的输出执行自适应梳状滤波;
对所述输入语音执行低通滤波;
当所述低通滤波的输出对应于所述有声语音时,对所述低通滤波的输出使用所述自适应梳状滤波执行自适应线性增强器处理;以及
当所述低通滤波的输出对应于一无声语音时,对所述低通滤波的输出执行频谱相减。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040071371 | 2004-09-07 | ||
KR1020040071371A KR100640865B1 (ko) | 2004-09-07 | 2004-09-07 | 음성 품질 향상 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1746974A CN1746974A (zh) | 2006-03-15 |
CN100520913C true CN100520913C (zh) | 2009-07-29 |
Family
ID=36126658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100995665A Expired - Fee Related CN100520913C (zh) | 2004-09-07 | 2005-09-07 | 增强语音质量的方法及其装置 |
Country Status (9)
Country | Link |
---|---|
US (1) | US7590524B2 (zh) |
EP (1) | EP1632935B1 (zh) |
JP (1) | JP4350690B2 (zh) |
KR (1) | KR100640865B1 (zh) |
CN (1) | CN100520913C (zh) |
AT (1) | ATE385027T1 (zh) |
BR (1) | BRPI0503959A (zh) |
DE (1) | DE602005004464T2 (zh) |
RU (1) | RU2391778C2 (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100667852B1 (ko) * | 2006-01-13 | 2007-01-11 | 삼성전자주식회사 | 휴대용 레코더 기기의 잡음 제거 장치 및 그 방법 |
US7844453B2 (en) * | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US8335685B2 (en) * | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US9966085B2 (en) * | 2006-12-30 | 2018-05-08 | Google Technology Holdings LLC | Method and noise suppression circuit incorporating a plurality of noise suppression techniques |
JP5293817B2 (ja) * | 2009-06-19 | 2013-09-18 | 富士通株式会社 | 音声信号処理装置及び音声信号処理方法 |
JP5672437B2 (ja) * | 2010-09-14 | 2015-02-18 | カシオ計算機株式会社 | 雑音抑制装置、雑音抑制方法およびプログラム |
RU2477533C2 (ru) * | 2011-04-26 | 2013-03-10 | Юрий Анатольевич Кропотов | Способ многоканального адаптивного подавления акустических шумов и сосредоточенных помех и устройство для его осуществления |
JP5898515B2 (ja) * | 2012-02-15 | 2016-04-06 | ルネサスエレクトロニクス株式会社 | 半導体装置及び音声通信装置 |
KR20150032390A (ko) | 2013-09-16 | 2015-03-26 | 삼성전자주식회사 | 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법 |
RU2580796C1 (ru) * | 2015-03-02 | 2016-04-10 | Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) | Способ (варианты) фильтрации зашумленного речевого сигнала в условиях сложной помеховой обстановки |
CN104810023B (zh) * | 2015-05-25 | 2018-06-19 | 河北工业大学 | 一种用于语音信号增强的谱减法 |
EP3416167B1 (en) | 2017-06-16 | 2020-05-13 | Nxp B.V. | Signal processor for single-channel periodic noise reduction |
CN112927715A (zh) * | 2021-02-26 | 2021-06-08 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频处理方法、设备及计算机可读存储介质 |
CN112700787B (zh) * | 2021-03-24 | 2021-06-25 | 深圳市中科蓝讯科技股份有限公司 | 一种降噪方法、非易失性可读存储介质及电子设备 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4238746A (en) * | 1978-03-20 | 1980-12-09 | The United States Of America As Represented By The Secretary Of The Navy | Adaptive line enhancer |
FR2697101B1 (fr) * | 1992-10-21 | 1994-11-25 | Sextant Avionique | Procédé de détection de la parole. |
WO1994018666A1 (en) * | 1993-02-12 | 1994-08-18 | British Telecommunications Public Limited Company | Noise reduction |
JPH07239696A (ja) | 1994-02-28 | 1995-09-12 | Hitachi Ltd | 音声認識装置 |
JPH07283860A (ja) | 1994-04-06 | 1995-10-27 | Toshiba Corp | ノイズ除去装置 |
WO1997010586A1 (en) | 1995-09-14 | 1997-03-20 | Ericsson Inc. | System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions |
JP3297307B2 (ja) | 1996-06-14 | 2002-07-02 | 沖電気工業株式会社 | 背景雑音消去装置 |
JP3264831B2 (ja) | 1996-06-14 | 2002-03-11 | 沖電気工業株式会社 | 背景雑音消去装置 |
US5742694A (en) * | 1996-07-12 | 1998-04-21 | Eatwell; Graham P. | Noise reduction filter |
JP4040126B2 (ja) * | 1996-09-20 | 2008-01-30 | ソニー株式会社 | 音声復号化方法および装置 |
JPH11338499A (ja) | 1998-05-28 | 1999-12-10 | Kokusai Electric Co Ltd | ノイズキャンセラ |
AU2001241475A1 (en) | 2000-02-11 | 2001-08-20 | Comsat Corporation | Background noise reduction in sinusoidal based speech coding systems |
JP2002175099A (ja) | 2000-12-06 | 2002-06-21 | Hioki Ee Corp | 雑音抑制方法および雑音抑制装置 |
DE10118653C2 (de) * | 2001-04-14 | 2003-03-27 | Daimler Chrysler Ag | Verfahren zur Geräuschreduktion |
US7092877B2 (en) * | 2001-07-31 | 2006-08-15 | Turk & Turk Electric Gmbh | Method for suppressing noise as well as a method for recognizing voice signals |
JP2003131401A (ja) * | 2001-10-26 | 2003-05-09 | Adtec Engineeng Co Ltd | 多層回路基板製造におけるマーキング装置 |
-
2004
- 2004-09-07 KR KR1020040071371A patent/KR100640865B1/ko not_active IP Right Cessation
-
2005
- 2005-09-06 JP JP2005258585A patent/JP4350690B2/ja not_active Expired - Fee Related
- 2005-09-06 AT AT05019349T patent/ATE385027T1/de not_active IP Right Cessation
- 2005-09-06 EP EP05019349A patent/EP1632935B1/en not_active Not-in-force
- 2005-09-06 US US11/221,106 patent/US7590524B2/en not_active Expired - Fee Related
- 2005-09-06 DE DE602005004464T patent/DE602005004464T2/de active Active
- 2005-09-07 CN CNB2005100995665A patent/CN100520913C/zh not_active Expired - Fee Related
- 2005-09-07 RU RU2005127995/09A patent/RU2391778C2/ru not_active IP Right Cessation
- 2005-09-08 BR BRPI0503959-2A patent/BRPI0503959A/pt not_active IP Right Cessation
Non-Patent Citations (2)
Title |
---|
Speech enhancement based on the generalized dualexcitation model with adaptive analysis window. YOO C D ET AL.Acoustics,speech ,and signal processing,1995.,Vol.1 . 1995 |
Speech enhancement based on the generalized dualexcitation model with adaptive analysis window. YOO C D ET AL.Acoustics,speech ,and signal processing,1995.,Vol.1 . 1995 * |
Also Published As
Publication number | Publication date |
---|---|
BRPI0503959A (pt) | 2007-05-22 |
EP1632935A1 (en) | 2006-03-08 |
CN1746974A (zh) | 2006-03-15 |
KR20060022525A (ko) | 2006-03-10 |
ATE385027T1 (de) | 2008-02-15 |
RU2005127995A (ru) | 2007-03-20 |
RU2391778C2 (ru) | 2010-06-10 |
US20060074640A1 (en) | 2006-04-06 |
US7590524B2 (en) | 2009-09-15 |
JP4350690B2 (ja) | 2009-10-21 |
DE602005004464T2 (de) | 2009-02-19 |
KR100640865B1 (ko) | 2006-11-02 |
JP2006079085A (ja) | 2006-03-23 |
EP1632935B1 (en) | 2008-01-23 |
DE602005004464D1 (de) | 2008-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100520913C (zh) | 增强语音质量的方法及其装置 | |
EP1744305B1 (en) | Method and apparatus for noise reduction in sound signals | |
US7313518B2 (en) | Noise reduction method and device using two pass filtering | |
EP1638084B1 (en) | Method and apparatus for multi-sensory speech enhancement | |
JP4818335B2 (ja) | 信号帯域拡張装置 | |
EP1914727B1 (en) | Noise suppression methods and apparatuses | |
EP1891627B1 (en) | Multi-sensory speech enhancement using a clean speech prior | |
CN101354889B (zh) | 一种语音变调方法及装置 | |
JP5150165B2 (ja) | 拡張された帯域幅を有する音響信号を提供するための方法およびシステム | |
WO2006070560A1 (ja) | 雑音抑圧装置、雑音抑圧方法、雑音抑圧プログラムおよびコンピュータに読み取り可能な記録媒体 | |
CN104269178A (zh) | 对语音信号进行自适应谱减和小波包消噪处理的方法和装置 | |
CN110503967B (zh) | 一种语音增强方法、装置、介质和设备 | |
JP2000330597A (ja) | 雑音抑圧装置 | |
JP2003530605A (ja) | 音声信号におけるピッチ推定 | |
JP5782402B2 (ja) | 音声品質客観評価装置及び方法 | |
KR20110024969A (ko) | 음성신호에서 통계적 모델을 이용한 잡음 제거 장치 및 방법 | |
Yegnanarayana et al. | Analysis of instantaneous f 0 contours from two speakers mixed signal using zero frequency filtering | |
JP4166405B2 (ja) | 駆動信号分析装置 | |
Kumar et al. | Noise Reduction Algorithm for Speech Enhancement | |
JP6140685B2 (ja) | 帯域パワー算出装置及び帯域パワー算出方法 | |
JP2885984B2 (ja) | 音声分析装置 | |
CN109346106B (zh) | 一种基于子带信噪比加权的倒谱域基音周期估计方法 | |
JP3223564B2 (ja) | ピッチ抽出方法 | |
Nordstrom et al. | Influence of the LPC filter upon the perception of breathiness and vocal effort | |
CN117558286A (zh) | 语音降噪方法、装置、车辆、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090729 Termination date: 20160907 |