CN1234935A - 有关传输信道对数字语言信号的影响的盲目均衡处理过程和装置 - Google Patents
有关传输信道对数字语言信号的影响的盲目均衡处理过程和装置 Download PDFInfo
- Publication number
- CN1234935A CN1234935A CN98801030A CN98801030A CN1234935A CN 1234935 A CN1234935 A CN 1234935A CN 98801030 A CN98801030 A CN 98801030A CN 98801030 A CN98801030 A CN 98801030A CN 1234935 A CN1234935 A CN 1234935A
- Authority
- CN
- China
- Prior art keywords
- cepstrum
- signal
- vector
- balanced
- digital language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000005540 biological transmission Effects 0.000 title claims abstract description 49
- 230000000694 effects Effects 0.000 title claims abstract description 10
- 239000013598 vector Substances 0.000 claims abstract description 94
- 238000001914 filtration Methods 0.000 claims abstract description 49
- 238000001228 spectrum Methods 0.000 claims abstract description 36
- 230000007774 longterm Effects 0.000 claims abstract description 21
- 230000003044 adaptive effect Effects 0.000 claims abstract description 6
- 230000003595 spectral effect Effects 0.000 claims description 58
- 230000008569 process Effects 0.000 claims description 30
- 230000014509 gene expression Effects 0.000 claims description 27
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000013519 translation Methods 0.000 claims description 10
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 15
- 201000004569 Blindness Diseases 0.000 description 13
- 238000012546 transfer Methods 0.000 description 9
- 230000006978 adaptation Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 238000007792 addition Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000004304 visual acuity Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L25/00—Baseband systems
- H04L25/02—Details ; arrangements for supplying electrical power along data transmission lines
- H04L25/03—Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
- H04L25/03006—Arrangements for removing intersymbol interference
- H04L25/03012—Arrangements for removing intersymbol interference operating in the time domain
- H04L25/03019—Arrangements for removing intersymbol interference operating in the time domain adaptive, i.e. capable of adjustment during data reception
- H04L25/03057—Arrangements for removing intersymbol interference operating in the time domain adaptive, i.e. capable of adjustment during data reception with a recursive structure
- H04L25/0307—Arrangements for removing intersymbol interference operating in the time domain adaptive, i.e. capable of adjustment during data reception with a recursive structure using blind adaptation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Power Engineering (AREA)
- Computer Networks & Wireless Communication (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Radio Relay Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及使传输信道对数字语言信号的影响进行盲目均衡的一种方法和一种装置。将语言信号({Sn(t)})变换成(1000)对数倒频谱矢量({Cn(i)})。根据代表语言信号长期频谱的参考频谱({Rn(i)})(1001),使每一对数倒频谱矢量经过自适应滤波(1002),以产生代表一均衡语言信号的均衡对数倒频谱信号(Cn(i))。本发明适用于自动语言识别。
Description
本发明涉及有关传输信道对数字语言信号的影响的盲目均衡(blindequalization)处理过程和装置。
特别的,由于自动语言识别系统、ASR系统性能的改进,而这些系统又是通过公共交换电话网或移动电话网GSM工作的,所以,正确地对语言信号进行传输是当前的一个主要目标。
获得满意的、基本上恒定的识别速率的主要问题是因为携带语言的声音信号中存在可变性。
变量的来源多种多样,一般可分成两种类型的可变性,即固有可变性和说话者非固有的可变性。事实上,作为例子,一个单字的发音因说话者状态或者在句子中这个单字的上下文的不同而不同。如果再比较几个说话者的发音,这一差异更大。事实上,单词的发音是声波,这些声波必须被采集,以便对其进行一个识别过程。在捕获声波或语言波(speech wave)时,这些波上叠加有各种类型的干扰,其结果是增加了所采集的信号的可变性。环境噪声也构成由送话器采集的声波,并且与语言波混合在一起。
送话器传输的电子信号是与语言以及环境噪声对应的信号的总和信号。
另外,特别在采用电话网的应用场合,由手机的送话器和由将用户与语言识别系统相连的电话线形成的捕获模块起随时间缓慢变化的线性卷积滤波器的作用。
由于传统的手机不是工作于免提模式,所以环境噪声的影响通常可以忽略,主要考虑传输线的卷积影响(convolutional effects)。因此,自动识别系统输入端观测的每一信号包含有对于给定呼叫几乎是恒定的,但随呼叫的不同而不同的卷积分量。
卷积分量不利于语言识别的效率。为了确定其影响,需要将该分量投影到进行识别的表示空间,在大多数识别系统中为对数倒频谱空间(cepstral space))。
举例来说,这里必须注意,参照关于对数倒频谱表示的图1a,ASR系统的上游即参数化模块,将数字化语言信号变换成矢量流(stream of vectors),该矢量流具有在10到40毫秒的固定长度且是重叠的窗口上计算的参数。原则上,重叠约为50%。选择这些参数矢量以代表在信号窗口中可能存在的最切合的信息。如图1a所示,图1a计算是对数倒频谱(cepstrum)的一般原则,一种频率变换,即快速富利叶变换(FFT)计算信号窗的频谱。然后计算频谱能量的对数。由采用该对数的反向(reverse)FFT得到对数倒频谱(Cn(i))。通常仅考虑开头的十个对数倒频谱系数。因此,假设这些系数模拟话音路径的脉冲响应(impulse response),并因此而具有供识别处理过程用的有关信息。另外,这些系数对输入信号的能量不敏感,这是自动语言识别所关心的一个主要特征。
已经采用相同类型的另外的表示,特别是用于特定的语言识别目的。这是采用“法国电信研究开发中心”在法国开发的ASR系统,PHIL90系统,该系统采用MFCC或“基于MEL频率的对数倒频谱系数”作为参数矢量。这些系数使频谱{Sn(f)}变得平滑,用以估计频谱包络和音质知识。由滤波器组实现频谱的光滑。人的听觉系统对低频的分辨力高于对其他频率的分辨力,另外,在语言信号中,信息中的低频比高频多,从而滤波器组的临界带(critical bands)按感觉(perception)的非线性比例(scale)分布,称为MEL或BARK。参照图1b,计算MFCC的方法包括:先进行信号窗的频率变换FTT,然后滤波,MEL,计算每一信号窗,由在每一频带中的能量形成矢量。由反向变换进行反向频率变换,反向FTT,产生系数MFCC。
在与这些类型的表示对应的空间内,将代表传输信道的卷积滤波器变换成包含在对数倒频谱矢量中的几乎是恒定的附加偏置(additive bias)。为了更严密地检查这些表示,可以参考下述论文:
H.HERMANSKY,N.MORGAN,A.BAYYA,P.KOHN
“Compensation for the Effect of the Communication Channel in Auditory-like
Analysis of Speech”
(RASTA-PLP),Eurospeech,pp.1367-1370,Genova 1991;
C.MOKBEL,D.JOUVET,J.MONNE“Deconvolution of Telephone Line Effects for Speech Recognition”,
Speech Communication,Vol.19,No.3,September 1996,pp.185-196.
因此而引入的偏置随呼叫的不同而不同。由于这一变换和这一表示,与给定的声音相应的对数倒频谱矢量因此由于偏置的存在而在表示空间中占据了一个扩展部分。所以,该偏置的存在具有减小与不同的声音相应的对数倒频谱矢量的鉴别量的效果,因此,需要配置更复杂的模型,以便能够对各种形式的词汇应用进行鉴别。
因此,为了使电话线对观测信号的影响为最小,例如对于一个ASR过程,由于只有一个传感器、终端,问题基本上涉及两个信号的盲目去卷积(blinddeconvolution)。然而,原始的语言信号和信道的传输功能占据了相同的频率区,因而在对数倒频谱空间中有一大部分是相同的。因此特别难于确定提升器(lifter),传统上定义为提升器,在对数倒频谱域中定义为衰减模块或滤波器(filter),以便减小或抑制信道传输功能的作用,因此获得所要求的去卷积。
一方面,在自动语言识别领域,所采用的当前技术涉及对电话信号捕获状态(condition)的识别过程的加强性(robustness),而另一方面,在信号处理领域中,所采用的当前技术涉及电话信号中干扰的减小以提高其智能。
当识别过程在本地用于免提电话、计算机、数据终端等的话音控制的时候,减小信号中的干扰的努力集中在减少附加噪声所引入的干扰上。上文中,标准技术涉及加强表示的定义,诸如频谱减小(spectral subtraction)的滤波、天线滤波、采用Markov模型状态或者甚至是将环境噪声联机加入到信号中的模型或参考(reference)模型的滤波。
在集中识别过程的情况下,也需要努力减小电话通信的影响。通常采用的技术是从对数倒频谱矢量中减去在相当宽的范围(horizon)内估计的直接分量(directcomponent)。对于分小成窗口的数字电话信号来说,范围(horizon)的意义是指整数个数的连续的窗口。减法既可以是通过估计并减小平均值而明显的进行,也可以是通过高通滤波而不明显地进行。近来的工作证明在充分宽的范围(horizon)内的对数倒频谱矢量的平均值正确地(exactly)代表电话线的影响。参见前述C.MOKBEL、J.MONNE和D.JOUVET的论文。
在通常的信号去卷积情况下,有两种主要类型的去卷积过程。
第一种类型称为盲目去卷积(blind deconvolution)是基于信号的频谱特性、对数倒频谱特性或瞬态特性以定义去卷积方式(pattern)。在电信领域中,自适应均衡算法类似于盲目去卷积。关于这种类型算规的详细描述,可以参见A.BENVENISTE和M.GOURSAT的论文:“Blind Equalizer”(IEEE Transactionson Communication,Vol.COM-32,No.8,August 1984,pp.871-883,1984)。
第二种类型与回波消除算法或消混响算法使用的过程类似,它采用自适应滤波,或者在声学天线的情况下采用空间滤波。通常在这种情况下,有几种传感器,并且至少两种,一种传感器用于参考信号,而另一种用于输入信号。对于这种类型的自适应滤波的更详细的描述,可以参见B.WIDROW等人的论文:“AdaptiveNoise Cancelling:Principles and Applications”(Proc.of IEEE,vol.63,No.12,pp.1692-1716,December 1975)。
在更特定的数字信号传输的情况下,由于实际上采用传统的滤波方式难于得到能消除传输信道影响的清晰(clean)的参考信号,均衡过程造成的问题是与其同一类型的。事实上,唯一可得到的信号是经观测的、已经传输的数字信号。为了简化均衡过程,可以将熟知的接收机数字序列传输到接收机,以便识别信道的传输功能。然而,这种工作方式很快使信道的传输能力饱和。
为了克服这一缺点,人们已经进行了各种研究,以便建立起盲目均衡过程。盲目均衡过程对传输的数字信号采用已知判定逻辑和长期统计,通过随机梯度的下降计算用于更新滤波器系数的误差。这种过程的一般方式见图1c。对于这种类型过程的更详细的描述,可参见J.J.SHYNK的论文:“Frequency-Domain andMultirate Adaptive Filtering”(IEEE Signal Processing Magazine,pp.15-37,January1992)。
另外,申请日为1994年7月13日以France Telecom(法国电信)名义申请的法国专利9408641号涉及了一种由数字电话信号的盲目均衡进行自适应滤波的过程和系统。
在上述过程和系统中,数字信号须经频率变换,FFT,和子带滤波。根据电话信号的长期统计为基础的参考信号,每一子带信号须经自适应滤波。从而通过数字电话信号上电话线影响的盲目去卷积,实现了均衡。
这种工作方式是令人满意的,这种工作方式基本上是基于频率域中,因而也是频谱域中的一种盲目均衡过程,且是由通过电话线的信号的长期统计特性证实的盲目均衡过程。
然而,本发明的目的是通过将自适应滤波直接应用于对数倒频谱域配置(deploy)一个盲目均衡过程。
由于直接应用于对数倒频谱域本发明的另一个目的是,还可以减小计算的总成本。
本发明的另一个目的是还可以来减小所使用的滤波器的输出数。
由于直接应用于对数倒频谱域本发明的另一个的目的是处理过程较好地适应于语言识别,特别是PHIL90系统。
最后,本发明的另一个目的是实现这样一种处理过程,这种处理过程在某些特定场合中与现有技术中在频谱域中采用盲目均衡获得的识别速率相比,识别速率有所提高。
根据本发明的目的的过程和装置其价值在于将语言信号sn(t)变换成对数倒频谱矢量。根据代表语言信号的长期对数倒频谱的参考对数到频谱,使每一对数倒频谱矢量经过自适应滤波,以产生代表均衡语言信号的均衡对数倒频谱矢量。
在阅读了下面的说明并参考除有关现有技术的图1a到1c以后,读者将能更好地理解有关传输信道对数字信号的影响的盲目均衡的过程和装置以及本发明的目的。
图2a是过程方框图形式的总流程图,该过程是本发明的目的;
图2b是以方框图的形式表示的实现图2a所示本发明的目的的过程的详细方框图;
图3a是以功能图的方式示出根据本发明的一个装置,是传输信道对数字语言信号的影响的均衡装置。
图3b和3c示出如图3a所描述的装置,是本发明的较佳实施例。
下面参照图2a和图2b详细描述根据本发明目的的传输信道对数字语言信号的影响的盲目均衡过程。
在上面提到的图2a中,数字语言信号表示为{Sn(t)},该信号通过根据本发明的处理过程实现盲目均衡的传输信道。
通常,将数字语言信号细分为可能会重叠的连续块,n表示当前块的级别,推广来说,实现本发明的过程而得到的任何数据组或帧的级别都是以当前块为基础的。
按照上图,处理过程至少包含使数字语言信号{Sn(t)}变换成一组对数倒频谱矢量,这是一个与表示为{Cn(i)}即级别为n的光栅相关的矢量,Cn(i)表示每一对数倒频谱矢量的级别为i的分量或对数倒频谱系数,在上述图中这一变换是在表示为1000的级(stage)中进行的。这组对数倒频谱矢量代表在给定的范围(horizon)内的数字语言信号{sn(t)},该范围(horizon)的概念是按照先前在说明书中给出的定义来定义的。
在上述级1000后面就可得到对数倒频谱矢量{Cn(i)},在级1000后面跟随着表示为1001的级,级1001包含计算表示为{Rn(i)}的参考对数倒频谱,对于对数倒频谱矢量组中的每一对数倒频谱矢量{Cn(i)}来说这一对数倒频谱表示该语言信号的长期对数倒频谱。
事实上,上面已经参照本说明书前面提到的C.MOKBEL、D.JOUVET和J.MONNE的论文建立起在所有频率范围内语言信号的长期对数倒频谱几乎是恒定的,对数倒频谱域中频率的概念与频谱域中频率的概念是类似的。另外,同样参照上述论文,在充分宽的范围(horizon)内频谱密度的对数的平均值,因此也是对数倒频谱系数的平均值,代表在观测的信号中的恒定的卷积分量,这能有效地等效于传输信道的影响。
因此,上述级1001的后面跟随着级1002,这一级包含根据参考对数倒频谱{Rn(i)}使每一对数倒频谱矢量{Cn(i)}经过自适应滤波,以产生一组表示成
的均衡对数倒频谱矢量,其中传输信道的影响大体上被抑制。这一组均衡对数倒频谱矢量代表一个均衡的数字语言信号。
因此,根据本发明目的的处理过程,在级1002中进行的自适应滤波是以由参考对数倒频谱{Rn(i)}构成的参考输入为基础而实现的,很明显,将自适应滤波安装在对数倒频谱域中,并应用于(applied to)对数倒频谱系数Cn(i)。
关于实施上面提及的自适应滤波,上文中提到,该滤波可以是LMS,最小均方(Least Mean Square),自适应滤波,这种类型的滤波已在前面提及的J.J.SCHINK的论文中描述。
然而,根据本发明目的的处理过程的特别优越方面是上述自适应滤波应用于对数倒频谱域而非应用于频谱域,如在以前的技术中。
因此,根据本发明目的的处理过程的特别优越方面:
-均衡是这样的,基于事实,信号的长期对数倒频谱表示可以近似于常数。
对于涉及信号的长期对数倒频谱表示的元素(element),特别是涉及该表示的统计以及有关采用长期对数倒频谱识别传输信道可能性(possibility)的更详细的描述,可参见本说明书前文中提到的C.MOKBEL、D.JOUVET和J.MONNED的论文。
-自适应滤波直接应用于对数倒频谱域,很明显的,如本说明书的上述叙述,该频谱域包含所考虑的数字信号的块处理。
下面将根据本发明的目的将自适应滤波进行盲目去卷积的过程给出书面的解释(written account)。
假设作为传输的数字信号{sn(t)}的观测信号s(k)是清晰信号(clean signal)的卷积,即识别电话信道的滤波器传输的语言信号x(k)与传输函数w(k)的乘积,观测信号s(k)给出关系式(1):
s(k)=x(k)*w(k)
在该关系式中,算符*表示卷积乘积的算子。
频谱域中的去卷积
-为了在对数倒频谱域中引入去卷积,首先对频谱域中的去卷积作理论性的介绍。参考上述关系式(1),在上述关系式(1)中写出两项频谱功率密度的表达项,对于语言信号的每一窗口或块,按照关系式(2):
Ss(f)=Sx(f)W2(f)
在该关系式中,Ss(f)、Sx(f)分别表示观测信号s(k)和传输的语言信号x(k)的频谱功率密度,而W(f)表示电话信道的传输函数。
注意,W(f)实际上表示识别电话信道w(k)的滤波器的富利叶(Fourier)变换。
考虑到上述关系式,具有传输函数H(f)的自适应滤波器可以直接应用于观测信号Ss(f)的频谱功率密度,以便得到均衡频谱Sn(f),在其中,已抑制了电话线或传输信道的影响。
在这些条件下,均衡频谱Sn(f)证明关系式(3):
Sn(f)=Ss(f)H(f)=Sx(f)W2(f)H(f)。
根据构成参考信号R(f)的恒定平坦频谱(constant flat spectrum),对于观测信号每一窗口的误差E(f)证明关系式(4):
E(f)=R(f)-Sx(f)W2(f)H(f)。
传输函数H(f)收敛的最佳滤波器(filter)是一个使得用MSE表示的均方差在每一已实施分解成频带、频谱分解的频带f中为最小。均方差MSE(f)证明关系式(5):
MSE(f)=E[E2(f)]
考虑到某些宽范围证明的(widely verified)假设,语言信号恒定的长期频谱和在宽范围(horizon)内电话信道W(f)恒定的传输函数,最佳滤波器是使得由关系式(6)给出的表达式为最小的一个滤波器: 在观测信号已经分细的所有频带中不管f为何值。
前述关系式(6)给出的均方差MSE(f)的最小化能够获得最佳滤波器Hopt(f)的传输函数,它证明关系式(7):
因此而获得的最佳滤波器使得电话通信的传输信道的影响得到补偿。
另外,如果考虑特定的参考信号,即是与所述信号具有相同功率的参考信号,则表达式E[R(f)Sx(f)]趋向于等于E[Sx 2(f)],所以,在这些条件下,最佳滤波器趋近于传输信道的反向。
对数倒频谱域中的去卷积
照此类推,在对数倒频谱域中,上述关系式(3)可写或关系式(8):
Cn(i)=Cs(i)+CH(i)=Cx(i)+Cw(i)+CH(i)
在该关系式中,Cn(i)、Cs(i)、Cx(i)、Cw(i)和CH(i)分别代表均衡对数倒频谱、观测信号的对数倒频谱、在通过电话线或传输信道传输前的实际语言信号的对数倒频谱,线路影响的对数倒频谱表示和均衡滤波器影响的对数倒频谱表示。
考虑到恒定(constant)对数倒频谱R(i)用作参考这一事实,观测信号每一窗口的误差E(i)证明了关系式(9):
E(i)=R(i)-(Cx(i)+Cw(i)+CH(i))
滤波器的传输函数H(i)所收敛的最佳滤波器是使每一频率中的均方差MSE(i)按照关系式(10)来最小化的那一个滤波器:
MSE(i)=E[E2(i)]
类似于频率域中考虑的某些假设,这些假设是在频率(quefrential)域中表述的,即,语言恒定(speech constant)的长期对数倒频谱、宽范围(horizon)内传输线路恒定(constant)的影响的对数倒频谱表示,最佳滤波器是使均方差为最小并且证明下述关系式(11)的那一个滤波器:
所以,应用于对数倒频谱域中的最佳滤波使得传输信道的影响得到补偿。
将按照本发明目的的处理过程的相应的盲目均衡过程的方法与高通滤波或对数倒频谱减少(ceptral subtraction)的传统方法相比,事实上证明,从识别性能的观点来看,正如本说明书后文中将详细描述的那样,这种工作方式大体上等效于现有技术的特性,并且在某些数据库中明显超过它们。
关于在级1000中将观测的数字信号{sn(t)}变换成一组对数倒频谱矢量,下面参照图2b详细描述实际的变换过程。
在上面提到的图中,变换级1000顺序在级1000a中使数字语言信号{sn(t)}经过频率变换,在所考虑的范围(horizon)内传输数字语言信号{sn(t)}的频谱{Sn(f)}。事实上要记住的是,将观测的数字信号{sn(t)}细分成连续的取样块,从而可以在块中进行处理。所使用的频率变换例如可以由快速富利叶(Fourier)变换组成。
级1000a后面跟着级1000b,包括将通过级1000a中使用的频率变换方式获得的频谱{Sn(f)}分解成频率子带,以产生用{Vn(j)}表示的频率子带中的多个信号。这里,指数j表示所考虑的每一频率子带的级别。实际上,级1000b中进行的分解成频率子带可以通过合适的频率滤波器组来执行,例如,可以将信号{sn(f)}的频谱细分成24个相邻的频带。
上述级1000b后跟随了级1000c,它包括频率子带中的每一信号,即每一信号Vn(j),经过对数衰减,以在频率子带中产生用{LVn(j)}表示的多个经衰减的信号。
在频率子带{LVn(j)}中的经衰减的信号组然后经过反向频率变换,产生用{Cn(i)}表示的对数倒频谱矢量。例如,当以直接快速富利叶变换的形式在级1000a中进行频率变换时,通过反向快速富利叶变换产生反向频率变换。
关于参考对数倒频谱{Rn(i)}的计算,上文中提到,最好对每一个对数倒频谱矢量{Cn(i)}由恒定值的对数倒频谱信号组成。在数字语言信号和对数倒频谱矢量组中,该恒定对数倒频谱信号代表语言信号的长期对数倒频谱。通常,正如将在后文中描述的那样,可以从一个数据库获得参考对数倒频谱。
现在参照图3a、3b和3c,更详细地描述实现本发明目的处理过程的一种装置,该装置将传输信道对数字语言信号的影响进行盲目均衡。
如图3a所示,对于通过电话通信机构传输的数字语言信号{sn(t)},根据本发明目的的装置包含至少一个将数字语言信号{sn(t)}变换成在给定的范围内特别是观测数字语言信号级别为n的窗口,代表数字语言信号的一组对数倒频谱矢量{Cn(i)}的模块1。上述模块1后面是模块2,该模块对每一个对数倒频谱矢量{Cn(i)}产生一个代表语言信号的长期对数倒频谱的参考对数倒频谱。参考对数倒频谱使得代表语言信号的长期对数倒频谱的一个参考对数倒频谱{Rn(i)}与对每一个这些矢量每一个对数倒频谱矢量{Cn(i)}相关。所处的条件将在后文中说明。所以,读者将会理解,参考对数倒频谱的值可以便利地用一个时间常数来近似。然而,对数倒频谱矢量的组别为i的每一分量Cn(i),这一值的分布Rn(i)在所考虑的情况下,可以作为级别i的函数而有所不同。然而,尤其是在一个非限定的实施例中,参考对数倒频谱{Rn(i)}具有一个对每一分量都相同的常数值,该分量构成每一对数倒频谱矢量{Cn(i)},相应于级别i的对数倒频谱系数Cn(i)。
在每一个对数倒频谱矢量{Cn(i)}的参考对数到频谱的基础上,建议一种自适应滤波模块3,该模块3可以产生均衡对数倒频谱矢量,其中,电话通信的影响基本上受到抑制。
尤其要指出,读者将会理解,根据对每一对数倒频谱矢量代表语言信号的长期对数倒频谱的参考对数倒频谱,自适应滤波模块3使得例如LMS型的滤波得以进行,根据参考对数倒频谱{Rn(i)}和均衡对数倒频谱矢量组之间的误差的计算使之产生均衡对数倒频谱矢量
。均衡对数倒频谱矢量组代表均衡数字语言信号。
如图3a所示,将数字语言信号变换成一组对数倒频谱矢量的模块1至少包含接收观测语言信号{sn(t)},在所考虑的范围内对传输用{Sn(f)}表示的数字语言信号的频谱进行频率变换的模块10、将数字语言信号的频谱分解成N个频率子带的滤波器组11,该滤波器组11在用{Vn(i)}表示的频率子带中传输N个信号。
滤波器组11后面是使频率子带中的每一信号对数衰耗的模块12,该模块在用{LVn(j)}表示的频率子带中传输多个经衰减的信号。
最后,模块1还包含供反向频率变换的模块13,接收频率子带{LVn(j)}中的衰减信号根据频率子带中的衰减信号使一组对数倒频谱矢量{Cn(i)}得以产生。
关于产生参考对数倒频谱的模块2,对于一组对数倒频谱矢量{Cn(i)},其中,i∈[1,M],对于每一对数倒频谱矢量,参考对数倒频谱{Rn(i)}代表语言信号的长期对数倒频谱。所以,读者将会理解,可以组织构成参考对数倒频谱发生器2的数据库,以便传输代表语言信号的长期对数倒频谱的参考对数倒频谱,作为表示对数倒频谱矢量{Cn(i)}的分量的指数I的函数。
另外,如图3a所示,自适应滤波模块3包含至少一个模块30用以计算每一相应均衡对数倒频谱矢量
和相应参考对数倒频谱{Rn(i)}之间的误差信号。在参考对数倒频谱i级的每一分量和均衡对数倒频谱矢量的每一分量之间的计算误差信号
。还配置有使每一对数倒频谱矢量{Cn(i)}均衡的模块31,在后文中参照图3b和3c所说明的条件下,这一均衡模块使得可以根据每一分量Cn(i)和该误差信号,产生相应的均衡对数倒频谱矢量
。事实上,该误差信号是可以加权和自适应(adapted)的。
图3b示出的是在根据本发明的一个特定实施例中的装置,该装置起源于上文提及的PHIL90自动语言识别系统。
很明显,相同的标号指的是相同的元件,但是如此地组成图3a中的模块1,用以计算说明书中先前说明的MFCC,并因此传输观测数字语言信号每一连续窗口的分量Cn(l),Cn(i)到Cn(M)的相应的对数倒频谱矢量{Cn(i)}。图3b中的模块2和模块3代表与图3a中的模块2和3类似的模块。然而,对均衡对数倒频谱矢量的每一分量
,以3i说明和表示计算参考对数频谱{Rn(i)}和每一均衡对数倒频谱矢量
之间的误差的模块,对于对数倒频谱矢量{Cn(i)}的每一分量Cn(i),每一模块3i是相同的,每一模块3i是相同的,并确保该分量具有相同的误差计算函数和均衡,从而传输相应于均衡对数倒频谱矢量
的一个分量。
如图3c所示,每一模块3i有利地包含一个减法器电路30i,该电路一方面在其正端接收相应于参考对数倒频谱{Rn(i)}的分量Rn(i),另一方面,在其负端接收均衡对数倒频谱系数
,使按照误差信号E(i)的误差计算得以进行。
另外,如图3c所示,每一模块3i,尤其是使每一对数倒频谱系数Cn(i)均衡的模块有利地包含一个乘以系数μ的电路300i,该乘法器电路接收由减法器电路30i传输的误差信号E(i),并传输一个加权的误差信号E*(i)。乘法器电路300i后面是一个具有两个输入端和一个输出端的加法器电路301i,第一加法器电路301i的第一输入端接收经加权的误差信号E*(i),而该加法器电路的第二输入端接收通过慢升(slow-rise)电路302i传输的信号。该慢升电路302i实际上引入了一个与数字信号的取样块的持续时间相等的延迟。慢升电路302i的输出传输一个自适应(adaptation)信号Hn(i),该信号传输到均衡加法器电路31i。因此,由乘法器电路300i、加法器电路301i和慢升电路302i构成的自适应电路(adaptation circuit),因而使得误差信号E(i)得以自适应或加权,以便传输自适应信号Hn(i)。进行自适应电路实现的误差信号的自适应以后,均衡加法器电路31i传输相应的均衡对数倒频谱系数
。正如将从图3b看到的那样,同样应用于所考虑的实施例1和M之间包含的级i的对数倒频谱矢量的所有分量上。
如图3b和3c所示,已经实现了根据本发明的装置的加工,并且比较试验已经使得所建议的盲目均衡技术可以在各种特定的数据库进行测试。
通过输入10个对数倒频谱系数的文件、采用自适应滤波并存储在滤波器的输出端得到的MFCC矢量来进行试验。MFCC文件是直接由PHIL90系统使用的。
下面的表格给出所获得的改进,这些改进是相对于传统技术、给定的基础系统(base system)、前文中例举的C.MOKBEL、J.MONNE和D.JOUVET定义(define)的对数倒频谱减小(sybtraction)过程、按照说明书前文中提到的法国专利9408741号中描述的过程和系统,在频谱域中进行自适应滤波以及,最后,根据按照本发明的目的的处理过程和装置,在对数倒频谱域中的自适应滤波。
这些技术应用于由数字(Digits)、Two-digit numbers(二位数字)、Tregor和Baladins在上述表格中顺序指定的四个不同的数据库。
开头的三个数据库是所谓的实验室数据库,其记录发源于预先警告的(forwarned)、合作扬声器(co-operative speaker)。
最后的数据库Baladins是所谓的操作数据库,是通过记录呼叫操作中的服务器得到的。记录操作数据库的条件与实际的操作条件更接近。所以,这些数据库的识别结果更接近于操作中得到的性能。表格最后一栏中示出的改进提高(improvement)为差错率的减小,是相对于PHIL90系统的参考形式(referenceversion)给出的。基础系统(base system)的差错率一栏中括弧内给出的范围代表95%的置信区间(confidence interval)。
关于对数倒频谱减小(subtraction)过程,这一过程至少对于数字和二位数字数据库是显得有效的。然而,该过程的实施是难于在实时联机(on line)实施的,因为其实施是基于寂静时或者在宽的语言范围内对数倒频谱矢量平均值的估算的。
数字 | 差错率 | 差错率的减小 |
基础系统 | 0.63%[0.44-0.90] | |
对数倒频谱减小 | 0.40% | 36.7% |
自适应滤波(频谱域) | 0.52% | 16.7% |
自适应滤波(对数倒频谱域) | 0.46% | 26.7% |
二位数字 | 差错率 | 差错率的减小 |
基础系统 | 3.2%[2.82-3.63] | |
对数倒频谱减小 | 2.5% | 21.1% |
自适应滤波(频谱域) | 2.6% | 18.5% |
自适应滤波(对数倒频谱域) | 2.5% | 21.1% |
Tregor | 差错率 | 差错率的减小 |
基础系统 | 0.40%[0.30-0.53] | |
对数倒频谱减小 | 0.34% | 13.7% |
自适应滤波(频谱域) | 0.33% | 17.6% |
自适应滤波(对数倒频谱域) | 0.26% | 35.3% |
Baladins | 差错率 | 差错率的减小 |
基础系统 | 3.8%[2.44-3.68] | |
对数倒频谱减小 | 3.2% | 12.7% |
自适应滤波(频谱域) | 3% | 19.1% |
自适应滤波(对数倒频谱域) | 2.7% | 29.1% |
很明显,根据本发明目的的装置的实际结构,可以采用本说明书前文中提到的已经用于PHIL90系统中的结构。
按照本发明应用于对数倒频谱系数空间的均衡装置在计算时间上是很经济的。事实上,对于每一个参数矢量,每16毫秒需要M次相乘和3N次相加,其中,M明显地表示对数倒频谱系数的个数。所以,每一滤波器输出,所需的操作次数等于一次相乘和3次相加。与确定参数矢量所包含的大量的计算量相比,本质上可以忽略这个计算的费用。
考虑到这些发现,要指出所用的滤波器的计算费用较低,并且安装时不会产生在实时计算的问题。
关于法国专利9408741号所建议的办法,由于每一滤波器输出只有一次相乘和三次相加而不是如前面的办法,尽管是在对数倒频谱域中的滤波器也有三次相乘和两次相加,另外比在频谱域中包含较少的输出,所以,计算量(calculatingvolume)的费用(cost)减小。另外,由于对数倒频谱系数的动态特性低于频谱系数和相应矢量的动态特性,所以在计算中分配到前述所需变量的位(bit)数的精度的是比较不重要的。所得到的结果是相同的或略高些;特别是相应于上述专利申请9408741号中描述的技术中在上述表格所提及的数据库的情况下。
Claims (9)
1.对通过传输信道的数字语言信号({sn(t)})的传输信道影响实施盲目均衡的过程,其特征在于,所述过程至少包含:
-将所述数字语言信号变换成一组对数倒频谱矢量,所述对数倒频谱矢量组代表在给定的范围内的所述数字语言信号;
-对语言信号的长期对数倒频谱的所述对数倒频谱矢量组的每一个对数倒频谱矢量;计算参考对数倒频谱({Rn(i)})表示;
-根据所述参考对数倒频谱,使每一对数倒频谱矢量经过自适应滤波,以便产生一组均衡的对数倒频谱矢量
,其中,传输信道的影响大体上被抑制,所述均衡对数倒频谱矢量组代表一个均衡的数字语言信号。
2.如权利要求1所述的过程,其特征在于,所述变换依次包含:-使所述数字语言信号({sn(t)})经过一个在所考虑的范围(horizon)内传输所述数字语言信号({sn(t)})的频谱({Sn(f)})的频率变换;
将所述频谱({Sn(f)})分解成频率子带,从而在频率子带({Vn(j)})中产生多个信号;
使频率子带中的每一个信号经过对数衰减,从而在频率子带({LVn(j)})中产生多个经衰减的信号;
-使频率子带中经衰减的信号组经过反向频率变换,以产生所述对数倒频谱矢量组({Cn(i)})。
3.如权利要求1或2所述的过程,其特征在于,所述参考对数倒频谱({Rn(i)})由在数字语言信号内和在对数倒频谱矢量组中代表语言信号的长期对数倒频谱的每一个对数倒频谱矢量的恒定的对数倒频谱信号组成。
4.如权利要求3所述的过程,其特征在于,所述参考对数倒频谱(({R(i)})具有一个恒定值,该恒定值对于构成每一对数倒频谱矢量({Cn(i)})的相应i级的每一分量或对数倒频谱系数(Cn(i))是相同的。
5.如权利要求1到4中任何一个权利要求所述的过程,其特征在于,所述自适应滤波包含,根据代表该语言信号的长期对数倒频谱的所述参考对数倒频谱({Rn(i)}),对于每一个对数倒频谱矢量,执行LMS类型的滤波,所述LMS类型滤波使得能够根据所述参考对数倒频谱({Rn(i)})和所述均衡对数倒频谱矢量组之间的误差的计算,产生所述均衡对数倒频谱矢量。
6.对通过传输信道的数字语言信号({sn(t)})的传输信道影响实施盲目均衡的装置,其特征在于,所述装置至少包含:
-将所述数字语言信号变换成一组对数倒频谱矢量的手段,所述对数倒频谱矢量组代表在给定的范围内的所述数字语言信号;
-对于所述对数倒频谱矢量组中的每一个对数倒频谱矢量,产生代表该语言信号的长期对数倒频谱的参考对数倒频谱的手段;
-根据所述参考对数倒频谱,使每一对数倒频谱矢量经过自适应滤波,以便产生均衡对数倒频谱矢量的手段,其中,所述传输信道的影响大体上被抑制,所述均衡对数倒频谱矢量组代表一个均衡数字语言信号。
7.如权利要求6所述的装置,其特征在于,将所述数字语言信号变换成一组对数倒频谱矢量的所述手段至少包含:
-在所考虑的范围(horizon)内对传输所述数字语言信号({sn(t)})的所述数字语言信号进行频率变换的手段;
将频率子带({Vn(i)})中传输N个信号的所述数字语言信号的所述频谱分解成N个频率子带的滤波器组;
使传输频率子带({LVn(i)})中多个经衰减的信号在频率子带中的每一信号经过对数衰减的手段;
-进行反向频率变换,从而使得根据在频率子带({LVn(i)})中的所述经衰减的信号产生所述对数倒频谱矢量({Cn(i)})组的手段。
9.如权利要求8所述的装置,其特征在于,对于所述对数倒频谱矢量的每一分量(Cn(i)),计算误差信号(E(i))的所述手段和使所述对数倒频谱矢量({Cn(i)})均衡的所述手段包含:
-减法器电路,用来接收参考对数倒频谱({Rn(i)})的所述分量(Rn(i))和所述均衡对数倒频谱矢量
的所述分量
,并传输所述误差信号(E(i));
-对该误差信号E(i))进行自适应的手段包含:
·乘以系数μ传输加权的误差信号(E*(I))的电路;
·加法器电路,它具有两个输入端和一个输出端,第一输入端接收所述加权误差信号(E*(i)),而第二输入端接收通过延迟预定的时间的慢升电路由所述第一加法器电路传输的信号,所述慢升电路的输出端传输一个自适应信号(Hn(i));
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9709273A FR2766604B1 (fr) | 1997-07-22 | 1997-07-22 | Procede et dispositif d'egalisation aveugle des effets d'un canal de transmission sur un signal de parole numerique |
FR97/09273 | 1997-07-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1234935A true CN1234935A (zh) | 1999-11-10 |
CN1130057C CN1130057C (zh) | 2003-12-03 |
Family
ID=9509462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN98801030A Expired - Fee Related CN1130057C (zh) | 1997-07-22 | 1998-07-20 | 有关传输信道对数字语言信号的影响的盲目均衡过程和装置 |
Country Status (12)
Country | Link |
---|---|
US (1) | US6157909A (zh) |
EP (1) | EP0932964B1 (zh) |
JP (1) | JP2001501327A (zh) |
CN (1) | CN1130057C (zh) |
AU (1) | AU751333B2 (zh) |
BR (1) | BR9806232A (zh) |
CA (1) | CA2266654C (zh) |
DE (1) | DE69838474T2 (zh) |
ES (1) | ES2294817T3 (zh) |
FR (1) | FR2766604B1 (zh) |
HK (1) | HK1021099A1 (zh) |
WO (1) | WO1999005831A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110907933A (zh) * | 2019-11-26 | 2020-03-24 | 西安空间无线电技术研究所 | 一种基于分布式的综合孔径相关处理系统及方法 |
CN112233688A (zh) * | 2020-09-24 | 2021-01-15 | 北京声智科技有限公司 | 音频降噪方法、装置、设备及介质 |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6442221B1 (en) * | 1998-09-22 | 2002-08-27 | Zenith Electronics Corporation | Ghost eliminating equalizer |
US6292776B1 (en) * | 1999-03-12 | 2001-09-18 | Lucent Technologies Inc. | Hierarchial subband linear predictive cepstral features for HMM-based speech recognition |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US7050977B1 (en) | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US7072833B2 (en) * | 2000-06-02 | 2006-07-04 | Canon Kabushiki Kaisha | Speech processing system |
US7035790B2 (en) * | 2000-06-02 | 2006-04-25 | Canon Kabushiki Kaisha | Speech processing system |
US7010483B2 (en) * | 2000-06-02 | 2006-03-07 | Canon Kabushiki Kaisha | Speech processing system |
US20020026253A1 (en) * | 2000-06-02 | 2002-02-28 | Rajan Jebu Jacob | Speech processing apparatus |
US7532943B2 (en) * | 2001-08-21 | 2009-05-12 | Microsoft Corporation | System and methods for providing automatic classification of media entities according to sonic properties |
US7035873B2 (en) | 2001-08-20 | 2006-04-25 | Microsoft Corporation | System and methods for providing adaptive media property classification |
FR2819357B1 (fr) * | 2001-01-09 | 2016-02-12 | Thomson Csf | Procede et recepteur autodidacte pour determiner les parametres spatio-temporels d'un canal de propagation |
BRPI0101198B1 (pt) * | 2001-03-02 | 2015-09-01 | Unicamp | Processo concorrente para desconvolução autodidata de sinais digitais |
US7319954B2 (en) * | 2001-03-14 | 2008-01-15 | International Business Machines Corporation | Multi-channel codebook dependent compensation |
FR2822999B1 (fr) * | 2001-03-28 | 2003-07-04 | France Telecom | Procede et dispositif de correction centralisee du timbre de la parole sur un reseau de communications telephoniques |
US7941313B2 (en) * | 2001-05-17 | 2011-05-10 | Qualcomm Incorporated | System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system |
US7203643B2 (en) * | 2001-06-14 | 2007-04-10 | Qualcomm Incorporated | Method and apparatus for transmitting speech activity in distributed voice recognition systems |
US7035797B2 (en) * | 2001-12-14 | 2006-04-25 | Nokia Corporation | Data-driven filtering of cepstral time trajectories for robust speech recognition |
FR2848715B1 (fr) * | 2002-12-11 | 2005-02-18 | France Telecom | Procede et systeme de correction multi-references des deformations spectrales de la voix introduites par un reseau de communication |
US7027979B2 (en) * | 2003-01-14 | 2006-04-11 | Motorola, Inc. | Method and apparatus for speech reconstruction within a distributed speech recognition system |
JP2005249816A (ja) | 2004-03-01 | 2005-09-15 | Internatl Business Mach Corp <Ibm> | 信号強調装置、方法及びプログラム、並びに音声認識装置、方法及びプログラム |
EP1866909B1 (fr) * | 2005-04-07 | 2018-04-04 | Orange | Procede de synchronisation entre une operation de traitement de reconnaissance vocale et une action de declenchement du dit traitement |
US9293130B2 (en) * | 2008-05-02 | 2016-03-22 | Nuance Communications, Inc. | Method and system for robust pattern matching in continuous speech for spotting a keyword of interest using orthogonal matching pursuit |
US20090287489A1 (en) * | 2008-05-15 | 2009-11-19 | Palm, Inc. | Speech processing for plurality of users |
US10149047B2 (en) * | 2014-06-18 | 2018-12-04 | Cirrus Logic Inc. | Multi-aural MMSE analysis techniques for clarifying audio signals |
KR102443637B1 (ko) * | 2017-10-23 | 2022-09-16 | 삼성전자주식회사 | 네트워크 연결 정보에 기반하여 잡음 제어 파라미터를 결정하는 전자 장치 및 그의 동작 방법 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5097509A (en) * | 1990-03-28 | 1992-03-17 | Northern Telecom Limited | Rejection method for speech recognition |
FR2722631B1 (fr) * | 1994-07-13 | 1996-09-20 | France Telecom Etablissement P | Procede et systeme de filtrage adaptatif par egalisation aveugle d'un signal telephonique numerique et leurs applications |
US5598505A (en) * | 1994-09-30 | 1997-01-28 | Apple Computer, Inc. | Cepstral correction vector quantizer for speech recognition |
US5812972A (en) * | 1994-12-30 | 1998-09-22 | Lucent Technologies Inc. | Adaptive decision directed speech recognition bias equalization method and apparatus |
US5806022A (en) * | 1995-12-20 | 1998-09-08 | At&T Corp. | Method and system for performing speech recognition |
-
1997
- 1997-07-22 FR FR9709273A patent/FR2766604B1/fr not_active Expired - Fee Related
-
1998
- 1998-07-20 US US09/119,279 patent/US6157909A/en not_active Expired - Fee Related
- 1998-07-20 WO PCT/FR1998/001588 patent/WO1999005831A1/fr active IP Right Grant
- 1998-07-20 DE DE69838474T patent/DE69838474T2/de not_active Expired - Fee Related
- 1998-07-20 AU AU88133/98A patent/AU751333B2/en not_active Ceased
- 1998-07-20 BR BR9806232A patent/BR9806232A/pt not_active Application Discontinuation
- 1998-07-20 CN CN98801030A patent/CN1130057C/zh not_active Expired - Fee Related
- 1998-07-20 CA CA002266654A patent/CA2266654C/fr not_active Expired - Fee Related
- 1998-07-20 EP EP98939720A patent/EP0932964B1/fr not_active Expired - Lifetime
- 1998-07-20 ES ES98939720T patent/ES2294817T3/es not_active Expired - Lifetime
- 1998-07-20 JP JP11509410A patent/JP2001501327A/ja not_active Ceased
-
2000
- 2000-01-05 HK HK00100061A patent/HK1021099A1/xx not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110907933A (zh) * | 2019-11-26 | 2020-03-24 | 西安空间无线电技术研究所 | 一种基于分布式的综合孔径相关处理系统及方法 |
CN110907933B (zh) * | 2019-11-26 | 2022-12-27 | 西安空间无线电技术研究所 | 一种基于分布式的综合孔径相关处理系统及方法 |
CN112233688A (zh) * | 2020-09-24 | 2021-01-15 | 北京声智科技有限公司 | 音频降噪方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CA2266654A1 (fr) | 1999-02-04 |
FR2766604B1 (fr) | 1999-10-01 |
AU751333B2 (en) | 2002-08-15 |
AU8813398A (en) | 1999-02-16 |
EP0932964B1 (fr) | 2007-09-26 |
CA2266654C (fr) | 2007-09-25 |
DE69838474D1 (de) | 2007-11-08 |
EP0932964A1 (fr) | 1999-08-04 |
HK1021099A1 (en) | 2000-05-26 |
US6157909A (en) | 2000-12-05 |
BR9806232A (pt) | 2000-03-21 |
FR2766604A1 (fr) | 1999-01-29 |
JP2001501327A (ja) | 2001-01-30 |
DE69838474T2 (de) | 2008-06-26 |
ES2294817T3 (es) | 2008-04-01 |
CN1130057C (zh) | 2003-12-03 |
WO1999005831A1 (fr) | 1999-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1130057C (zh) | 有关传输信道对数字语言信号的影响的盲目均衡过程和装置 | |
US5706395A (en) | Adaptive weiner filtering using a dynamic suppression factor | |
CN1223108C (zh) | 回声消除方法和回声消除器 | |
CN1145931C (zh) | 降低语音信号中的噪声的方法和采用该方法的系统和电话机 | |
CN1150516C (zh) | 语音编码方法和语音编码器 | |
CN1175709C (zh) | 利用频谱减除的双拾音器信号降噪系统和方法 | |
USRE43191E1 (en) | Adaptive Weiner filtering using line spectral frequencies | |
US7313518B2 (en) | Noise reduction method and device using two pass filtering | |
CN1168069C (zh) | 识别系统和识别方法 | |
CN1197263C (zh) | 通过使用频域非线性处理抑制反射信号的方法和设备 | |
CN1084978C (zh) | 具有用于最佳适应的卡尔曼滤波器的回声消除方法 | |
CN1164036C (zh) | 声音回波和噪声的消除 | |
US20080126461A1 (en) | Signal processing system employing time and frequency domain partitioning | |
CN1595827A (zh) | 数字自适应滤波器和利用这一设备的声音回波消除器 | |
CN1748250A (zh) | 在稳定性约束下使用独立分量分析的语音处理系统和方法 | |
RU2239239C2 (ru) | Снижение разреженности в кодированных речевых сигналах | |
CN1210608A (zh) | 一种有噪语音参数增强的方法和装置 | |
CN1176034A (zh) | 消除在扬声器电话中包括非线性失真的声学回声的装置和方法 | |
CN1496032A (zh) | 噪声抑制装置 | |
CN1361972A (zh) | 回波抑制系统中增强近端语音信号 | |
CN1083294A (zh) | 对语音编码的随时间变化的频谱按内插法进行分析的方法 | |
US5999567A (en) | Method for recovering a source signal from a composite signal and apparatus therefor | |
CN101034878A (zh) | 增益调整方法和增益调整装置 | |
CN1209226A (zh) | 定点数字滤波器的分辨率增强 | |
US5905969A (en) | Process and system of adaptive filtering by blind equalization of a digital telephone signal and their applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20031203 |