CN1234935A

CN1234935A - 有关传输信道对数字语言信号的影响的盲目均衡处理过程和装置

Info

Publication number: CN1234935A
Application number: CN98801030A
Authority: CN
Inventors: 洛朗·莫里; 让·莫内
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 1997-07-22
Filing date: 1998-07-20
Publication date: 1999-11-10
Anticipated expiration: 2018-07-20
Also published as: CA2266654A1; FR2766604B1; AU751333B2; AU8813398A; EP0932964B1; CA2266654C; DE69838474D1; EP0932964A1; HK1021099A1; US6157909A; BR9806232A; FR2766604A1; JP2001501327A; DE69838474T2; ES2294817T3; CN1130057C; WO1999005831A1

Abstract

本发明涉及使传输信道对数字语言信号的影响进行盲目均衡的一种方法和一种装置。将语言信号({S_n(t)})变换成(1000)对数倒频谱矢量({C_n(i)})。根据代表语言信号长期频谱的参考频谱({R_n(i)})(1001),使每一对数倒频谱矢量经过自适应滤波(1002),以产生代表一均衡语言信号的均衡对数倒频谱信号(C_n(i))。本发明适用于自动语言识别。

Description

有关传输信道对数字语言信号的影响的盲目均衡处理过程和装置

本发明涉及有关传输信道对数字语言信号的影响的盲目均衡(blindequalization)处理过程和装置。

特别的，由于自动语言识别系统、ASR系统性能的改进，而这些系统又是通过公共交换电话网或移动电话网GSM工作的，所以，正确地对语言信号进行传输是当前的一个主要目标。

获得满意的、基本上恒定的识别速率的主要问题是因为携带语言的声音信号中存在可变性。

变量的来源多种多样，一般可分成两种类型的可变性，即固有可变性和说话者非固有的可变性。事实上，作为例子，一个单字的发音因说话者状态或者在句子中这个单字的上下文的不同而不同。如果再比较几个说话者的发音，这一差异更大。事实上，单词的发音是声波，这些声波必须被采集，以便对其进行一个识别过程。在捕获声波或语言波(speech wave)时，这些波上叠加有各种类型的干扰，其结果是增加了所采集的信号的可变性。环境噪声也构成由送话器采集的声波，并且与语言波混合在一起。

送话器传输的电子信号是与语言以及环境噪声对应的信号的总和信号。

另外，特别在采用电话网的应用场合，由手机的送话器和由将用户与语言识别系统相连的电话线形成的捕获模块起随时间缓慢变化的线性卷积滤波器的作用。

由于传统的手机不是工作于免提模式，所以环境噪声的影响通常可以忽略，主要考虑传输线的卷积影响(convolutional effects)。因此，自动识别系统输入端观测的每一信号包含有对于给定呼叫几乎是恒定的，但随呼叫的不同而不同的卷积分量。

卷积分量不利于语言识别的效率。为了确定其影响，需要将该分量投影到进行识别的表示空间，在大多数识别系统中为对数倒频谱空间(cepstral space))。

举例来说，这里必须注意，参照关于对数倒频谱表示的图1a,ASR系统的上游即参数化模块，将数字化语言信号变换成矢量流(stream of vectors)，该矢量流具有在10到40毫秒的固定长度且是重叠的窗口上计算的参数。原则上，重叠约为50％。选择这些参数矢量以代表在信号窗口中可能存在的最切合的信息。如图1a所示，图1a计算是对数倒频谱(cepstrum)的一般原则，一种频率变换，即快速富利叶变换(FFT)计算信号窗的频谱。然后计算频谱能量的对数。由采用该对数的反向(reverse)FFT得到对数倒频谱(C_n(i))。通常仅考虑开头的十个对数倒频谱系数。因此，假设这些系数模拟话音路径的脉冲响应(impulse response)，并因此而具有供识别处理过程用的有关信息。另外，这些系数对输入信号的能量不敏感，这是自动语言识别所关心的一个主要特征。

已经采用相同类型的另外的表示，特别是用于特定的语言识别目的。这是采用“法国电信研究开发中心”在法国开发的ASR系统，PHIL90系统，该系统采用MFCC或“基于MEL频率的对数倒频谱系数”作为参数矢量。这些系数使频谱{S_n(f)}变得平滑，用以估计频谱包络和音质知识。由滤波器组实现频谱的光滑。人的听觉系统对低频的分辨力高于对其他频率的分辨力，另外，在语言信号中，信息中的低频比高频多，从而滤波器组的临界带(critical bands)按感觉(perception)的非线性比例(scale)分布，称为MEL或BARK。参照图1b，计算MFCC的方法包括：先进行信号窗的频率变换FTT，然后滤波，MEL，计算每一信号窗，由在每一频带中的能量形成矢量。由反向变换进行反向频率变换，反向FTT，产生系数MFCC。

在与这些类型的表示对应的空间内，将代表传输信道的卷积滤波器变换成包含在对数倒频谱矢量中的几乎是恒定的附加偏置(additive bias)。为了更严密地检查这些表示，可以参考下述论文：

H.HERMANSKY,N.MORGAN,A.BAYYA,P.KOHN

“Compensation for the Effect of the Communication Channel in Auditory-like

Analysis of Speech”

(RASTA-PLP),Eurospeech,pp.1367-1370,Genova 1991；

C.MOKBEL,D.JOUVET,J.MONNE“Deconvolution of Telephone Line Effects for Speech Recognition”,

Speech Communication,Vol.19,No.3,September 1996,pp.185-196.

因此而引入的偏置随呼叫的不同而不同。由于这一变换和这一表示，与给定的声音相应的对数倒频谱矢量因此由于偏置的存在而在表示空间中占据了一个扩展部分。所以，该偏置的存在具有减小与不同的声音相应的对数倒频谱矢量的鉴别量的效果，因此，需要配置更复杂的模型，以便能够对各种形式的词汇应用进行鉴别。

因此，为了使电话线对观测信号的影响为最小，例如对于一个ASR过程，由于只有一个传感器、终端，问题基本上涉及两个信号的盲目去卷积(blinddeconvolution)。然而，原始的语言信号和信道的传输功能占据了相同的频率区，因而在对数倒频谱空间中有一大部分是相同的。因此特别难于确定提升器(lifter)，传统上定义为提升器，在对数倒频谱域中定义为衰减模块或滤波器(filter)，以便减小或抑制信道传输功能的作用，因此获得所要求的去卷积。

一方面，在自动语言识别领域，所采用的当前技术涉及对电话信号捕获状态(condition)的识别过程的加强性(robustness)，而另一方面，在信号处理领域中，所采用的当前技术涉及电话信号中干扰的减小以提高其智能。

当识别过程在本地用于免提电话、计算机、数据终端等的话音控制的时候，减小信号中的干扰的努力集中在减少附加噪声所引入的干扰上。上文中，标准技术涉及加强表示的定义，诸如频谱减小(spectral subtraction)的滤波、天线滤波、采用Markov模型状态或者甚至是将环境噪声联机加入到信号中的模型或参考(reference)模型的滤波。

在集中识别过程的情况下，也需要努力减小电话通信的影响。通常采用的技术是从对数倒频谱矢量中减去在相当宽的范围(horizon)内估计的直接分量(directcomponent)。对于分小成窗口的数字电话信号来说，范围(horizon)的意义是指整数个数的连续的窗口。减法既可以是通过估计并减小平均值而明显的进行，也可以是通过高通滤波而不明显地进行。近来的工作证明在充分宽的范围(horizon)内的对数倒频谱矢量的平均值正确地(exactly)代表电话线的影响。参见前述C.MOKBEL、J.MONNE和D.JOUVET的论文。

在通常的信号去卷积情况下，有两种主要类型的去卷积过程。

第一种类型称为盲目去卷积(blind deconvolution)是基于信号的频谱特性、对数倒频谱特性或瞬态特性以定义去卷积方式(pattern)。在电信领域中，自适应均衡算法类似于盲目去卷积。关于这种类型算规的详细描述，可以参见A.BENVENISTE和M.GOURSAT的论文：“Blind Equalizer”(IEEE Transactionson Communication,Vol.COM-32,No.8,August 1984,pp.871-883,1984)。

第二种类型与回波消除算法或消混响算法使用的过程类似，它采用自适应滤波，或者在声学天线的情况下采用空间滤波。通常在这种情况下，有几种传感器，并且至少两种，一种传感器用于参考信号，而另一种用于输入信号。对于这种类型的自适应滤波的更详细的描述，可以参见B.WIDROW等人的论文：“AdaptiveNoise Cancelling:Principles and Applications”(Proc.of IEEE,vol.63,No.12,pp.1692-1716,December 1975)。

在更特定的数字信号传输的情况下，由于实际上采用传统的滤波方式难于得到能消除传输信道影响的清晰(clean)的参考信号，均衡过程造成的问题是与其同一类型的。事实上，唯一可得到的信号是经观测的、已经传输的数字信号。为了简化均衡过程，可以将熟知的接收机数字序列传输到接收机，以便识别信道的传输功能。然而，这种工作方式很快使信道的传输能力饱和。

为了克服这一缺点，人们已经进行了各种研究，以便建立起盲目均衡过程。盲目均衡过程对传输的数字信号采用已知判定逻辑和长期统计，通过随机梯度的下降计算用于更新滤波器系数的误差。这种过程的一般方式见图1c。对于这种类型过程的更详细的描述，可参见J.J.SHYNK的论文：“Frequency-Domain andMultirate Adaptive Filtering”(IEEE Signal Processing Magazine,pp.15-37,January1992)。

另外，申请日为1994年7月13日以France Telecom(法国电信)名义申请的法国专利9408641号涉及了一种由数字电话信号的盲目均衡进行自适应滤波的过程和系统。

在上述过程和系统中，数字信号须经频率变换，FFT，和子带滤波。根据电话信号的长期统计为基础的参考信号，每一子带信号须经自适应滤波。从而通过数字电话信号上电话线影响的盲目去卷积，实现了均衡。

这种工作方式是令人满意的，这种工作方式基本上是基于频率域中，因而也是频谱域中的一种盲目均衡过程，且是由通过电话线的信号的长期统计特性证实的盲目均衡过程。

然而，本发明的目的是通过将自适应滤波直接应用于对数倒频谱域配置(deploy)一个盲目均衡过程。

由于直接应用于对数倒频谱域本发明的另一个目的是，还可以减小计算的总成本。

本发明的另一个目的是还可以来减小所使用的滤波器的输出数。

由于直接应用于对数倒频谱域本发明的另一个的目的是处理过程较好地适应于语言识别，特别是PHIL90系统。

最后，本发明的另一个目的是实现这样一种处理过程，这种处理过程在某些特定场合中与现有技术中在频谱域中采用盲目均衡获得的识别速率相比，识别速率有所提高。

根据本发明的目的的过程和装置其价值在于将语言信号s_n(t)变换成对数倒频谱矢量。根据代表语言信号的长期对数倒频谱的参考对数到频谱，使每一对数倒频谱矢量经过自适应滤波，以产生代表均衡语言信号的均衡对数倒频谱矢量。

在阅读了下面的说明并参考除有关现有技术的图1a到1c以后，读者将能更好地理解有关传输信道对数字信号的影响的盲目均衡的过程和装置以及本发明的目的。

图2a是过程方框图形式的总流程图，该过程是本发明的目的；

图2b是以方框图的形式表示的实现图2a所示本发明的目的的过程的详细方框图；

图3a是以功能图的方式示出根据本发明的一个装置，是传输信道对数字语言信号的影响的均衡装置。

图3b和3c示出如图3a所描述的装置，是本发明的较佳实施例。

下面参照图2a和图2b详细描述根据本发明目的的传输信道对数字语言信号的影响的盲目均衡过程。

在上面提到的图2a中，数字语言信号表示为{S_n(t)}，该信号通过根据本发明的处理过程实现盲目均衡的传输信道。

通常，将数字语言信号细分为可能会重叠的连续块，n表示当前块的级别，推广来说，实现本发明的过程而得到的任何数据组或帧的级别都是以当前块为基础的。

按照上图，处理过程至少包含使数字语言信号{S_n(t)}变换成一组对数倒频谱矢量，这是一个与表示为{C_n(i)}即级别为n的光栅相关的矢量，C_n(i)表示每一对数倒频谱矢量的级别为i的分量或对数倒频谱系数，在上述图中这一变换是在表示为1000的级(stage)中进行的。这组对数倒频谱矢量代表在给定的范围(horizon)内的数字语言信号{s_n(t)}，该范围(horizon)的概念是按照先前在说明书中给出的定义来定义的。

在上述级1000后面就可得到对数倒频谱矢量{C_n(i)}，在级1000后面跟随着表示为1001的级，级1001包含计算表示为{R_n(i)}的参考对数倒频谱，对于对数倒频谱矢量组中的每一对数倒频谱矢量{C_n(i)}来说这一对数倒频谱表示该语言信号的长期对数倒频谱。

事实上，上面已经参照本说明书前面提到的C.MOKBEL、D.JOUVET和J.MONNE的论文建立起在所有频率范围内语言信号的长期对数倒频谱几乎是恒定的，对数倒频谱域中频率的概念与频谱域中频率的概念是类似的。另外，同样参照上述论文，在充分宽的范围(horizon)内频谱密度的对数的平均值，因此也是对数倒频谱系数的平均值，代表在观测的信号中的恒定的卷积分量，这能有效地等效于传输信道的影响。

因此，上述级1001的后面跟随着级1002，这一级包含根据参考对数倒频谱{R_n(i)}使每一对数倒频谱矢量{C_n(i)}经过自适应滤波，以产生一组表示成的均衡对数倒频谱矢量，其中传输信道的影响大体上被抑制。这一组均衡对数倒频谱矢量代表一个均衡的数字语言信号。

因此，根据本发明目的的处理过程，在级1002中进行的自适应滤波是以由参考对数倒频谱{R_n(i)}构成的参考输入为基础而实现的，很明显，将自适应滤波安装在对数倒频谱域中，并应用于(applied to)对数倒频谱系数C_n(i)。

关于实施上面提及的自适应滤波，上文中提到，该滤波可以是LMS，最小均方(Least Mean Square)，自适应滤波，这种类型的滤波已在前面提及的J.J.SCHINK的论文中描述。

然而，根据本发明目的的处理过程的特别优越方面是上述自适应滤波应用于对数倒频谱域而非应用于频谱域，如在以前的技术中。

因此，根据本发明目的的处理过程的特别优越方面：

-均衡是这样的，基于事实，信号的长期对数倒频谱表示可以近似于常数。

对于涉及信号的长期对数倒频谱表示的元素(element)，特别是涉及该表示的统计以及有关采用长期对数倒频谱识别传输信道可能性(possibility)的更详细的描述，可参见本说明书前文中提到的C.MOKBEL、D.JOUVET和J.MONNED的论文。

-自适应滤波直接应用于对数倒频谱域，很明显的，如本说明书的上述叙述，该频谱域包含所考虑的数字信号的块处理。

下面将根据本发明的目的将自适应滤波进行盲目去卷积的过程给出书面的解释(written account)。

假设作为传输的数字信号{s_n(t)}的观测信号s(k)是清晰信号(clean signal)的卷积，即识别电话信道的滤波器传输的语言信号x(k)与传输函数w(k)的乘积，观测信号s(k)给出关系式(1)：

s(k)=x(k)*w(k)

在该关系式中，算符*表示卷积乘积的算子。

频谱域中的去卷积

-为了在对数倒频谱域中引入去卷积，首先对频谱域中的去卷积作理论性的介绍。参考上述关系式(1)，在上述关系式(1)中写出两项频谱功率密度的表达项，对于语言信号的每一窗口或块，按照关系式(2)：

S_s(f)=S_x(f)W²(f)

在该关系式中，S_s(f)、S_x(f)分别表示观测信号s(k)和传输的语言信号x(k)的频谱功率密度，而W(f)表示电话信道的传输函数。

注意，W(f)实际上表示识别电话信道w(k)的滤波器的富利叶(Fourier)变换。

考虑到上述关系式，具有传输函数H(f)的自适应滤波器可以直接应用于观测信号S_s(f)的频谱功率密度，以便得到均衡频谱S_n(f)，在其中，已抑制了电话线或传输信道的影响。

在这些条件下，均衡频谱S_n(f)证明关系式(3)：

S_n(f)=S_s(f)H(f)=S_x(f)W²(f)H(f)。

根据构成参考信号R(f)的恒定平坦频谱(constant flat spectrum)，对于观测信号每一窗口的误差E(f)证明关系式(4)：

E(f)=R(f)-S_x(f)W²(f)H(f)。

传输函数H(f)收敛的最佳滤波器(filter)是一个使得用MSE表示的均方差在每一已实施分解成频带、频谱分解的频带f中为最小。均方差MSE(f)证明关系式(5)：

MSE(f)=E[E²(f)]

考虑到某些宽范围证明的(widely verified)假设，语言信号恒定的长期频谱和在宽范围(horizon)内电话信道W(f)恒定的传输函数，最佳滤波器是使得由关系式(6)给出的表达式为最小的一个滤波器：

MSE (f) = R^{2} (f) + \overset{&OverBar;}{S_{x} (f)} {W_{x}}^{4} (f) H^{2} (f) - 2 R \overset{&OverBar;}{S_{x} (f)} W^{2} (f) H (f)

在观测信号已经分细的所有频带中不管f为何值。

前述关系式(6)给出的均方差MSE(f)的最小化能够获得最佳滤波器H_opt(f)的传输函数，它证明关系式(7)：

H_{opt} (f) = \frac{R (f) \overset{&OverBar;}{S_{x} (f)}}{\overset{&OverBar;}{S_{x} (f)}} \frac{1}{W^{2} (f)} = Cte \frac{1}{W^{2} (f)}

因此而获得的最佳滤波器使得电话通信的传输信道的影响得到补偿。

另外，如果考虑特定的参考信号，即是与所述信号具有相同功率的参考信号，则表达式E[R(f)S_x(f)]趋向于等于E[S_x ²(f)]，所以，在这些条件下，最佳滤波器趋近于传输信道的反向。

对数倒频谱域中的去卷积

照此类推，在对数倒频谱域中，上述关系式(3)可写或关系式(8)：

C_n(i)=C_s(i)+C_H(i)=C_x(i)+C_w(i)+C_H(i)

在该关系式中，C_n(i)、C_s(i)、C_x(i)、C_w(i)和C_H(i)分别代表均衡对数倒频谱、观测信号的对数倒频谱、在通过电话线或传输信道传输前的实际语言信号的对数倒频谱，线路影响的对数倒频谱表示和均衡滤波器影响的对数倒频谱表示。

考虑到恒定(constant)对数倒频谱R(i)用作参考这一事实，观测信号每一窗口的误差E(i)证明了关系式(9)：

E(i)=R(i)-(C_x(i)+C_w(i)+C_H(i))

滤波器的传输函数H(i)所收敛的最佳滤波器是使每一频率中的均方差MSE(i)按照关系式(10)来最小化的那一个滤波器：

MSE(i)=E[E²(i)]

类似于频率域中考虑的某些假设，这些假设是在频率(quefrential)域中表述的，即，语言恒定(speech constant)的长期对数倒频谱、宽范围(horizon)内传输线路恒定(constant)的影响的对数倒频谱表示，最佳滤波器是使均方差为最小并且证明下述关系式(11)的那一个滤波器：

C_{Hopt} (i) = R (i) - \overset{&OverBar;}{C_{x} (i)} {- C}_{w} (i) = Cte - C_{w} (i)

所以，应用于对数倒频谱域中的最佳滤波使得传输信道的影响得到补偿。

当选择参考对数倒频谱R(i)等于表示为

的长期对数倒频谱的平均值时，最佳滤波趋近于传输信道的反向。

将按照本发明目的的处理过程的相应的盲目均衡过程的方法与高通滤波或对数倒频谱减少(ceptral subtraction)的传统方法相比，事实上证明，从识别性能的观点来看，正如本说明书后文中将详细描述的那样，这种工作方式大体上等效于现有技术的特性，并且在某些数据库中明显超过它们。

关于在级1000中将观测的数字信号{s_n(t)}变换成一组对数倒频谱矢量，下面参照图2b详细描述实际的变换过程。

在上面提到的图中，变换级1000顺序在级1000a中使数字语言信号{s_n(t)}经过频率变换，在所考虑的范围(horizon)内传输数字语言信号{s_n(t)}的频谱{S_n(f)}。事实上要记住的是，将观测的数字信号{s_n(t)}细分成连续的取样块，从而可以在块中进行处理。所使用的频率变换例如可以由快速富利叶(Fourier)变换组成。

级1000a后面跟着级1000b，包括将通过级1000a中使用的频率变换方式获得的频谱{S_n(f)}分解成频率子带，以产生用{V_n(j)}表示的频率子带中的多个信号。这里，指数j表示所考虑的每一频率子带的级别。实际上，级1000b中进行的分解成频率子带可以通过合适的频率滤波器组来执行，例如，可以将信号{s_n(f)}的频谱细分成24个相邻的频带。

上述级1000b后跟随了级1000c，它包括频率子带中的每一信号，即每一信号V_n(j)，经过对数衰减，以在频率子带中产生用{LV_n(j)}表示的多个经衰减的信号。

在频率子带{LV_n(j)}中的经衰减的信号组然后经过反向频率变换，产生用{C_n(i)}表示的对数倒频谱矢量。例如，当以直接快速富利叶变换的形式在级1000a中进行频率变换时，通过反向快速富利叶变换产生反向频率变换。

关于参考对数倒频谱{R_n(i)}的计算，上文中提到，最好对每一个对数倒频谱矢量{C_n(i)}由恒定值的对数倒频谱信号组成。在数字语言信号和对数倒频谱矢量组中，该恒定对数倒频谱信号代表语言信号的长期对数倒频谱。通常，正如将在后文中描述的那样，可以从一个数据库获得参考对数倒频谱。

现在参照图3a、3b和3c，更详细地描述实现本发明目的处理过程的一种装置，该装置将传输信道对数字语言信号的影响进行盲目均衡。

如图3a所示，对于通过电话通信机构传输的数字语言信号{s_n(t)}，根据本发明目的的装置包含至少一个将数字语言信号{s_n(t)}变换成在给定的范围内特别是观测数字语言信号级别为n的窗口，代表数字语言信号的一组对数倒频谱矢量{C_n(i)}的模块1。上述模块1后面是模块2，该模块对每一个对数倒频谱矢量{C_n(i)}产生一个代表语言信号的长期对数倒频谱的参考对数倒频谱。参考对数倒频谱使得代表语言信号的长期对数倒频谱的一个参考对数倒频谱{R_n(i)}与对每一个这些矢量每一个对数倒频谱矢量{C_n(i)}相关。所处的条件将在后文中说明。所以，读者将会理解，参考对数倒频谱的值可以便利地用一个时间常数来近似。然而，对数倒频谱矢量的组别为i的每一分量C_n(i)，这一值的分布R_n(i)在所考虑的情况下，可以作为级别i的函数而有所不同。然而，尤其是在一个非限定的实施例中，参考对数倒频谱{R_n(i)}具有一个对每一分量都相同的常数值，该分量构成每一对数倒频谱矢量{C_n(i)}，相应于级别i的对数倒频谱系数C_n(i)。

在每一个对数倒频谱矢量{C_n(i)}的参考对数到频谱的基础上，建议一种自适应滤波模块3，该模块3可以产生均衡对数倒频谱矢量，其中，电话通信的影响基本上受到抑制。

尤其要指出，读者将会理解，根据对每一对数倒频谱矢量代表语言信号的长期对数倒频谱的参考对数倒频谱，自适应滤波模块3使得例如LMS型的滤波得以进行，根据参考对数倒频谱{R_n(i)}和均衡对数倒频谱矢量组之间的误差的计算使之产生均衡对数倒频谱矢量

。均衡对数倒频谱矢量组代表均衡数字语言信号。

如图3a所示，将数字语言信号变换成一组对数倒频谱矢量的模块1至少包含接收观测语言信号{s_n(t)}，在所考虑的范围内对传输用{S_n(f)}表示的数字语言信号的频谱进行频率变换的模块10、将数字语言信号的频谱分解成N个频率子带的滤波器组11，该滤波器组11在用{V_n(i)}表示的频率子带中传输N个信号。

滤波器组11后面是使频率子带中的每一信号对数衰耗的模块12，该模块在用{LV_n(j)}表示的频率子带中传输多个经衰减的信号。

最后，模块1还包含供反向频率变换的模块13，接收频率子带{LV_n(j)}中的衰减信号根据频率子带中的衰减信号使一组对数倒频谱矢量{C_n(i)}得以产生。

关于产生参考对数倒频谱的模块2，对于一组对数倒频谱矢量{C_n(i)}，其中，i∈[1,M]，对于每一对数倒频谱矢量，参考对数倒频谱{R_n(i)}代表语言信号的长期对数倒频谱。所以，读者将会理解，可以组织构成参考对数倒频谱发生器2的数据库，以便传输代表语言信号的长期对数倒频谱的参考对数倒频谱，作为表示对数倒频谱矢量{C_n(i)}的分量的指数I的函数。

另外，如图3a所示，自适应滤波模块3包含至少一个模块30用以计算每一相应均衡对数倒频谱矢量和相应参考对数倒频谱{R_n(i)}之间的误差信号。在参考对数倒频谱i级的每一分量和均衡对数倒频谱矢量的每一分量之间的计算误差信号

E (i) = R_{n} (i) - \hat{C_{n}} (i)

。还配置有使每一对数倒频谱矢量{C_n(i)}均衡的模块31，在后文中参照图3b和3c所说明的条件下，这一均衡模块使得可以根据每一分量C_n(i)和该误差信号，产生相应的均衡对数倒频谱矢量

。事实上，该误差信号是可以加权和自适应(adapted)的。

图3b示出的是在根据本发明的一个特定实施例中的装置，该装置起源于上文提及的PHIL90自动语言识别系统。

很明显，相同的标号指的是相同的元件，但是如此地组成图3a中的模块1，用以计算说明书中先前说明的MFCC，并因此传输观测数字语言信号每一连续窗口的分量C_n(l),C_n(i)到C_n(M)的相应的对数倒频谱矢量{C_n(i)}。图3b中的模块2和模块3代表与图3a中的模块2和3类似的模块。然而，对均衡对数倒频谱矢量的每一分量，以3i说明和表示计算参考对数频谱{R_n(i)}和每一均衡对数倒频谱矢量之间的误差的模块，对于对数倒频谱矢量{C_n(i)}的每一分量C_n(i)，每一模块3i是相同的，每一模块3i是相同的，并确保该分量具有相同的误差计算函数和均衡，从而传输相应于均衡对数倒频谱矢量

的一个分量。

如图3c所示，每一模块3i有利地包含一个减法器电路30i，该电路一方面在其正端接收相应于参考对数倒频谱{R_n(i)}的分量R_n(i)，另一方面，在其负端接收均衡对数倒频谱系数

，使按照误差信号E(i)的误差计算得以进行。

每一模块3i还在加法器电路31i上接收相应的对数倒频谱系数C_n(i)，实际上使对数倒频谱系数得以均衡，以便传输一个均衡的对数倒频谱系数

另外，如图3c所示，每一模块3i，尤其是使每一对数倒频谱系数C_n(i)均衡的模块有利地包含一个乘以系数μ的电路300i，该乘法器电路接收由减法器电路30i传输的误差信号E(i)，并传输一个加权的误差信号E^*(i)。乘法器电路300i后面是一个具有两个输入端和一个输出端的加法器电路301i，第一加法器电路301i的第一输入端接收经加权的误差信号E^*(i)，而该加法器电路的第二输入端接收通过慢升(slow-rise)电路302i传输的信号。该慢升电路302i实际上引入了一个与数字信号的取样块的持续时间相等的延迟。慢升电路302i的输出传输一个自适应(adaptation)信号H_n(i)，该信号传输到均衡加法器电路31i。因此，由乘法器电路300i、加法器电路301i和慢升电路302i构成的自适应电路(adaptation circuit)，因而使得误差信号E(i)得以自适应或加权，以便传输自适应信号H_n(i)。进行自适应电路实现的误差信号的自适应以后，均衡加法器电路31i传输相应的均衡对数倒频谱系数。正如将从图3b看到的那样，同样应用于所考虑的实施例1和M之间包含的级i的对数倒频谱矢量的所有分量上。

如图3b和3c所示，已经实现了根据本发明的装置的加工，并且比较试验已经使得所建议的盲目均衡技术可以在各种特定的数据库进行测试。

通过输入10个对数倒频谱系数的文件、采用自适应滤波并存储在滤波器的输出端得到的MFCC矢量来进行试验。MFCC文件是直接由PHIL90系统使用的。

下面的表格给出所获得的改进，这些改进是相对于传统技术、给定的基础系统(base system)、前文中例举的C.MOKBEL、J.MONNE和D.JOUVET定义(define)的对数倒频谱减小(sybtraction)过程、按照说明书前文中提到的法国专利9408741号中描述的过程和系统，在频谱域中进行自适应滤波以及，最后，根据按照本发明的目的的处理过程和装置，在对数倒频谱域中的自适应滤波。

这些技术应用于由数字(Digits)、Two-digit numbers(二位数字)、Tregor和Baladins在上述表格中顺序指定的四个不同的数据库。

开头的三个数据库是所谓的实验室数据库，其记录发源于预先警告的(forwarned)、合作扬声器(co-operative speaker)。

最后的数据库Baladins是所谓的操作数据库，是通过记录呼叫操作中的服务器得到的。记录操作数据库的条件与实际的操作条件更接近。所以，这些数据库的识别结果更接近于操作中得到的性能。表格最后一栏中示出的改进提高(improvement)为差错率的减小，是相对于PHIL90系统的参考形式(referenceversion)给出的。基础系统(base system)的差错率一栏中括弧内给出的范围代表95％的置信区间(confidence interval)。

关于对数倒频谱减小(subtraction)过程，这一过程至少对于数字和二位数字数据库是显得有效的。然而，该过程的实施是难于在实时联机(on line)实施的，因为其实施是基于寂静时或者在宽的语言范围内对数倒频谱矢量平均值的估算的。

数字	差错率	差错率的减小
数字	差错率	差错率的减小	基础系统	0.63％[0.44-0.90]
对数倒频谱减小	0.40％	36.7％	基础系统	0.63％[0.44-0.90]
对数倒频谱减小	0.40％	36.7％	自适应滤波(频谱域)	0.52％	16.7％
自适应滤波(对数倒频谱域)	0.46％	26.7％	自适应滤波(频谱域)	0.52％	16.7％
自适应滤波(对数倒频谱域)	0.46％	26.7％	二位数字	差错率	差错率的减小
基础系统	3.2％[2.82-3.63]		二位数字	差错率	差错率的减小
基础系统	3.2％[2.82-3.63]		对数倒频谱减小	2.5％	21.1％
自适应滤波(频谱域)	2.6％	18.5％	对数倒频谱减小	2.5％	21.1％
自适应滤波(频谱域)	2.6％	18.5％	自适应滤波(对数倒频谱域)	2.5％	21.1％

Tregor	差错率	差错率的减小
Tregor	差错率	差错率的减小	基础系统	0.40％[0.30-0.53]
对数倒频谱减小	0.34％	13.7％	基础系统	0.40％[0.30-0.53]
对数倒频谱减小	0.34％	13.7％	自适应滤波(频谱域)	0.33％	17.6％
自适应滤波(对数倒频谱域)	0.26％	35.3％	自适应滤波(频谱域)	0.33％	17.6％
自适应滤波(对数倒频谱域)	0.26％	35.3％	Baladins	差错率	差错率的减小
基础系统	3.8％[2.44-3.68]		Baladins	差错率	差错率的减小
基础系统	3.8％[2.44-3.68]		对数倒频谱减小	3.2％	12.7％
自适应滤波(频谱域)	3％	19.1％	对数倒频谱减小	3.2％	12.7％
自适应滤波(频谱域)	3％	19.1％	自适应滤波(对数倒频谱域)	2.7％	29.1％

很明显，根据本发明目的的装置的实际结构，可以采用本说明书前文中提到的已经用于PHIL90系统中的结构。

按照本发明应用于对数倒频谱系数空间的均衡装置在计算时间上是很经济的。事实上，对于每一个参数矢量，每16毫秒需要M次相乘和3N次相加，其中，M明显地表示对数倒频谱系数的个数。所以，每一滤波器输出，所需的操作次数等于一次相乘和3次相加。与确定参数矢量所包含的大量的计算量相比，本质上可以忽略这个计算的费用。

考虑到这些发现，要指出所用的滤波器的计算费用较低，并且安装时不会产生在实时计算的问题。

关于法国专利9408741号所建议的办法，由于每一滤波器输出只有一次相乘和三次相加而不是如前面的办法，尽管是在对数倒频谱域中的滤波器也有三次相乘和两次相加，另外比在频谱域中包含较少的输出，所以，计算量(calculatingvolume)的费用(cost)减小。另外，由于对数倒频谱系数的动态特性低于频谱系数和相应矢量的动态特性，所以在计算中分配到前述所需变量的位(bit)数的精度的是比较不重要的。所得到的结果是相同的或略高些；特别是相应于上述专利申请9408741号中描述的技术中在上述表格所提及的数据库的情况下。

Claims

1．对通过传输信道的数字语言信号({s_n(t)})的传输信道影响实施盲目均衡的过程，其特征在于，所述过程至少包含：

-将所述数字语言信号变换成一组对数倒频谱矢量，所述对数倒频谱矢量组代表在给定的范围内的所述数字语言信号；

-对语言信号的长期对数倒频谱的所述对数倒频谱矢量组的每一个对数倒频谱矢量；计算参考对数倒频谱({R_n(i)})表示；

-根据所述参考对数倒频谱，使每一对数倒频谱矢量经过自适应滤波，以便产生一组均衡的对数倒频谱矢量，其中，传输信道的影响大体上被抑制，所述均衡对数倒频谱矢量组代表一个均衡的数字语言信号。

2．如权利要求1所述的过程，其特征在于，所述变换依次包含：-使所述数字语言信号({s_n(t)})经过一个在所考虑的范围(horizon)内传输所述数字语言信号({s_n(t)})的频谱({S_n(f)})的频率变换；

将所述频谱({S_n(f)})分解成频率子带，从而在频率子带({V_n(j)})中产生多个信号；

使频率子带中的每一个信号经过对数衰减，从而在频率子带({LV_n(j)})中产生多个经衰减的信号；

-使频率子带中经衰减的信号组经过反向频率变换，以产生所述对数倒频谱矢量组({C_n(i)})。

3．如权利要求1或2所述的过程，其特征在于，所述参考对数倒频谱({R_n(i)})由在数字语言信号内和在对数倒频谱矢量组中代表语言信号的长期对数倒频谱的每一个对数倒频谱矢量的恒定的对数倒频谱信号组成。

4．如权利要求3所述的过程，其特征在于，所述参考对数倒频谱(({R(i)})具有一个恒定值，该恒定值对于构成每一对数倒频谱矢量({C_n(i)})的相应i级的每一分量或对数倒频谱系数(C_n(i))是相同的。

5．如权利要求1到4中任何一个权利要求所述的过程，其特征在于，所述自适应滤波包含，根据代表该语言信号的长期对数倒频谱的所述参考对数倒频谱({R_n(i)})，对于每一个对数倒频谱矢量，执行LMS类型的滤波，所述LMS类型滤波使得能够根据所述参考对数倒频谱({R_n(i)})和所述均衡对数倒频谱矢量组之间的误差的计算，产生所述均衡对数倒频谱矢量。

6．对通过传输信道的数字语言信号({s_n(t)})的传输信道影响实施盲目均衡的装置，其特征在于，所述装置至少包含：

-将所述数字语言信号变换成一组对数倒频谱矢量的手段，所述对数倒频谱矢量组代表在给定的范围内的所述数字语言信号；

-对于所述对数倒频谱矢量组中的每一个对数倒频谱矢量，产生代表该语言信号的长期对数倒频谱的参考对数倒频谱的手段；

-根据所述参考对数倒频谱，使每一对数倒频谱矢量经过自适应滤波，以便产生均衡对数倒频谱矢量的手段，其中，所述传输信道的影响大体上被抑制，所述均衡对数倒频谱矢量组代表一个均衡数字语言信号。

7．如权利要求6所述的装置，其特征在于，将所述数字语言信号变换成一组对数倒频谱矢量的所述手段至少包含：

-在所考虑的范围(horizon)内对传输所述数字语言信号({s_n(t)})的所述数字语言信号进行频率变换的手段；

将频率子带({V_n(i)})中传输N个信号的所述数字语言信号的所述频谱分解成N个频率子带的滤波器组；

使传输频率子带({LV_n(i)})中多个经衰减的信号在频率子带中的每一信号经过对数衰减的手段；

-进行反向频率变换，从而使得根据在频率子带({LV_n(i)})中的所述经衰减的信号产生所述对数倒频谱矢量({C_n(i)})组的手段。

8．如权利要求6或7所述的装置，其特征在于，对于每一对数倒频谱矢量({C_n(i)}),i∈[1,M]，以及对于每一对数倒频谱矢量代表该语言信号的长期对数倒频谱的参考对数倒频谱({R_n(i)})，所述自适应滤波的手段至少包含：计算每一均衡对数倒频谱矢量

的每一i级分量和参考对数倒频谱({R_n(i)})的相同级的相应分量(R_n(i))之间的误差信号(E(i))：

E (i) = R_{n} (i) - \hat{C_{n}} (i)

的手段，以及

根据每一对数倒频谱矢量({C_n(i)})的每一分量(C_n(i))和所述误差信号(E(i))，使传输均衡对数倒频谱矢量的分量的所述对数倒频谱矢量({C_n(i)})均衡的手段。

9．如权利要求8所述的装置，其特征在于，对于所述对数倒频谱矢量的每一分量(C_n(i))，计算误差信号(E(i))的所述手段和使所述对数倒频谱矢量({C_n(i)})均衡的所述手段包含：

-减法器电路，用来接收参考对数倒频谱({R_n(i)})的所述分量(R_n(i))和所述均衡对数倒频谱矢量的所述分量，并传输所述误差信号(E(i))；

-对该误差信号E(i))进行自适应的手段包含：

·乘以系数μ传输加权的误差信号(E^*(I))的电路；

·加法器电路，它具有两个输入端和一个输出端，第一输入端接收所述加权误差信号(E^*(i))，而第二输入端接收通过延迟预定的时间的慢升电路由所述第一加法器电路传输的信号，所述慢升电路的输出端传输一个自适应信号(H_n(i))；

均衡加法器电路，它接收所述对数倒频谱系数(C_n(i))和所述自适应信号(H_n(i))，并传输所述均衡对数倒频谱系数