CN1153566A

CN1153566A - 多脉冲分析语言处理系统及其方法

Info

Publication number: CN1153566A
Application number: CN95193454A
Authority: CN
Inventors: 利昂·比亚利克; 费利克斯·弗曼
Original assignee: AudioCodes Ltd
Current assignee: AudioCodes Ltd
Priority date: 1994-04-29
Filing date: 1995-04-27
Publication date: 1997-07-02
Anticipated expiration: 2015-04-27
Also published as: AU683750B2; BR9507571A; MX9605179A; AU2394895A; KR100257775B1; JPH09512645A; EP0784846A1; WO1995030222A1; CA2189142C; RU2121173C1; CA2189142A1; EP0784846B1; EP0784846A4; RU2121172C1; CN1112672C; DE69521622T2; US5568588A; DE69521622D1; JP3068196B2

Abstract

本发明为语音处理系统和方法。本发明系统包括至少一个最大似然量化多脉冲分析单元，作用于一目标矢量。该单元通常是对多脉冲序列确定初始增益水平，并多次完成单增益多脉冲分析，每次分析针对不同的增益水平。提供最能代表目标矢量的脉冲序列作为输出信号。在另一实施例中，系统包括至少是一个脉冲系列多脉冲分析单元，这里的目标矢量被模拟为脉冲系列序列。每个脉冲系列由一组单增益脉冲组成。

Description

多脉冲分析语言处理系统及其方法

一般地说，本发明涉及语音处理系统，具体地说，涉及多脉冲分析系统。

语音信号处理是技术上公知的，常用于压缩输入的语音信号，以供存储或传输。语音信号处理通常涉及把输入的语音信号分成帧(frame)，然后分析每一帧以确定其分量(component)。然后将各分量存储或传输。

典型情况是，帧分析器确定语音信号的短时和长时特性。帧分析器还能确定语音信号的短时和长时分量(或称“贡献(contribu-tion)”)之一或二者。例如，线性预测系数分析(LPC)提供短时特性和贡献，而音调(pitch)分析和预测提供长时的特性以及长时贡献。

典型情况是，从输入帧中减掉长时和短时预测器贡献中的任一个、或二者、或者都不减掉，从而留下要确定其形状特征的目标矢量。可以用多脉冲分析(MPA)来产生这种特征化。多脉冲分析(MPA)由S.古井，在“数字语音处理、合成与识别(Digital speechProcessing，Synthesis and Recognition)”一书(纽约Marcel Dekker公司出版，NY 1989)中的6.4.2节中进行了详细描述。这里把该书作为参考。

在MPA中，由多个样本构成的目标矢量用不同位置和不同符号(正或负)的多个单增益脉冲(或尖峰)来构成模型。为选择每个脉冲，在每个样本位置放置一个脉冲，并确定该脉冲通过一个由LPC系数定义的滤波器时所确定的脉冲效应。能与目标矢量拟合得最好的脉冲被选择出来并从目标矢量中去掉该脉冲的效应，从而产生一个新的目标矢量。该过程要继续到找出预定的数目的脉冲为止。为了存储或传输的目的，MPA分析的结果是脉冲位置的集合以及一个定量化的增益值。

通常该增益是由所确定的第一脉冲确定的。然后这个增益被用于其余的脉冲。不幸的是，第一脉冲的增益值并不总是指示出目标矢量的总体增益值，所以对目标矢量的拟合并不总是很精确。

所以，本发明的目的是提供一种改进的语音处理系统。在本发明的一个实施例中，系统包括一个短时分析器、一个目标矢量发生器和一个最大似然量化(MLQ)多脉冲分析单元。短时分析器确定输入语音信号的短时特性。目标矢量发生器从至少是该输入信号产生一个目标矢量。MLQ多脉冲分析单元对所造成的目标矢量进行操作。

MLQ多脉冲分析单元通常为多脉冲序列确定一个初始增益水平，并完成多次单增益MPA，每次采用不同的增益水平。这些增益水平介于初始增益水平上下一个区间内。所造成的脉冲可为正或负脉冲。

象其他最大似然应用中一样，也测量其结果的质量(在本情况中，通过使一个误差矢量的能量最小，该误差矢量定义为目标矢量和通过感性加权滤波器滤波单增益脉冲序列所产生的估计矢量之间的差值)。使误差矢量的能量达到极小的脉冲序列及其相应的增益水平(或增益水平指数index)便作为MLQ多脉冲分析单元的输出提供出来。

在另一个实施例中，系统包括一个长时预测分析器和一个脉冲系列多脉冲分析单元以替代MLQ多脉冲分析单元。在这个实施例中，脉冲系列多脉冲分析单元利用与长时分析器和音调(pitch)距离来造成一个振幅、同符号脉冲系列，系列中每个脉冲与先前一个脉冲的间距为该音调距离。然后，多脉冲分析单元输出一个代表脉冲系列序列的信号，包括正负脉冲系列，这是目标矢量的最好代表。

在另外一个实施例中，本系统包括一个MLQ脉冲系列多脉冲分析单元，它是前面两个实施例的操作的组合。换句话说，提供了一个增益区间，并对每个增益找出一个脉冲系列序列。提供的序列代表对目标矢量最接近的拟合，作为输出信号。

从下文中结合附图所作详细描述，将更充分地理解和认识本发明。这些附图是：

图1是本发明的语音处理系统的第一实施例的方框图；

图2是图1的(MP-MLQ)块的流程图；

图3A和3B是用于理解图2操作的图示；

图4A和4B分别为描述脉冲系列和使用脉冲系列进行多脉冲分析的图示；

图5是本发明利用脉冲系列的语音处理系统的第二个实施例的方框图；

图6是图5的脉冲系列多脉冲分析单元的操作流程图；

图7是与图1和图5的系统输出相比较的第三个实施例的方框图。

现在参考图1、2、3A和3B，这2个附图说明了本发明的第一个实施例。本发明的语音处理系统包括至少一个短时预测分析器10、一个长时预测分析器12、一个目标矢量发生器13和一个最大似然量化多脉冲分析(MP-MLQ)单元14。

短时预测分析器10在输入线16上接收由多个数字化语音样本构成的语音信号的一个输入帧。通常，每帧有240个语音样本，帧又往往分成多个子帧。通常，有4个子帧，每个子帧通常为60个样本长。输入帧可以是一个原始语音信号的一帧，也可以是原始语音信号被处理后的形态。

短时预测分析器10还在输入线16上接收输入帧，而在输出线17上产生该输入帧的短时特性。在一个实施例中，分析器10完成的线性预测分析，以产生表征输入帧的线性预测系数(LPC)。

为了本发明的目的，分析器10能完成任何类型的LPC分析。例如，LPC分析可以如“数字语音处理、合成与识别”一书中第6.4.2章所描述的那样按下述方式实现：将汉明窗加到以一个子帧为中心的180个样本构成的窗上。使用Durbin迭代方法产生第10阶LPC系数。对每个子帧重复这一过程。

长时预测分析器12可以是任何类型的长时预测器并对线16上的输入帧进行操作。长时分析器12分析输入帧的多个子帧，以确定每个子帧内的语音音调(pitch)值，这里的音调值定义为语音信号进似重复它本身的间隔样本数目。音调值通常介于20和146之间，这里20表明为高音调声音，而146表明为低音调声音。

例如，对每2个子帧，可以由二子帧S(n)的正规化互相关函数取最大值来确定一个音调的估计值，其表达式如下：

C_i = \frac{ΣS (K) S (K - i)}{Σ (K - i) S (K - i)}, 0 \leq K \leq 119, 20 \leq i \leq 146 - - - (1)

对于本例，长时分析器12选择使互相关C_i取极大值的指数i作为这2帧的音调值。

一旦长时分析器12确定了音调值，该音调值被用于确定在输入线18上提供的子帧的长时预测信息。

目标矢量发生器13接收长时分析器12和短时分析器10的输出信号以及在输入线16上的输入帧(通过延时19)。目标矢量发生器响应这些信号，从输入信号的至少一个子帧产生一个目标矢量。如果希望的话，可以利用长时和短时信息，或者可以忽略这些信息。延时19保证到达目标矢量的输入帧对应于分析器10和12的输出。

目标矢量发生器13的输出线26与MP-MLQ单元14相连，携带目标矢量输出信号。MP-MLQ单元14通常还与携带由分析器10产生的短时特性的输出线17相连。

可以理解，不失其一般性，可以以任何希望的方式产生向MP-MLQ单元提供的目标矢量。

根据本发明的第一最佳实施例。MP-MLQ单元14包括初始脉中位置确定器(determiner)20、增益区间确定器22、增益水平选择器24、脉冲序列确定器25、目标矢量匹配器28和可选的编码器30。图2中显示出部件20-30所完成的具体操作，下文将予以详细描述。下面是单元14操作的一般描述：

初始脉冲位置确定器20沿输出线17和26分别接受目标矢量发生器13和短时分析器10的输出信号，它根据多脉冲分析技术确定第一脉冲的样本位置。

增益区间确定器22接收单元20的第一脉冲输出，并确定第一脉冲的振幅以及在所确定振幅绝对值周围的量化增益水平所在区间。该区间的宽度MLQ_STEPS通常为3倍增益水平，并且是由外部提供的。

增益水平选择器24接收由增益区间确定器22产生的增益区间，并移动通过增益区间内的各增益值。它的输出在输出线32上，是一个要对其确定单增益脉冲序列的电流增益水平。

脉冲序列确定器25在线26上接收目标矢量，在线32上接收电流增益水平，并利用下文描述的多脉冲分析技术由它们确定一个与目标矢量匹配的脉冲序列(有正负两类脉冲)。该脉冲序列是一系列具有该电流增益水平的正负脉冲。

目标矢量匹配器28在输出线34上接收确定器25的脉冲序列输出，在输出线26上接收目标矢量。匹配器28利用最大似然型判据确定匹配质量。

由于存在一个增益水平区间，匹配器28反过来控制增益水平选择器24去选择下一个增益水平。这种反过来的控制由箭头36表明。

对于每个增益值，匹配器28确定匹配质量，并且只有当它对该判据提供比先前的匹配更小的值时才保留该匹配(增益指数和脉冲序列)。

一旦增益选择器24已经移动通过所有增益值，则有储在匹配28中的增益指数和脉冲序列是对目标矢量的最靠近的匹配。然后匹配器28沿输出线38向可选编码器30输出所存储的脉冲序列和增益指数。

可以理解，通过对少量增益水平中的每一个确定一个脉冲序列，MP-MLQ单元14能选定最靠近地匹配于目标矢量的那一个脉冲序列。

可选的编码器30对输出的脉冲序列和增益指数进行编码以供存储或传输。

图2中给出了MP-MLQ单元14的具体操作。在初始化步骤40，单元14产生如下信号：

a)由短时特性a_i得到的输入帧的脉冲响应h〔n〕定义为：

h〔n〕＝∑a_i*h〔n-i〕＋δ〔n〕，0≤n≤N-1，i≤i≤p (2)

h〔-n〕＝0，n＝1..P

这里P是短时特性的个数，N是在该子帧中的语音样本数。

b)对每个样本位置l，脉冲响应的自相关结果r_hh〔l〕为：

r_hh〔l〕＝∑h〔n〕*h〔n-l〕，0≤l≤N-1，1≤n≤N-1 (3)

c)对每个样本位置l，脉冲响应h〔n〕与目标矢量t〔n〕之间的互相关结果r_th〔l〕为：

r_th〔l〕＝∑t〔n〕*h〔n-l〕，0≤l≤N-1，1≤n≤N-1 (4)

将会理解，脉冲响应是沿线17由分析器10提供的短时特性a_i的函数。在初始化步骤40产生的脉冲响应对应于前文所述DurbinLPC分析。

MP-MLQ单元14利用一个局部(local)判据Lc_kj〔l〕对每个样本位置l、每个脉冲K、以及每个增益水平j确定一个定量值。如在下文中所见，该局部判据的水平依赖于K值(即依赖于已经确定的脉冲个数)。

在步骤42，用于确定第一脉冲的局部判据Lc_o，j〔l〕被初始化为互相关函数r_th〔l〕，如下式所示：

LC_O〔l〕＝LC_O，j〔l〕＝r_th〔l〕，

0≤l≤N-1，j_min≤j≤j_max (5)局部判据的最大局部值还设成某个负值。其位置指数l也初始化为0。

在步骤44-50，确定第一脉冲K＝l的位置l。为此，将局部判据LC_O，j〔l〕的绝对值与最大局部值进行比较(步骤44)。如果LC_O，j〔l〕较大，则存储位置l，最大局部值被说成局部判据LC_O，j〔l〕的绝对值(步骤46)并对位置脚标l增加1(步骤48)。重复进行这一操作，直到对所有位置l都已检查过一遍为止。在所有位置都已检查一遍之后所存储的样本位置l_cpt就是所选择的样本位置l_opt。步骤40-50是由脉冲位置确定器20完成的。

步骤52由增益区间确定器22完成。在步骤52，按下式生成一个产生最大局部判据LC_O，j〔l〕的位置l的最大振幅A_max：

A_max＝A_max_j＝|lC_O，j〔l_opt〕|/r_max，j_min≤j≤j_max (6)

这里l_opt是第一脉冲位置。然后对最大值A_max由预先确定的一组增益水平中的一个来近似。例如，如果预期振幅水平在区间0.1-2.0个单位内，则增益水平可能是每0.1个单位有一个值。这样，如果A_max为0.756，它的量化值即为0.8。

步骤54-58由增益选择器24完成。在步骤54，增益选择器24确定与所定增益水平对应的增益指数j以及在增益指数j周围的增益指数区间。增益水平区间能为任何大小，取决于预先确定的MLQ_STEPS值，在步骤54，增益选择器24把增益指数设为其极小值。对于前例，0.1可以有增益指数1，而MLQ_STEPS可以为3。这样，所确定的增益指数为8，而区间为指数5-11。步骤54还把一个极小全局值设成任一很大的值，如10¹³。

在本发明中，对于每个增益指数，第一脉冲是由脉冲位置确定器20确定的脉冲位置(在步骤44-50中)。而其余的脉冲可为子帧内的任何其他脉冲，而且可有正的或负的增益值。在步骤56，增益选择24存储第一脉冲位置及其振幅。在步骤58，通常根据等式5对当前脉冲指数K和增益指数j来初始化局部判据LC_K，j〔l〕。

脉冲序列确定器25完成步骤60-74。在步骤60，确定器25把最大局部值设成一个大值(这和以前一样)，并设位置指数l为0。

在步骤62，确定器25更新与前一个脉冲相连系的局部判据，按下式进行：

LC_K，j〔l〕＝LC_K-1，j〔l〕-A_K-1，j*r_hh〔l-l-opt_k-1，j〕，

j＝增益指数

k＝脉冲指数

l＝位置指数

在步骤64-70的循环中，脉冲序列确定器25确定脉冲位置，其确定方式与步骤44-50中完成的方式相似，所以这里不再进一步描述。在步骤72，确定器24存储所选的脉冲，在步骤74中它更新脉冲值。对序列中的每个脉冲重复步骤62-74，其结果是脉冲序列确定器25的脉冲序列输出。需要说明的是，步骤62对所发现的每个脉冲更新其局部判据。

图3A和3B给出脉冲序列确定器25的不同脉冲序列输出的两个实例。因3A的序列有增益指数7，图3B的序列有增益指数8。这两个序列有相同的第一样本位置10，但其余脉冲位于其他位置。需要说明的是脉冲可为正或负脉冲。

在步骤76，目标矢量匹配28对每个增益水平j确定其全局判据GC_j的值。全局判据GC_j可以是任何适当的判据，但通常的最大似然型判据。例如，全局判据可以测量一个误差矢量中的能量，该误差矢量定义为目标矢量与通过一个感性加权滤波器对单增益脉冲序列进行滤波所产生的一个估计矢量之差，在本实施例中，该感性加权滤波器由短时特性确定。对这样一个判据，目标矢量匹配器28包括一个感性加权滤波器。

将会理解，脉冲序列本身并不与目标矢量匹配；脉冲序列代表一个与目标矢量匹配的函数。

如下面的8a-8e等式所给出的那样，全局判据GC_j由两部分组成，即p_j和d_j二者都是信号x_j〔n〕的函数，而信号x_j〔n〕是由短时脉冲响应h〔n〕滤波的增益水平为j的脉冲系列。p_j是目标矢量t〔n〕和x〔n〕之间的互相关，d_j是x_j〔n〕的能量。

GC_j＝-2p_j＋d_j (8a)

p_j＝∑t〔n〕*x_j〔n〕，0≤n≤N-1 (8b)

d_j＝∑x_j〔n〕*x_j〔n〕，0≤n≤N-1 (8c)

x_j〔n〕＝∑v_j〔i〕*h〔i－n〕，0≤i≤n，0≤n≤N-1 (8d)

在步骤78，将当前增益指数j的全局判据GC_j与当前的最小全局值进行比较。如果它小于当前最小全局值(在步骤78进行这种检验)，则目标矢量匹配器28存储(步骤80)该增益指数及其相应的脉冲序列。

在步骤82，增益水平选择器24更新其增益指数，并在步骤84由它检验是否已对全部增益水平确定了脉冲序列。如果是，则所存储的脉冲序列和增益指数是根据全局判据GC_j最好匹配于目标矢量的脉冲序列和增益指数。

在步骤86，可选编码器根据任何一个编码方法对脉冲序列及增益指数进行编码，以构成输出信号供存储或传输。如果愿意的话，目标矢量可用x_jopt〔n〕来重建，这里的jopt是由步骤84产生的增益指数。

将会理解，本发明的MP-MLQ单元14至少提供所选择的脉冲序列和增益水平作为输出信号。现在参考图4A、4B、5和6，它们给出本发明的利用脉冲系列的另一实施例。图4显示出一个脉冲系列83。它由脉冲系列81构成，各脉冲间距为Q，它就是音调。

在图5所示系统中找出一个脉冲系列序列，该序列与一目标矢量最匹配。图4B显示可能会找到的三个脉冲系列83a、83b和83c的实例序列。每个脉冲系列83从不同的样本位置开始。脉冲系列83a是第一个，由4个脉冲组成。脉冲系列83b在稍后的一个位置开始，由3个脉冲组成，而脉冲系列83c在其后很多的位置开始，且只由2个脉冲组成。

图5的系统与图1的系统相似，其差别只在于：a)图1中的脉冲位置确定器20和脉冲系列确定器25被脉冲系列确定器88和脉冲系列序列确定器89所替代；b)标号90的目标矢量匹配器作用于系列序列，而不是作用于脉冲序列；c)确定器88和89沿输出线18接收音调值Q。此外，输出线34和38被输出线92和94所取代，输出线92和94携带的信号代表脉冲系列序列而不是脉冲序列。

脉冲系列确定器88的操作与脉冲确定器20相似，只是确定器88利用脉冲系列的脉冲响应h_T〔n〕，而不是利用脉冲的脉冲响应h〔n〕。h_T〔n〕定义为：

h_T〔n〕＝∑h〔n-k-Q〕，0≤n≤N-1，0≤n≤(N-1)/Q (9)这里Q是音调值。可以看出，在较后位置的脉冲系列通常有较少脉冲。

脉冲系列的等式3所示脉冲响应自相关变为

r_hh〔h〕＝∑h_T〔n〕*h-T〔n-1〕，0≤l≤N-1，1≤n≤N-1

(10)对每个样本位置l，脉冲响应h_T〔n〕和目标矢量t〔n〕之间的互相关r_th〔l〕变为：

r_th〔l〕＝∑t〔n〕*h_T〔n－1〕，0≤l≤N-1，l≤n≤N-1 (11)

脉冲系列序列确定器89的操作与脉冲序列确定器25相似，但确定器89产生的是脉冲系列序列。

目标矢量匹配器90的操作与目标矢量匹配器28相似，然而匹配器90利用的是脉冲系列的脉冲响应函数h_T〔n〕，而不是利用h〔n〕。这样，等式8d变为：

x_j〔n〕＝∑v_j〔i〕*h_T〔i－n〕，0≤i≤n，0≤n≤N-1 (12)

图6中给出脉冲系列多脉冲分析单元86的具体操作，其步骤等同于图2所示步骤，然而各等式是作用于脉冲系列而不是单个脉冲。这样在等式9中定义脉冲系列的脉冲响应h_T〔n〕，它每间隔Q步有脉冲。在较后位置的脉冲系列通常有较少脉冲。

其余的等式也类似，只是它们作用于脉冲响应h_T〔n〕。

如果愿意的话，由增益区间确定器22确定的增益区间可以只有一个增益指数。在这个实施例中，脉冲系列多脉冲分析单元86确定的脉冲系列序列有第一脉冲系列序列的增益水平。在这个实施例中，目标矢量匹配器90不操作，也没有增益水平选择器24和脉冲系列序列确定器89的重复操作。

将会进一步理解，可以把目标矢量匹配器28和90的输出加以比较，这示于图7。现在参考图7。匹配器28和90沿着输出线38和94向比较器100提供代表序列和全局判据的输出信号。比较器100比较来自匹配器28和90的全局判据GC_jopt，并选择最低的一个。沿输出线102提供输出信号，该信号代表产出的脉冲序列或脉冲系列序列。

将会理解，图1、5、7的各系统能应用于数字信号处理芯片或软件中。在一个实施例中，软件是用程序语言C++写的，在另一个实施例中是用汇编语言写的。

精通本门技术的人们将会理解，本发明不限于上文已具体显示和描述的内容。本发明的范围将只由下文中的权利要求书所规定。

权利要求书

按照条约第19条的修改

1.一种语音处理系统，包括：

连到输入和输出线上的一个短时分析器，其中所述短时分析器响应所述输入线上的输入语音信号，产生所述输入语音信号的短时特性；

目标矢量发生器从至少是所述输入语音信号以及可选的所述短时特性来产生一个目标矢量；以及

与所述目标矢量发生器的输出线相连的多脉冲分析器，这里所述多脉冲分析器产生一组等振幅、可变符号、可变间距的脉冲序列，所述一组序列的每一个序列有与其他序列不同的振幅值，在每个序列中所述每个脉冲有相等的振幅但可变的符号，所述多脉冲分析器输出一个对应于一个等振幅、可变符号、可变间距脉冲序列的信号，该序列是根据最大似然判据最能代表所述目标矢量的序列。

2.一个语音处理系统，包含一个短时分析器，用于利用对输入语音信号进行线性预测系数分析来产生短时特性，该系统包括：

一个目标矢量发生器，用于由至少是所述输入语音信号及可选的短时特性产生一个目标矢量；

一个初始脉冲位置确定器，用于根据多脉冲分析技术根据所述目标矢量和短时特性确定初始脉冲位置；

振幅区间确定器用于确定所述初始脉冲的振幅及在所述振幅绝对值周围成组的量化振幅水平的变化区间；

振幅水平选择器用于根据预定的步长大小通过所述量化振幅水平区间，所述振幅水平选择器对每一步长输出一个选定的量化振幅；

脉冲序列确定器用于根据所述选定的量化振幅确定一个等振幅、可变符号、可变间距脉冲序列，该序列对应于所述目标矢量；以及

目标矢量匹配器用于确定一误差矢量，它对应于所述等振幅、可变符号、可变间距脉冲序列和所述目标矢量之间匹配质量，用于对每个选定振幅确定所述误差矢量，以输出对应于最小误差矢量的所述等振幅、可变符号、可变间距脉冲序列。

3.根据权利要求2的系统，其中，每个所述振幅、可变符号、可变间距脉冲序列的初始脉冲位于同一样本位置。

4.根据权利要求2的系统，其中所述目标矢量匹配器包括一全局判据确定器，所述全局判据确定器包括一个感性加权滤波器用于滤波所述等振幅、可变符号、可变间距脉冲序列以及一个确定器用于对每个所述选定量化振幅确定所述误差矢量的能量，所述误差矢量定义为所述目标矢量和所述滤波器输出之差，所述感性加权滤波器的特性对应于短时特性。

5.一种语音处理系统，该系统包含一个短时分析器，用于利用线性预测系数分析由输入语音信号产生短时特征，还包含一个长时分析器用于由输入语音信号确定长时特性及语音的音调值，该系统包括：

目标矢量发生器用于由至少是所述输入语音信号以及可选的短时和长时特性来产生一个目标矢量；

初始脉冲系列位置确定器用于根据多脉冲分析技术以所述目标矢量、短时特征和音调值为基础确定初始脉冲系列的位置；

脉冲系列序列确定器用于产生一组与所述目标矢量对应的可变符号的等振幅、均匀分布的脉冲系列，所述脉冲系列的脉冲间距对应于音调值，所述每个系列中的各脉冲有相同符号，所述各系列的所述脉冲有相同的振幅水平。

6.一种语音处理系统，包括：

与输入和输出线相连的一个长时分析器，这里所述长时分析器响应所述输入线上的输入语音信号，产生长时特性，其中包括至少一个所述输入语音信号的音调值；

与所述输入线和输出线相连的短时分析器，这里所述短时分析器，所述短时分析器产生所述输入语音信号的短时特性。

目标矢量发生器用于由至少是所述输入语音信号以及可靠的短时和长时特性产生目标矢量；以及

连于所述目标矢量发生器一输出线的脉冲系列多脉冲分析器，用于产生一组可变符号的等振幅、均匀分布脉冲系列的序列，在每个系列中的脉冲有相同符号，而所述脉冲系列序列中的每个序列有与其他序列不同的振幅值，所述脉冲系列多脉冲分析器输出的信号对应于一组等振幅、均匀分布脉冲系列，它是根据最大似然判据最能代表所述目标矢量的一组脉冲系列。

7.根据权利要求6的系统，其中，在每个所述脉冲系列中的每个所述脉冲由所述音调值彼此分开。

8.根据权利要求6的系统，其中，每个所述脉冲序系列序列中的初始系列的初始脉冲位于同一样本位置。

9.一种语音处理系统，该系统含有一个短时分析器，用于利用线性预测系数分析由输入语音信号产生短时特性，还含有一个长时分析器用于由该输入语音信号确定长时特性(包括语音的音调值)，该系统包括：

目标矢量发生器用于由至少是所述输入语音信号及可选的短时和长时特性来产生一目标矢量；

初始脉冲系列位置确定器用于根据多脉冲分析技术，以所述目标矢量、短时特性和音调值来确定初始脉冲系列的位置；

振幅区间确定器用于确定所述初始脉冲系列的振幅以及在所述振幅绝对值周围分组的量化振幅水平的区间；

振幅水平选择器根据预定步长大小通过所述量化振幅水平区间，所述振幅水平选择器输出在每一步长的选定量化振幅；

脉冲系列序列确定器用于对所述选定的量化振幅的每一个，产生一组可变符号的等振幅、均匀分布脉冲系列，它对应于所述目标矢量，在所述系列中的脉冲的脉冲间距对应于音调值，每个系列中的脉冲具有相同符号，在每个脉冲系列中的所述脉冲具有相等振幅。所述相等振幅对应于所选定的量化振幅；以及

目标矢量匹配器用于确定一个误差矢量，它对应于所述一组可变符号的等振幅、均匀分布脉冲系列序列与所述目标函数的匹配质量，所述目标矢量匹配器用于输出对应于最小误差矢量的等振幅、同符号、均匀间距的脉冲系列序列。

10.根据权利要求9的系统，其中所述目标矢量匹配器包括一全局判据确定器，所述全局判据确定器包括一个感性加权滤波器用于滤波所述一组可变符号的等振幅、均匀间距脉冲系列，还包括一个确定器用于对每个所选定的量化振幅确定所述误差矢量的能量，所述误差矢量定义为所述目标矢量和所述滤波器输出之差，所述感性加权滤波器的特性对应于短时特性。

11.如权利要求10所述的系统，还包括：

与所述目标矢量发生器的输出线相连的多脉冲分析器，这里所述多脉冲分析器产生一组等振幅、可变符号、可变间距的脉冲序列，每个序列有与其他序列不同的振幅值，在每个序列中的每个脉冲有相等振幅但符号可变，所述多脉冲分析器输出一个信号，该信号对应于等振幅、可变符号、可变间距脉冲序列，根据最大似然判据该序列最能代表所述目标矢量；以及

比较器，接收来自所述脉冲系列多脉冲分析器及所述多脉冲分析器的输出，以选择最好匹配所述目标矢量的输出。

12.一种语音处理方法，包括如下步骤：

确定一输入语音信号的短时特性；

由至少是所述输入语音信号及可选的由所述短时特性产生一个目标矢量；

根据多脉冲分析技术，基于所述目标矢量和所述短时特性，确定一初始脉冲的位置；

确定所述初始脉冲的振幅及在所述振幅绝对值周围分组的量化振幅水平的区间；

根据预定步长大小通过量化振幅水平区间并在每个步长输出一个选定的量化振辐；

根据所述选定的量化振幅，产生一个与所述目标矢量对应的一个等振幅、可变符号、可变间距的脉冲序列；

将每个所述等振幅、可变符号、可变间距的脉冲序列与所述目标矢量进行比较；以及

选择所述等振幅、可变符号、可变间距脉冲序列，它根据最大似然判据最能代表所述目标矢量。

13.根据权利要求12的方法，其中，每个所述等振幅、可变符号、可变间距脉冲序列的初始脉冲位于同一样本位置。

14.根据权利要求12的方法，其中所述的比较步骤包括下列步骤：

通过一感性加权滤波器滤波等振幅、可变符号、可变间距的脉冲序列，该滤波器的特性是所述短时的特性；以及

对每个量化振幅水平确定一误差矢量的能量，该误差矢量定义为所述目标矢量与所述滤波器输入之差。

15.一种语音处理方法，包括如下步骤：

确定一输入语音信号的短时特性；

确定所述输入语音信号的长时特性，包括确定所述输入语音信号的一个音调(pitch)值；

由至少是所述输入语音信号，以及可选地由所述短时和长时特性，产生一个目标矢量；

根据多脉冲分析技术，基于所述目标矢量、所述短时特性及所述音调值，确定初始脉冲系列的位置；以及

产生一组可变符号的等振幅、均匀间距的脉冲系列，它们对应于所述目标矢量，所述系对中的脉冲具有的脉中间距对应于所述音量值，在所述系列中的脉冲有相同的振幅水平，在每个系列中的脉冲有相同符号。

16.一种语音处理方法，包括如下步骤：

确定所述输入语音信号的短时特性；

确定所述输入语音信号的长时特性，包括所述输入语音信号的至少一个音调值；

根据多脉冲分析技术基于所述目标矢量、短时特性及音调值，确定一初始脉冲序列的位置；

确定所述初始脉冲系列的振幅及在所述振幅绝对值周围分组的量化水平的区间；

根据预定步长大小通过所述量化振幅水平区间，并输出在每个步长处的选定量化振幅；

对每个选定的量化振幅，产生一个对应于所述目标矢量的一组可变符号的等振幅、均匀间距的脉冲系列，所述脉冲波列内的脉冲间距对应于所述音调值，每个所述波列中的脉冲有相同振幅，所述相同振幅对应于选定的量化振幅，在每个系列中的脉冲有相同符号；

将所述一组可变符号的等振幅、均匀间距的脉冲系列与所述目标矢量的比较；以及

选定所述一组可变符号的等振幅、均匀间距脉冲系列，它是根据最大似然判据最能代表所述目标矢量的系列。

17.根据权利要求16的方法，其中每个所述脉冲系列序列的初始脉冲位于同一样本位置。

Claims

1.一种语音处理系统，包括：

连到输入和输出线上的一个短时分析器，这里所述短时分析器响应所述输入线上的输入语音信号，产生所述输入语音信号的短时特性；

目标矢量发生器从至少是所述输入语音信号产生一目标矢量；以及

最大似然多脉冲分析器，它连于所述目标矢量发生器的输出线，用于产生一组单增益脉冲系列，每个系列有不同的增益值，在其输出端提供一信号，代表最能代表所述目标矢量的单增益脉冲系列。

2.根据权利要求1的语音处理系统，其中的最大似然多脉中分析器包括：

增益区间确定器，用于由所述目标矢量确定增益水平区间；

脉冲序列确定器，用于产生一组单增益脉冲系列，每个系列对应于所述增益水平区间内的所述增益水平中的一个；以及

目标矢量匹配器，用于将所述系列中的每一个系列与所述目标矢量进行匹配，并在输出线上输出一个信号，代表最能代表所述目标矢量的系列。

3.根据权利要求1的系统，其中所述一组脉冲系列的每个系列的第一脉冲处在同一样本位置。

4.根据权利要求2的系统，其中所述目标矢量匹配器是一个全局判据确定器，其组成是：一个感性加权滤波器，其特性为所述短时特性，用于对脉冲序列滤波；一个确定器，用于对每个增益水平确定一误差矢量的能量，该误差矢量定义为所述目标矢量和所述滤波器输出之差。

5.根据权利要求1的系统，其中所述增益区间确定器包括确定第一脉冲位置的振幅的装置及确定在所述振幅周围增益水平区间的装置。

6.一种语音处理系统，包括：

一个与输入和输出线相连的长时分析器，这里所述长时分析器响应所述输入线上的输入语音信号，产生至少一个所述输入语音信号的音调距离；

一个目标矢量发生器用于从至少是所述输入语音信号产生一个目标矢量；以及

一个与所述目标矢量发生器的输出线相连的脉冲系列多脉冲分析器，用于产生一个脉冲系列的序列，这里每个脉冲系列由一个单增益脉冲序列构成，每个脉冲所在的样本位置与所述序列中前一个脉冲相隔一个所述音调距离，在其输出端提供一个信号，代表最代表所述目标矢量的单增益脉冲序列。

7.根据权利要求6的系统，其中所述的脉冲系列有不同的符号。

8.一种语音处理系统，包括：

一个与输入和输出线相连的长时分析器，这里所述长时分析器响应所述输入线上的输入语音信号，产生至少是所述输入语音信号的音调距离；

一个与所述输入线及一个输出线相连的短时分析器，所述短时分析器响应所述输入语音信号，产生所述输入语音信号的短时特性；

一个目标矢量发生器用于由至少是所述输入语音信号产生一个目标矢量；以及

一个与所述目标矢量发生器的输出线相连的最大似然脉冲系列多脉冲分析器，用于产生一组单增益脉冲系列的序列，每个序列有不同的增益值，在其输出端产生的信号，代表最能代表所述目标矢量的单增益脉冲系列序列。

9.根据权利要求8的系统，其中每个脉冲系列由一单增益脉冲序列组成，每个脉冲所在位置与所述序列中前一个脉冲相距所述音调距离。

10.根据权利要求8的系统，其中所述一组脉冲系列序列中的每个系列的第一个脉冲位于同一样本位置。

11.根据权利要求8的语音处理系统，其中所述最大似然脉冲系列多脉冲分析器包括：

一个增益区间确定器用于由所述目标矢量确定一个增益水平区间；

一个脉冲系列序列确定器用于产生一组单增益脉冲系列序列，每个序列应对于处在所述增益水平区间内的所述增益水平之一；以及

一个目标矢量匹配器，用于将所述序列中的每一个匹配于所述目标矢量，并在输出线上输出一信号，代表最能代表所述目标矢量的序列。

12.根据权利要求11的系统，其中所述目标矢量匹配器为一全局判据确定器，包括一个感性加权滤波器，其特性为所述短时特性，用于对脉冲系列序列滤波，还包括一个确定器用于对每个增益水平确定一个误差矢量的能量，该误差矢量定义为所述目标矢量和所述滤波器输出之差。

13.根据权利要求11的系统，其中所述增益区间确定器包括确定第一脉冲位置的振幅的装置以及确定在所述振幅周围的增益水平区间的装置。

14.根据权利要求8的系统，还包括：

一个与所述目标矢量发生器的输出线相连的最大似然多脉冲分析器，用于产生一组单增益脉冲序列，每个序列有不同的增益值，并在输出端提供一个信号，代表最能代表所述目标矢量的单增益脉冲序列；以及

一比较器接收来自所述最大似然脉冲系列分析器和所述最大似然多脉冲分析器的输出，以选择最匹配于所述目标矢量的输出。

15.一种语音处理方法，包括下列步骤：

确定一输入信号的短时特性；

从至少是所述输入信号产生一个目标矢量；产生一组单增脉冲序列，每个序列有一不同的增益水平；

将每个所述序列匹配于所述目标矢量；以及

选择最能代表所述目标矢量的序列。

16.根据权利要求15的方法，其中所述一组脉冲序列中每一个序列的第一脉冲处在同一样本位置。

17.根据权利要求15的方法，其中所述的匹配步骤包括下述步骤：

通过一感性加权滤波器对脉冲系列序列进行滤波，该滤波器的特性是所述短时特性；以及

对每个增益水平，确定在一误差矢量中的能量，该误差矢量定义为所述目标矢量和所述滤波器的输出之间的差值。

18.根据权利要求15的方法，其中所述产生步骤(第二步)包括确定第一脉冲位置的振幅步骤和确定所述振幅周围增益区间的步骤。

19.一种语音处理方法，包括如下步骤：

确定至少是输入信号的一个音调距离；

由至少是所述信号产生一目标矢量；以及

产生一个脉冲系列序列，这里每个脉冲系列由一个单增益脉冲序列构成，在所述序列中每个脉冲所在的样本位置与前一个脉冲相距所述音调距离；以及产生一个信号，该信号代表最能代表所述目标矢量的单增益脉冲系列的序列。

20.根据权利要求19的方法，其中所述脉冲系列序列有不同符号。

21.一种语音处理方法，包括下列步骤：

确定所述输入信号的短时特性；

确定所述输入信号的至少一个音调距离；

由至少量所述输入信号产生一个目标矢量；

产生一组单增益脉冲系列序列，每个序列有不同的增益水平；以及

将所述序列中的每个序列匹配于所述目标矢量；以及

选择最能代表所述目标矢量的脉冲系列序列。

22.根据权利要求21的方法，其中每个脉冲系列由一组单增益脉冲组成，在所述序列中每个脉冲所在位置与前一个脉冲相距所述音调距离。

23.根据权利要求21的方法，其中所述组成脉冲系列序列中的每一个序列的第一脉冲开始于同一样本位置。

24.根据权利要求21的方法，其中所述的产生步骤(第二步)包括确定第一脉冲系列位置的振幅步骤以及确定在所述振幅周围正负增益区间的步骤。

25.根据权利要求21的方法，还包括如下步骤：

产生一组单增益脉冲序列，每个序列有不同的增益水平；以及

将每个所述序列匹配于所述目标矢量；

选择最能代表所述目标矢量的脉冲序列；以及

选择脉冲序列和脉冲系列序列之一，它是最能代表所述目标矢量的一个。