CN1220178C

CN1220178C - 在码本中进行搜索以对声音信号编码的方法和设备

Info

Publication number: CN1220178C
Application number: CNB021079072A
Authority: CN
Inventors: 让－皮埃尔·阿杜尔; 克劳德·拉弗雷米
Original assignee: Universite de Sherbrooke
Current assignee: Universite de Sherbrooke
Priority date: 1995-02-06
Filing date: 2002-03-21
Publication date: 2005-09-21
Anticipated expiration: 2016-02-02
Also published as: MY119038A; CN1181150A; EP0808496A1; PT1225568E; IT1305724B1; HK1002492A1; SE9600437D0; KR19980701975A; US5754976A; ATE248423T1; GB9602391D0; DE19604273C2; NO318595B1; FI20020320A; NO973472L; FR2730336A1; MX9705997A; EP1225568B1; GB2297671B; FI118396B

Abstract

本发明涉及对码本进行搜索以对声音信号进行编码的方法和设备。该码本由一个脉冲幅度/位置组合的集合组成，每个脉冲幅度/位置组合定义了L个不同的位置，并包括分配给该组合的各个位置的零幅脉冲和非零幅脉冲。每个非零幅脉冲有q种可能幅度。该方法从码本中预选脉冲幅度/位置组合的一个子集，并将该搜索限制在该子集内。预选该子集前预先建立幅度/位置函数。预先建立幅度/位置函数包括通过a)对声音信号进行处理以产生目标信号D和残留信号R′；b)根据目标信号D和残留信号R′计算幅度预估矢量B；以及c)对每一位置p，量化矢量B的幅度预估值B_p以得出为位置p选择的幅度，来给每个位置p预先分配q种可能幅度之一的步骤。

Description

在码本中进行搜索以对声音信号编码的方法与设备

本申请1996年2月2日提交的中国专利申请号为No.96193095.0，题为“用于语音快速编码的被选信号脉冲幅度的代数码本”的发明的分案申请。

发明背景

发明领域：

本发明涉及一种对声音信号，尤其是对不仅仅是语音信号的声音信号进行数字编码的改进技术，以对这种声音信号进行传送和合成。

现有技术简介：

在诸如通过卫星，地面移动台、数字无线电或分组网络进行的声音传送、声音存储、声音响应和无线电话等许多应用领域，对具有良好的主观质量/比特率的折衷的高效数字语音编码技术的需求正日益增长。

目前具有良好的主观质量比特率的折衷的最好的现有技术中有一种所谓的码激励线性预测编码(CELP)技术。按照这一技术，语音信号以含L个样值的数据块(即矢量)的形式被采样和处理，其中L是某个预先设定的数值。CELP技术采用一码本(code book)。

在CELP技术中的码本是被称为L维码矢量(定义L个不同位置的脉冲组合，并且包括分配给组合中各个位置p＝1，2......，L的零幅脉冲和非零幅脉冲)的长为L个样值的序列的一个附标集合。该码本包括一个从1至M变化的标引K，其中M表示码本的大小，有时表示为比特数b：

M＝2^b

一个码本可以被贮存在物理存储器(如查寻表)中，或者指的是将标引与相应码矢量联系起来的一种机理(例如一个公式)。

为按照CELP技术合成语音，通过模拟语音信号的频谱特性的时间变化滤波器从码本中筛选出适当的码矢量来合成每一块语音样值。在编码器端，对来自码本的所有候选码矢量或候选码矢量的一个子集计算合成的输出信号(码本搜索)。得以保留的码矢量为根据感觉加权失真方法，产生的合成输出信号最接近于原始语音信号的那个码矢量。

一种类型的码本为所谓的“随机”码本。这些码本的一个缺点是它们经常需要相当大的物理存储空间。从标引到相关的码矢量的路径涉及到查寻表，这些查寻表是随机产生的数字或者对大量的语音训练集合应用统计技术的结果。从这个意义来讲，这些码本是随机的，即无规则的。随机码本的容量容易受到存储空间和/或搜索复杂程度的限制。

另一种类型的码本为代数码本。与随机码本相比，代数码本不是随机的且不需要存储空间。一个代数码本是一个附标码矢量的集合，其中第K个码矢量的各脉冲的幅度和位置可通过一种不需要或只需要极少的物理存储空间的规则来根据其标引K推导出来。因而，代数码本的容量不受存储需求的限制。代数码本也能设计用于高效搜索。

本发明的目的

本发明的一个目的是提供一种能显著减少对声音信号进行编码时的码本检索复杂程度的方法和装置。这些方法和装置适用于一大类码本。

本发明的内容

具体而言，本发明提供了一种在码本中进行搜索以对声音信号编码的方法。该码本由一个脉冲幅度/位置组合的集合组成，每个脉冲幅度/位置组合定义了L个不同的位置p，并包括分配给该组合中各个位置p＝1，2，...，L的零幅脉冲和非零幅脉冲。每一非零幅脉冲采用(assume)q种可能的幅度之一。该码本搜索实施方法包括：从码本中预选与该声音信号有关的脉冲幅度/位置组合的一个子集的步骤；以及仅搜索脉冲幅度/位置组合的该子集以对声音信号编码，从而由于仅搜索码本中脉冲幅度/位置组合的一个子集，而降低搜索复杂度的步骤。预选脉冲幅度/位置组合的一个子集步骤包括与该声音信号相关地在位置p＝1，2，...，L和q种可能幅度之间预先建立一个幅度/位置函数。预先建立一个幅度/位置函数步骤包括给每个位置p预先分配q种可能幅度之一作为有效幅度。给每个位置p预先分配q种可能幅度之一的步骤包括：a)对声音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′；b)响应经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B；以及c)对每一位置p，量化矢量B的幅度预估值B_p以得出准备给该位置p选取的幅度。最后，搜索脉冲幅度/位置组合的一个子集的步骤包括将该搜索限制在对码本中具有满足该预先建立的函数的非零幅脉冲的脉冲幅度/位置组合。

本发明还涉及一种用于在码本中进行搜索以对声音信号编码的设备。该码本包含脉冲幅度/位置组合的一个集合，每个脉冲幅度/位置组合定义了L个不同的位置，并包括分配给该组合中的各个位置p＝1，2，...L的零幅脉冲和非零幅脉冲。每一非零幅脉冲取q种可能幅度之一。该码本搜索实施装置包括：用于从码本中预选出与声音信号有关的脉冲幅度/位置组合的一个子集的装置；以及用于仅搜索脉冲幅度/位置组合的该子集以对声音信号编码，从而由于仅搜索码本中的脉冲幅度/位置组合的一个子集，而降低搜索复杂度的装置。该预选装置包括用于与该声音信号有关地、在位置p＝1，2，...，L和q种可能幅度之间预先建立一个幅度/位置函数的装置，并且该预先建立装置包括给每个位置p预先分配q种可能幅度之一作为有效幅度的装置。给每个位置p预先分配q种可能幅度之一的装置包括：a)用于对声音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′的装置；b)用于响应经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B的装置；以及c)用于对每一位置p，量化矢量B的幅度预估值B_p以得出准备给该位置p选取的幅度的装置。最后，该搜索装置包括用于将搜索限制在对码本中具有满足该预先建立的函数的非零幅脉冲的脉冲幅度/位置组合的装置。

当一个脉冲幅度/位置组合中的每一个非零幅脉冲都具有与由预先建立的函数预先分配给所述非零幅脉冲的位置p的幅度相等的幅度时，该预先建立的函数得以满足是非常具有好处的。

按照一个优选实施例，幅度预估矢量B可以通过将归一化形式的经逆向滤波的目标信号D：

(1 - β) \frac{D}{| | D | |}

加到归一化形式的已去除音调的残留信号R′：

β \frac{R^{'}}{| | R^{'} | |}

从而得到如下形式的幅度预估矢量B：

B = (1 - β) \frac{D}{| | D | |} + β \frac{R^{'}}{| | R^{'} | |}

来进行计算，其中β是一个固定常数，其值位于0和1之间。

按照另一优选实施例，通过对每个位置p，采用下述表达式

B_{P} / \max_{n} | B_{n} |

对矢量B的已经峰值归一化的幅度预估值B_p进行量化来量化该幅度矢量预估，其中分母

\max_{n} | B_{n} |

是一个归一化因子，表示非零幅脉冲的峰值幅度。

按照第三优选实施例，该方法还包括根据一组脉冲位置的轨迹来限制码本的组合的非零幅脉冲的位置p的步骤。每个轨迹的脉冲位置与其他轨迹的脉冲位置相互交织。该脉冲组合中的每一个都包括N个非零幅脉冲，该组轨迹包括N个分别与N个非零幅脉冲关联的脉冲位置的轨迹，并且每一个非零幅脉冲的脉冲位置限制于所关联的轨迹位置。

按照第四优选实施例：

-每一个脉冲幅度/位置组合包括N个非零幅脉冲；

-通过使具有分母为α² _k的一个给定比值最大化搜索脉冲幅度/位置组合的该子集，α² _k通过N层嵌套循环根据下述关系式来计算：

α_{k}^{2} = U^{'} (p_{1}, p_{1})

+ U^{'} (p_{2}, p_{2}) + 2 U^{'} (p_{1}, p_{2})

+ U^{'} (p_{3}, p_{3}) + 2 U^{'} (p_{1}, p_{3}) + 2 U^{'} (p_{2}, p_{3})

............

+ U^{'} (p_{N}, p_{N}) + 2 U^{'} (p_{1}, p_{N}) + 2 U^{'} (p_{2}, p_{N}) + . . . + 2 U^{'} (p_{N - 1}, p_{N})

其中每一循环的计算内容写在从N层嵌套循环的最外层循环至最内层循环的不同线上，p_n是组合中第n个非零幅脉冲的位置，U′(p_x，p_y)是取决于预先分配给位置p中的某一位置p_x的幅度S_px和预先分配给位置p中的某一位置p_y的幅度S_py的一个函数；以及

-使给定比值最大化的步骤包括当下述不等式成立时，至少可以跳过N层嵌套循环中的最内层循环的步骤：

Σ_{n = 1}^{N - 1} S_{Pn} D_{Pn} < T_{D}

其中S_pn是预先分配给位置p_n的幅度，D_pn是目标矢量D的第p_n个分量。T_D为与经逆向滤波的目标矢量D有关的一个阈值。

本方面还涉及一种蜂窝通信系统，服务于被划分为多个小区的大地理区域，该系统包括：

移动发射机/接收机单元；

分别位于所述小区内的蜂窝基台；

用于控制所述各蜂窝基台之间通信的装置；

位于一个小区内的每一移动单元与所述小区内的蜂窝基台之间的一个双向无线通信子系统，所述双向无线通信子系统包括在移动单元和蜂窝基台内都具备的(a)发射机，包括用于对语音信号编码的装置和用于发送编码语音信号的装置；和(b)接收机，包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置。所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置，这些语音信号编码参数产生装置包括如上所述，用于在码本内进行搜索以产生至少一个语音信号编码参数的设备，在其中语音信号构成声音信号。

按照本发明，还提供：

-蜂窝网络元件，它包括：(a)发射机，包括用于对语音信号编码的装置和用于发送编码语音信号的装置；和(b)接收机，包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置。所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置，这些语音信号编码参数产生装置包括如上所述，用于在码本内进行搜索以产生至少一个语音信号编码参数的设备，在其中语音信号构成声音信号。

-蜂窝移动发射机/接收机单元，它包括：(a)发射机，包括用于对语音信号编码的装置和用于发送编码语音信号的装置；和(b)接收机，包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置。所述语音信号编码置包括用于响应该语音信号产生语音信号编码参数的装置，这些语音信号编码参数产生装置包括如上所述，用于在码本内进行搜索以产生至少一个语音信号编码参数的设备，在其中语音信号构成声音信号。

-服务于一个被划分为多个小区的大地理区域的一种蜂窝通信系统，包括移动发射机/接收机单元、分别位于所述小区内的蜂窝基台以及用于控制所述各蜂窝基台之间通信的装置；

位于一个小区内的每一移动单元与所述小区内的蜂窝基台之间的双向无线通信子系统，这个双向无线通信子系统包括在移动单元和蜂窝基台内都具备的(a)发射机，包括用于对语音信号编码的装置和用于发送编码语音信号的装置；和(b)接收机，包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置。所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置，这些语音信号编码参数产生装置包括如上所述，用于在码本内进行搜索以产生至少一个语音信号编码参数的设备，在其中语音信号构成声音信号。

通过阅读下面的关于优选实施例的非限制性叙述，参照附图，就可以对本发明的目的、优点和其它特征有一个更清晰的了解。

附图简要说明

在附图中：

图1是一个根据本发明的包括一个幅度选择器和一个最佳控制器的声音信号编码装置的示意方框图；

图2是一个与图1中的编码装置相关的解码装置的示意方框图；

图3a是根据本发明的基于信号选择的脉冲幅度进行快速码本搜索的基本操作步骤的顺序图；

图3b是给脉冲幅度/位置组合的每一位置p预先分配q种幅度中的一种幅度的操作步骤的顺序图；

图3c是N层嵌套循环搜索过程中包含的操作步骤的顺序图，其中，当认为第一组N-1个脉冲对分子DA^T _K的贡献不够充分时，跳过最内层循环；

图4是在码本搜索过程中采用的N层嵌套循环的示意图；

图5是说明一个典型蜂窝通信系统的基础结构的示意方框图。

优选实施例的详细说明

图5图解说明了一个典型蜂窝通信系统1的基础结构。

尽管在本说明书中，作为一个非限制性的例子，对根据本发明的搜索执行方法和装置应用于一个蜂窝通信系统的情况作了说明，但是，应指出这些方法和装置可以被应用到许多其它类型的需要对声音信号进行编码的通信系统中，并具有同样的优点。

对于诸如1的蜂窝通信系统，通过将一个大的地理区域划分成许多较小的小区，可以在这个大的区域内提供通信服务。每一小区有一个蜂窝基站2(图5)，用于提供无线电信令信道，以及音频和数据信道。

无线电信令通道用于在蜂窝基站的覆盖区域范围(小区)内呼叫诸如3的移动无线电话机(移动发射机/接收机单元)，以及与基站所在小区内或外的其它无线电话机通话，或与另外的网络如公共交换电话网(PSTN)4通话。

一旦无线电话机3成功地打通电话或接到电话，音频或数据信道就对于与无线电话机3所处的小区相对应的蜂窝基站2而建立，则基站2和无线电话机3之间的通信就通过该音频或数据通道进行。无线电话机3还可以在通话进行时，通过信令信道接收控制或定时信息。

如果无线电话机3在通话过程中离开某一小区进入另一小区，无线电话机就将电话过区切换到新小区内的可用的音频或数据信道上。类似地，如果没有通话，就通过信令信道发送一条控制信息使得无线电话机登录在与新小区相关的基站2上。采用这种方式，就可能实现在一个宽阔的地域内的移动通信。

蜂窝通信系统1还包含一个终端5，用于在诸如无线电话机3与PSTN4通信期间或者在一第一小区内无线电话机3和第二小区内的无线电话机3之间的通信期间，控制蜂窝基站2和公共交换电话网络4之间的通信。

当然，需要一个双向无线通信子系统来建立位于一个小区内的每一台无线电话机3和该小区内的蜂窝基站2之间的通信。这样一种双向无线通信系统一般包含在无线电话机3和蜂窝基站内都有的(a)发射机，用于对语音信号编码，并通过如6或7的天线发送已被编码的语音信号，以及(b)接收机，用于通过同一天线6或7接收被发送的编码语音信号，并对接收到的编码语音信号进行解码。对本领域普通技术人员都知道，需要对声音编码以减少带宽，这对于通过双向无线通信系统即在无线电话机3和基站2之间发送语音信号来说是必须的。

本发明的目的是提供一种具有良好的主观质量/比特率的折衷的高效数字语音编码技术，例如用于在蜂窝基站2和无线电话机3之间通过音频数据信道进行语音信号的双向传送。图1是适合于实现这一高效技术的一种数字语音编码装置的示意方框图。

图1中的语音编码装置与专利号为No.07/927,528的美国专利中的图1所示的编码装置相同，只是在本发明中增加了一个幅度选择器112。美国专利申请No.07/927,528申请日为1992年9月10日，题为“基于代数码的用于高效语音编码的动态码本”的发明。

模拟语音信号被采样并成块处理。必须明白的是，本发明并不局限于只应用于语音信号。也可以考虑应用本发明对其它类型的声音信号进行编码。

在图示的例子中，输入的采样语音的数据块S(图1)由L个样值组成。在CELP的文献中，L表示“子帧”长度，一般位于20和80之间。含L个样值的块也被称为L维矢量。在编码处理过程中会产生各种各样的L维矢量。下面给出了一个在图1和2中出现的矢量的列表，以及一个发送参数的列表：

关于主要L维矢量的列表

S 输入语音矢量；

R′ 去掉音调的残留信号；

X 目标矢量；

D 经逆向滤波的目标矢量；

A_k 代数码本中标引为k的码矢量；

C_k 修正矢量(Innovation vector)(经滤波的码矢

量)；

发送参数的列表

k 码矢量的标引(代数码本的输入)；

g 增益；

STP 短期预测参数(定义A(Z))；以及

LTP 长期预测参数(定义音调增益b和音调延时T)

解码原理：

最好是首先叙述图2中的语言解码装置，以说明在数字输入(多路信号分离器205的输入)和输出的取样语音(合成滤波器204的输出)之间进行的各个步骤。

多路信号分离器205从接收自数字输入信道的二进制信息中提取四种不同的参数，即标引k、增益g、短期预测参数STP和长期预测参数LTP。在这四种参数的基础上合成语音信号的当前L维矢量S，在下面的叙述中将对此加以解释。

图2中的语音解码装置包含动态码本208、放大器206、加法器207、长期预测器203和合成滤波器204，其中动态码本208由一个代数码发生器206和一个自适应前置滤波器202组成。

第一步，代数码产生器201响应标引k产生一个码矢量A_k。

第二步，给自适应前置滤波器202提供短期预测参数STP和/或长期预测参数LTP，由其对码矢量A_k进行处理，以产生一个输出修正矢量C_k。采用自适应前置滤波器202的目的是对输出修正矢量C_k的频率成分进行动态控制以提高语音质量，也就是减少由刺耳的频率引起的声音失真。下面给出了自适应前置滤波器202的典型传输函数F(Z)：

F_{a} (Z) = (\frac{A (z / r_{1})}{A (z / r_{2})})

F_{b} (Z) = \frac{1}{(1 - b_{0} z^{T})}

F_a(Z)是一种共振峰(formant)前置滤波器，γ₁和γ₂为常数，且0＜γ₁＜γ₂＜1。这种前置滤波器能增强共振峰区域的频率成分。并且在编码速率低于5k比特/s时能非常有效地工作。

F_b(Z)是一个音调前置滤波器，其中T是时变音调延时，b_o或是常数或是等于根据当前或以前的子帧量化的长期音调预测参数。F_b(Z)用于加强各种码速率F的音调谐波频率非常有效。因此，F(Z)一般包括一个有时与一个共振峰前置滤波器相结合的音调前置滤波器，即：

F(z)＝F_a(z)F_b(z)

按照CELP技术，首先用经放大器206的增益g来放大码本208中的修正矢量C_k来获得输出的取样语音信号S。然后，由加法器207将放大的波形gc_k加到提供有LTP参数的长期预测器203的输出E上(合成滤波器204的信号激励的长期预测部分)，长期预测器203置于反馈环中，并具有如下的传输函数B(Z)：

B(Z)＝bZ^-T

其中b和T分别为所述的音调增益和延时。

预测器203是一个模拟语音的音调周期性的滤波器，具有基于最新接收到的LTP参数b和T的传输函数。它引入样值的适当的音调增益b和延时T。复合信号E+gC_k构成合成滤波器204的信号激励，合成滤波器的传输函数为1/A(Z)(A(Z)将在下面的叙述中定义)。滤波器204根据最新接收到的STP参数进行正确的频谱整形。具体而言，滤波器204模拟语音的共振频率(共振峰)。输出的样值组S为合成取样语音信号，根据在本技术领域中的公知技术，采用合适的去混叠滤波，可以将该合成取样语音信号转化为模拟信号。

有许多方式来设计代数码发生器201。在所述的专利申请号为No.07/927,528的美国专利中提出了一种较好的方法，该方法采用至少一种N交织的单脉冲置换码。

用一个简单的代数码发生器201来对这一概念加以说明。在这个例子中，L＝40并且40维的码矢量集合中只包含N＝5个非零幅脉冲，称之为S_p1，S_p2，S_p3，S_p4，S_p5。在这种更细致的标注法中，p_i表示子帧内的第i个脉冲的位置(即p_i在0至L-1范围内取值)。假设脉冲S_pi被限制在如下的8种可能位置p₁：

p₁＝0，5，10，15，20，25，30，35＝0+8m₁；m₁＝0，1，...，7

在被称为“轨迹”#1的这八种可能的位置内，S_p1和7个零幅脉冲可以自由置换。称之为“单脉冲置换码”。现在让我们通过用类似的方式对余下的脉冲的位置也加以限制来交织五个这种“单脉冲置换码”(即轨迹#2，轨迹#3、轨迹#4和轨迹#5)。

p₁＝0，5，10，15，20，25，30，35＝0+8m₁

p₂＝1，6，11，16，21，26，31，36＝1+8m₂

p₃＝2，7，12，17，22，27，32，37＝2+8m₃

p₄＝3，8，13，18，23，28，33，38＝3+8m₄

p₅＝4，9，14，19，24，29，34，39＝4+8m₅

注意整数m₁＝0，1，...，7可以完全确定每一个脉冲S_pi的位置p_i。因而，采用下述关系式，通过对各m_i直接倍乘，就可以推导出一种简单的位置标引K_p：

K_p＝4096m₁+512m₂+64m₃+8m₄+m₅

必须指出的是，采用上述脉冲轨迹也能推导出其它的码本。例如，只采用4个脉冲，其中前三个脉冲分别占据前三条轨迹的位置，同时第四个脉冲或者占据第四条轨迹或者占据第五条轨迹，用一个比特来说明其处于哪一个轨迹。这种设计能得到一个13位位置码本。

在现有技术中，由于码矢量搜索的复杂性的缘故，假定非零幅脉冲在各种实际应用中都具有固定的幅度。事实上，如果脉冲S_pi可以取q种可能幅度中的一种的话，在搜索中就必须考虑有q^N种之多的脉冲一幅度组合。例如，如果允许第一个例子中的5个脉冲取q＝4种可能幅度，如S_pi＝+1，-1，+2，-2而不是固定幅度的话，代数码本的大小就会从15位跳至15+(5×2)位＝25位；也就是说，搜索将复杂一千倍。

本发明的目的是指出这样一个令人惊讶的方案，即在不用付出很大代价的情况下，采用有q种幅度的脉冲能取得非常好的性能。这种方案是将搜索范围限制在码矢量的一个限定的子集内。选择码矢量的方法与输入语音信号有关，下面的叙述中将对此加以说明。

本发明的有用之处在于：通过允许单个脉冲取不同的可能幅度，能够增加动态代数码本208的大小，而不增加码矢量搜索的复杂性。

编码原理：

取样语音信号S由图1中的编码系统按块编码在一块上。图1中的解码系统可被分解为标号从102至112的11个模块。大多数这些模块的功能和操作相对于美国专利和申请号为No.07/927,528的母专利中的描述来说没有变化。因而，在下面的叙述中尽管将不得不对每一个模块的功能和操作一些简要的解释。但主要将叙述对于美国专利申请号为No.07/927,528的母专利而言为新的内容。

按照现有技术，通过一个LPC频谱分析器102，给语音信号的每一个含L个样值的数据块，产生一组被称为短期预测(STP)参数的线性预测编码(LPC)参数。具体而言，分析器102模拟L个样值的每一块S的频谱特性。

L个样值S的输入块S由“白化”滤波器103白化，“白化”滤波器103具有下述基于STP参数的当前值的传输函数：

A (z) = Σ_{i = 0}^{M} a_{i} z^{- i}

其中a₀＝1，Z为所谓的Z变换中的一般变量。如图1所示，“白化”滤波器103产生残留矢量R。

音调提取器104用于计算和量化LTP参数，即音调延时T和音调增益g。提取器104的初始状态也被设置为来自初始状态提取器110的一个值FS。在美国专利申请号为No.07/927,528的母专利中对计算和量化LTP参数的详细过程已有叙述，并且相信对本领域普通技术人员是熟知的。因而，在本文中不再对此作进一步的叙述。

给滤波器响应特性计算器105(图1)提供STP和LTP参数以计算滤波器的响应特性FRC供后续步骤使用。FRC信息包括下述三个组成部分，其中n＝1，2，...，L。

·f(n)：F(Z)的响应

注意F(Z)一般包括音调前置滤波器。

·h(n)：

对f(n)的响应

其中γ是一个感觉因子。更一般而言，h(n)是前置滤波器F(Z)，感觉加权滤波器W(Z)和合成滤波器1/A(Z)的级联F(Z)W(Z)/A(Z)脉冲响应。注意F(Z)和1/A(Z)与在图2的解码器中采用的滤波器相同。

·U(i，j)：基于下述表达式的h(n)的自相关

u (i, j) = Σ_{k = 1}^{L} h (k - i + 1) h (k - j + 1)

1≤i≤L且i≤j≤L；当n＜1时h(n)＝0

给长期预测器106输入以前的激励信号(即前面子帧的E+gC_k)，以采用适当的音调延时T和增益b形成新的E成分。

感觉滤波器(perceptual filter)107的初始状态被设置成由初始状态提取器110输入的值FS。然后，将由减法器121(图1)计算出的已去掉音调的残留矢量R′＝R-E输入至感觉滤波器107以使感觉滤波器107输出一个目标矢量X。如图1所示，将STP参数输入滤波器107中以改变其与这些参数相关的传输函数。实质上，X＝R′-p，其中p表示包含由以前的激励信号引起的“振铃”的长期预测(LTP)的贡献。适用于Δ的MSE判据现在能用下述的矩阵符号表述：

\min_{k} {| | Δ | |}^{2} = \min_{k} {| | S^{'} - {\hat{S}}^{'} | |}^{2} = \min_{k} {| | S^{'} - [P - g A_{k} H^{T}] | |}^{2}

= \min_{k} {| | X - g A_{k} H^{T} | |}^{2}

其中M为由如下的h(n)响应形成的一个L×L下三角托普利兹(Toeplitz)矩阵。h(0)项位于矩阵的对角线，h(1)，h(2)，...，h(L-1)位于相应较低的对角线。

由图1中的滤波器108来完成逆向滤波步骤。设上式对增益g的微分等于0，就可得到如下的最佳增益：

\frac{&PartialD; {| | Δ | |}^{2}}{&PartialD; g} = 0

g = \frac{X {(A_{k} H^{T})}^{T}}{{| | A_{k} H^{T} | |}^{2}}

取g为这一值，最小值就变为：

\min_{k} {| | Δ | |}^{2} = \min_{k} {{| | X | |}^{2} - \frac{{(X {(A_{k} H^{T})}^{T})}^{2}}{{| | A_{k} H^{T |} |}^{2}}}

目的是寻找一个特定的标引k，使得到最小值。注意由于‖X‖²为一固定的数值。因而可以通过使下述数值最大来寻找同一标引：

\max_{k} \frac{{(X {(A_{k} H^{T})}^{T})}^{2}}{{| | A_{k} H^{T} | |}^{2}} \max_{k} \frac{{((XH) A_{k}^{T})}^{2}}{\infty_{k}^{2}} = \max_{k} \frac{{(D A_{k}^{T})}^{2}}{\infty_{k}^{2}}

其中D＝(XH)且α² _k＝‖A_kH^T‖²

在逆向滤波器108中计算经逆向滤波的目标矢量D＝(XH)。把此运算称为术语“逆向滤波”是因为将(XH)解释为时间反演X的滤波。

只在所述美国专利申请号为No.07/927,528的母专利的图1中增加了一个幅度选择器112。幅度选择器112的功能是通过最佳控制器109将待搜索的码矢量A_k限制在最可能的码矢量A_k的范围内从而减小码矢量搜索的复杂性。如前面的描叙所述。每一个码矢量A_k是一个脉冲幅度/位置组合波形。它定义了L个不同的位置p，并包括分配给该组合中各个位置p＝1，2，...，L的零幅脉冲和非零幅脉冲，其中每一个非零幅脉冲具有q种不同的可能幅度中的至少一种幅度。

现在参照图3a、3b和3c，幅度选择器112的作用是预先建立码矢量波形的位置p和各脉冲幅度的q种可能值之间的函数关系S_p。在码本搜索之前与语音信号相关联推导出预先建立的函数关系S_p。具体而言，这一函数的预先建立过程包括与语音信号相关地，给波形的每一个位置p预先分配q种可能幅度中的至少一种幅度(图3a中的步骤301)。

为给波形的每一个位置p预先分配q种可能幅度中的一种，响应于经逆向滤波的目标矢量D和已去除音调的残留矢量R′来计算幅度预估矢量B。具体而言，通过对归一化形式的经逆向滤波的目标矢量D：

(1 - β) \frac{D}{| | D | |}

和归一化形式的已去除音调的残留矢量R′

β \frac{R^{'}}{| | R^{'} | |}

求和来计算幅度预估矢量B(图3b中的子步骤301-1)从而得到如下形式的幅度预估矢量B：

B = (1 - β) \frac{D}{| | D | |} + β \frac{R^{'}}{| | R^{'} | |}

其中β是一个固定常数，其典型值为1/2(β值根据在代数码本中采用的非零幅脉冲的百分比在0和1之间选择)。

对波形的每一个位置p来说，通过量化矢量B的相应的幅度预估值B_p来获取要预先分配给该位置p的幅度S_p。具体而言，对波形的每一个位置p，采用下述表达式来量化矢量B的经峰值归一化的幅度预估值B_p(图3b中的子步骤301-2)：

S_{P} = Q (B_{P} / \max_{n} | B_{n} |

其中Q(.)为量化函数而且

\max_{n} | B_{n} |

是一个归一化因子，表示非零幅脉冲的峰值幅度。

在下述重要的特殊情形中：

-q＝2，即脉冲幅度只能取两个值(即S_pi＝±1)；以及

-非零幅脉冲密度N/L小于等于15％

β值可以等于零；因而幅度预估矢量B就简化为只与经逆向滤波的目标矢量D有关，结果为S_p＝sign(D_p)。

最佳控制器119的作用是从代数码本中选择出最佳码矢量A_k。选择判据以定额(ration)的形式给出，对每一个码矢量A_k计算其定额，并从所有码矢量中寻找最大值(步骤303)：

\max_{k} \frac{{(D A_{k}^{T})}^{2}}{α_{k}^{2}}

其中D＝(XH)且α² _k＝‖A_kH^T‖²

由于A_k是一个代数码矢量，它具有N个非零幅脉冲，且各个脉冲的幅度分别为S_pi，因而分子为下式的平方：

D A_{k}^{T} = Σ_{i = 1}^{N} D_{Pi} S_{Pi}

且分母为能够表示为如下形式的一个能量项：

α_{k}^{2} = Σ_{i = 1}^{N} S_{Pi}^{2} U (p_{i}, p_{j}) + 2 Σ_{i = 1}^{N - 1} Σ_{j = i + 1}^{N} S_{Pi} S_{Pi} U (p_{i}, p_{i})

其中U(p_i，p_j)是与两个单位幅度脉冲有关的相关量，一个脉冲位于位置p_i，另一个脉冲位于位置p_j。在滤波器响应特性计算器105中根据上式计算该矩阵。该矩阵被包括在图1的方框图中称FRC的一组参数中。

一种用于计算这一分母的快速方法包含如图4所示的N层嵌套循环。在图4中用对齐符号S(i)和SS(i，j)分别代替参数“S_pi”和“S_piS_pj”。分母α² _k的计算是最费时的过程。对α² _k有贡献的在每一个循环中完成的计算可以用如下形式写在从最外层循环至最内层循环的不同线上：

α_{k}^{2} = S_{P 1}^{2} U (p_{1}, p_{1})

+ S_{P 2}^{2} U (p_{2}, p_{2}) + 2 S_{P 1} S_{P 2} U (p_{1}, p_{2})

+ S_{P 3}^{2} U (p_{3}, p_{3}) + 2 [S_{P 1} S_{P 3} U (p_{1}, p_{3}) + S_{P 2} S_{P 3} U (p_{2}, p_{3})]

............

+ S_{PN}^{2} U (p_{N}, p_{N}) + 2 [S_{P 1} S_{PN} U (p_{1}, p_{N}) + S_{P 2} S_{PN} U (p_{2}, p_{N}) + \cdot \cdot \cdot + S_{PN - 1} S_{PN} U (p_{N - 1}, p_{n})

其中p_i是第i个非零幅脉冲的位置。值得注意的是图4中的N层嵌套循环能够根据N交织单脉冲置换码来限制码矢量A_k的非零幅脉冲。

在本发明中，通过将待搜索的码矢量A_k的子集限制为其N个非零幅脉冲满足在图3a的步骤301中预先建立的函数关系的码矢量，可以显著减小搜索的复杂程度。当码矢量A_k的N个非零幅脉冲中的每一个都具有与预先分配给处于位置p的非零幅脉冲的幅度相等的幅度时，预先建立的函数关系就得到了满足。

所述码矢量子集的限制过程通过首先将预先建立的函数S_p与矩阵元U(i，j)相结合(图3a中的步骤302)。然后采用假定为固定位置，极性为正、具有单位幅度的所有脉冲S(i)进行N层嵌套循环(步骤303)。因而，即使代数码本中的非零幅脉冲的幅度可以取q种可能值中的任意一种，也可以将搜索的复杂程度减小至固定脉冲幅度的情形。更准确地说，根据下述关系式将由滤波器响应特性计算器105提供的矩阵U(i，j)与预先建立的函数相组合(步骤302)：

U′(i，j)＝S_iS_jU(i，j)

其中S_i来源于幅度选择器102的选择方法，即S_i为在对相应的幅度预估值量化之后给每个位置i所选择的幅度。

采用这个新的矩阵，该快速算法的每一循环中的计算可以如下形式写在从最外层至内层循环的不同线上：

α_{k}^{2} = U^{'} (p_{1}, p_{1})

+ U^{'} (p_{2}, p_{2}) + 2 U^{'} (p_{1}, p_{2})

+ U^{'} (p_{3}, p_{3}) + 2 U^{'} (p_{1}, p_{3}) + 2 U^{'} (p_{2}, p_{3})

............

+ U^{'} (p_{N}, p_{N}) + 2 U^{'} (p_{1}, p_{N}) + 2 U^{'} (p_{2}, p_{N}) + \cdot \cdot \cdot + 2 U^{'} (p_{N - 1}, p_{n})

其中p_x为波形中第X个非零幅脉冲的位置，U′(p_x，p_y)为取决于预先分配给位置p中的某一位置p_x的幅度S_px和预先分配给位置p中的某一位置p_y的幅度S_py的一个函数。

为了更进一步减小搜索的复杂性，只要下述不等式成立，就可以跳过最内层循环(参照图3c)。而且跳过最内层循环只是个特例，而不是仅仅只指最内层循环：

Σ_{n - 1}^{N - 1} S_{Pn} D_{Pn} < T_{D}

其中S_pn是预先分配给位置p_n的幅度，D_pn是目标矢量D的第p_n个分量，T_D是与经逆向滤波的目标矢量D有关的一个阈值。

全局的信号激励信号E+gC_k由加法器120(图1)根据来自控制器109的信号gC_k和来自预测器106的输出E来计算。由具有随STP参数变化的传输函数1/A(Zγ^-1)的感觉滤波器构成的初始状态提供模块110，从残留信号R中减去信号激励信号E+gC_k，以获取最终滤波器状态FS，供滤波器107和音调提取器104作为初始状态使用。

四种参数k，g，LTP和STP的集合通过多路复用器111转换为合适的数字信道格式，从而完成对语音信号的样值块S的编码过程。

尽管上面已经参照优选实施例对本发明进行了描述，在不偏离本发明的精神和实质的情形下，在后附的权利要求所声明的范围之内，还可以对这些实施例进行修改。

Claims

1.一种在码本中进行搜索以对声音信号编码的方法，其中

-所述码本包含脉冲幅度/位置组合的一个集合；

-每个脉冲幅度/位置组合定义L个不同的位置，并且包括分配给该组合中各个位置p＝1，2，…，L的零幅脉冲和非零幅脉冲；

-每一非零幅脉冲采用q种可能的幅度之一；以及

-所述码本搜索实施方法包括：

与所述声音信号相关地从所述码本中预选脉冲幅度/位置组合的一个子集；以及

仅搜索所述脉冲幅度/位置组合的所述子集以对声音信号编码，从而由于仅搜索码本中脉冲幅度/位置组合的一个子集，而降低搜索复杂度；

其中所述预选脉冲幅度/位置组合步骤包括与所述声音信号相关地、在位置p＝1，2，…，L和q种可能幅度之间预先建立一个幅度/位置函数；

预先建立幅度/位置函数的步骤包括给每一位置p预先分配q种可能幅度之一作为有效幅度；以及

给每一位置p预先分配q种可能幅度之一的步骤包括：

对所述声音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′；

根据经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B；以及

对所述的每一位置p，量化所述矢量B的幅度预估值B_p以得出准备为所述位置p选择的幅度；以及

搜索脉冲幅度/位置组合的所述子集的步骤包括将搜索限制在所述码本中具有满足所述预先建立的函数的非零幅脉冲的脉冲幅度/位置组合的范围内的步骤。

2.如权利要求1所述的方法，其中当脉冲幅度/位置组合中的每一个非零幅脉冲都具有与由预先建立的函数预先分配给所述非零幅脉冲的位置p的幅度相等的幅度时，满足该预先建立的函数。

3.如权利要求1所述的方法，其中所述计算幅度预估矢量B的步骤包括：将归一化形式的经逆向滤波的目标信号D：

(1 - β) \frac{D}{| | D | |}

与归一化形式的已去除音调的残留信号R′；

β \frac{R^{'}}{| | R^{'} | |}

相加从而得到如下形式的幅度预估计矢量B：

B = (1 - β) \frac{D}{| | D | |} + β \frac{R^{'}}{| | R^{'} | |}

其中β是一个固定常数。

4.如权利要求3所述的方法，其中β是一个固定常数，其值位于0和1之间。

5.如权利要求1所述的方法，其中对每个所述位置p，所述量化幅度矢量预估值的步骤包括用下述表达式量化所述矢量B的已经峰值归一化的幅度预估值B_p：

B_{p} / \max_{n} | B_{n} |

其中分母

\max_{n} | B_{n} |

是一个归一化因子，表示所述非零幅脉冲的峰值幅度。

6.如权利要求1所述的方法，还包括根据一组脉冲位置的轨迹限制该码本中的组合的非零幅脉冲的位置p的步骤。

7.如权利要求6所述的方法，其中每个轨迹的脉冲位置与其他轨迹的脉冲位置相互交织。

8.如权利要求6所述的方法，其中

-所述脉冲组合中的每一个都包括N个非零幅脉冲；

-该组轨迹包括分别与N个非零幅脉冲关联的脉冲位置的N个轨迹；

-每个轨迹的脉冲位置与其他N-1个轨迹的脉冲位置相互交织；以及

-限制位置p包括将每一个非零幅脉冲的脉冲位置限制于所关联的轨迹的位置。

9.如权利要求1所述的方法，其中所述的每一个脉冲幅度/位置组合都包含N个非零幅脉冲，并且其中搜索所述脉冲幅度/位置组合的步骤包含使分母为α² _k的给定比值最大化的步骤，α² _k通过N层嵌套循环根据下述关系式来计算：

α² _k＝U′(p₁，p₁)

+U′(p₂，p₂)+2U′(p₁，p₂)

+U′(p₃，p₃)+2U′(p₁，p₃)+2U′(p₂，p₃)

… … … …

+U′(p_N，p_N)+2U′(p₁，p_N)+2U′(p₂，p_N)+…+2U′(p_N-1，p_N)

其中每一循环的计算内容写在从N层嵌套循环的最外层循环至最内层循环的不同线上，p_n是该组合中第n个非零幅脉冲的位置，U′(p_x，p_y)是取决于预先分配给位置p中的某一位置p_x的幅度S_px和预先分配给位置p中的某一位置p_y的幅度S_py的一个函数。

10.如权利要求9所述的方法，其中使所述给定比值最大化的步骤包含当下述不等式成立时至少跳过N层嵌套循环的最内层循环的步骤：

Σ_{n = 1}^{N - 1} S_{P_{n}} D_{P_{n}} < T_{D}

11.一种在码本中进行搜索以对声音信号编码的设备，其中：

-所述码本包含脉冲幅度/位置组合的一个集合，每个脉冲幅度/位置组合定义了L个不同的位置，并包括分配给该组合中各个位置p＝1，2，…，L的零幅脉冲和非零幅脉冲。

-每一非零幅脉冲采用q种可能的幅度之一；

-所述码本搜索实施装置包括：

用于与所述声音信号相关地从所述码本中预选脉冲幅度/位置组合的一个子集的装置；以及

用于仅搜索所述脉冲幅度/位置组合子集以对声音信号编码，从而由于仅搜索码本中一个脉冲幅度/位置组合的一个子集，而降低搜索复杂度的装置；

其中所述预先选择装置包括用于与所述声音信号相关地、在位置p＝1，2，…，L和所述q种可能幅度之间预先建立一个幅度/位置函数的装置；

该预先建立的装置包括给每一位置p预先分配q种可能幅度之一作为有效幅度的装置；以及

给每一位置p预先分配q种可能幅度之一的装置包括：

对所述声音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′的装置；

根据经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B的装置；以及

对所述的每一位置p，量化所述矢量B的幅度预估值B_p以得出准备为所述位置p选择的幅度的装置；以及

该搜索装置包括将搜索限制在所述码本中具有满足所述预先建立的函数的非零幅脉冲的脉冲幅度/位置组合的范围内的装置。

12.如权利要求11所述的设备，其中当脉冲幅度/位置组合中的每一个非零幅脉冲都具有与由预先建立的函数S_p预先分配给所述非零幅脉冲的位置p的幅度相等的幅度时，满足该预先建立的函数。

13.如权利要求11所述的设备，其中所述用于计算幅度预估矢量B的装置包括用于将归一化形式的经逆向滤波的目标信号D：

(1 - β) \frac{D}{| | D | |}

和归一化形式的已去除音调的残留信号R′：

β \frac{R^{'}}{| | R^{'} | |}

相加从而得到如下形式的幅度预估矢量B的装置：

B = (1 - β) \frac{D}{| | D | |} + β \frac{R^{'}}{| | R^{'} | |}

其中β是一个固定常数。

14.如权利要求13所述的设备，其中β是一个固定常数，其值位于0和1之间。

15.如权利要求11所述的设备，其中所述量化幅度矢量预估装置包括用于对所述每一位置p，采用下述表达式来量化所述矢量B的已经峰值归一化的幅度预估值B_p的装置：

B_{p} / \max_{n} | B_{n} |

其中分母

\max_{n} | B_{n} |

是一个归一化因子，表示非零幅脉冲的峰值幅度。

16.如权利要求11所述的设备，还包含用于根据一组脉冲位置的轨迹来限制码本中的组合的非零幅脉冲的位置p的装置。

17.如权利要求16所述的设备，其中每个轨迹的脉冲位置与其他轨迹的脉冲位置相互交织。

18.如权利要求16所述的设备，其中

-所述脉冲组合中的每一个都包括N个非零幅脉冲；

-限制位置p的装置包括用于将每一个非零幅脉冲的脉冲位置限制于所关联的轨迹的位置。

19.如权利要求11所述的设备，其中所述的每一脉冲幅度/位置组合包括N个非零幅脉冲，其中搜索搜索脉冲幅度/位置组合的所述子集的装置包括用于使分母为α² _k的给定比值最大化的装置，分母α² _k是通过N层嵌套循环根据下述关系式计算的：

α² _k＝U′(p₁，p₁)

+U′(p₂，p₂)+2U′(p₁，p₂)

+U′(p₃，p₃)+2U′(p₁，p₃)+2U′(p₂，p₃)

… … … …

+U′(p_N，p_N)+2U′(p₁，p_N)+2U′(p₂，p_N)+…+2U′(p_N-1，p_N)

其中每一循环的计算内容写在从N层嵌套循环的最外层循环到最内层循环的不同线内，其中p_n是所述组合中第n个非零幅脉冲的位置，U′(p_x，p_y)是取决于预先分配给位置p中的某一位置p_x的幅度S_px和预先分配给位置p中的某一位置p_y的幅度S_py的一个函数。

20.如权利要求19所述的设备，其中所述用于最大化所述给定比率的装置包括每当下述不等式成立时至少跳过N层嵌套循环的最内层循环的装置：

Σ_{n = 1}^{N - 1} S_{P_{n}} D_{P_{n}} < T_{D}

21.一种服务于一个被划分为多个小区的大地理区域的蜂窝通信系统，包括：

移动发射机/接收机单元；

分别位于所述小区内的蜂窝基台；

用于控制所述各蜂窝基台之间通信的装置；

位于一个小区内的每一移动单元与所述一个小区内的蜂窝基台之间的双向无线通信子系统，所述双向无线通信子系统包括在移动单元和蜂窝基台内都具备的(a)发射机，包括用于对语音信号编码的装置和用于发送编码语音信号的装置；和(b)接收机，包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置；

-其中所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置，并且其中所述语音信号编码参数产生装置包括权利要求11至20中的任何一个叙述的设备，用于在码本内进行搜索以产生至少一个所述语音信号编码参数，其中语音信号构成所述声音信号。

22.一种蜂窝网络元件，它包括：(a)发射机，包括用于对语音信号编码的装置和用于发送编码语音信号的装置；和(b)接收机，包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置；

-其中所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置，和其中所述语音信号编码参数产生装置包括权利要求11至20中的任何一个叙述的设备，用于在码本内进行搜索以产生至少一个所述语音信号编码参数，在其中语音信号构成所述声音信号。

23.一种蜂窝移动发射机/接收机单元，它包括：(a)发射机，包括用于对语音信号编码的装置和用于发送编码语音信号的装置；和(b)接收机，包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置；

-所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置，其中所述语音信号编码参数产生装置包括权利要求11至20中的任何一个叙述的设备，用于在码本内进行搜索以产生至少一个所述语音信号编码参数，其中语音信号构成所述声音信号。

24.一种服务于被划分为多个小区的大地理区域的蜂窝通信系统，包括移动发射机/接收机单元、分别位于所述小区内的蜂窝基台以及用于控制所述各蜂窝基台之间通信的装置；

-位于一个小区内的每一移动单元与所述一个小区内的蜂窝基台之间的双向无线通信子系统，所述双向无线通信子系统包括在移动单元和蜂窝基台内都具备的(a)发射机，包括用于对语音信号编码的装置和用于发送编码语音信号的装置；和(b)接收机，包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置；

-其中所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置，和其中所述语音信号编码参数产生装置包括权利要求11至20中的任何一个叙述的设备，用于在码本内进行搜索以产生至少一个所述语音信号编码参数，其中语音信号构成所述声音信号。