CN1185624C

CN1185624C - 具有自适应编码配置的语音编码系统

Info

Publication number: CN1185624C
Application number: CNB018156401A
Authority: CN
Inventors: H－Y·苏; Y·高
Original assignee: Conexant Systems LLC
Current assignee: Mandus Bide Technology LLC; Mindspeed Technologies LLC; MACOM Technology Solutions Holdings Inc
Priority date: 2000-09-15
Filing date: 2001-09-17
Publication date: 2005-01-19
Anticipated expiration: 2021-09-17
Also published as: US9269365B2; WO2002023535A1; US20080288246A1; US8650028B2; US7266493B2; KR20030046452A; US20070255561A1; US7072832B1; US8620647B2; US20090157395A1; EP1328924A1; US20090182558A1; US20080319740A1; US20090164210A1; WO2002023535A8; US8635063B2; CN1457485A; US20060089833A1; US20160104500A1; US9401156B2

Abstract

根据本发明的一个方面，基于是否在输入的语音信号间隔中检测到触发特性，来选择第一编码方案或第二编码方案。第一编码方案具有用于处理输入语音信号的音调预处理过程，以形成趋向于理想浊音和稳态特性的修改的语音信号。预处理过程使编码器充分利用了用于具有大量语音成分的输入语音的有效带宽、长期预测过程的优点。根据本发明的另一方面，第二编码方案将长期预测模式用于基于逐个子帧对音调编码。长期预测模式适合于一般语音的周期成分不是稳态的或小于完全周期并需要对自适应码本进行更大频率更新的场合，以便在长期预测过程下获得达到理想的感知质量的重构语音。

Description

具有自适应编码配置的语音编码系统

与相关申请的交叉参考

本申请是1998年11月18日提交的申请序号为09/154,660的申请的部分继续申请。以下共同未决并共同转让的美国专利申请已经在本申请同一天提交。所有这些申请涉及并进一步描述了本申请中公开的实施例的其它方面，在此一并结合以作为参考。

美国专利申请号_______，“可选择模式的语音编码系统”，代理人参考号：98RSS365CIP(10508.4)，2000年9月15日提交，且现在是美国专利号_____。

美国专利申请号_______，“向用于低位速率CELP的脉冲激励注入高频噪声”，代理人参考号：00CXT0650N(10508.6)，2000年9月1 5日提交，且现在是美国专利号______。

美国专利申请号______，“CELP语音编码中的短期增强”，代理人参考号：00CXT0666N(10508.6)，2000年9月15日提交，且现在是美国专利号_____。

美国专利申请号______，“用于对语音编码中的脉冲样激励进行动态脉冲位置跟踪的系统”，代理人参考号：00CXT0537N(10508.7)，2000年9月15日提交，且现在是美国专利号______。

美国专利申请号______，“带有时域噪声衰减的语音编码系统”，代理人参考号：00CXT0554N(10508.8)，2000年9月15日提交，且现在是美国专利号_____。

美国专利申请号______，“用于语音编码的自适应激励模式系统”，代理人参考号：98RSS366(10508.9)，2000年9月15日提交，且现在是美国专利号______。

美国专利申请号______，“使用具有不同分辨级别的自适应码本对语音信息进行编码的系统”，代理人参考号：00CXT0670N(10508.13)，2000年9月15日提交，且现在是美国专利号______。

美国专利申请号______，“用于编码和解码的码本表”，代理人参考号：00CXT0669N(10508.14)，2000年9月15日提交，且现在是美国专利号______。

美国专利申请号______，“用于传输编码的语音信号的比特流协议”，代理人参考号：00CXT0668N(10508.15)，2000年9月15日提交，且现在是美国专利号______。

美国专利申请号______，“用于过滤语音编码信号的频谱内容的系统”，代理人参考号：00CXT0667N(10508.16)，2000年9月15日提交，且现在是美国专利号______。

美国专利申请号______，“用于编码和解码语音信号的系统”，代理人参考号：00CXT0665N(10508.17)，2000年9月15日提交，且现在是美国专利号______。

美国专利申请号______，“通过子码本改进使用音调增强的系统”，代理人参考号：00CXT0569N(10508.19)，2000年9月15日提交，且现在是美国专利号______。

技术领域

本发明涉及用于对语音信号进行编码的具有自适应性编码配置的系统和方法。

背景技术

语音编码可用来增加无线系统的空中接口的通信量处理能力。无线服务供应商一般寻求对于分配的电磁波谱带宽，使由无线通信服务公司服务的有效用户数最大化，以便使用户收益最大化。无线服务供应商可向政府管理部门支付税费、许可证费及拍卖费，以获取或维持使用分配的频率带宽提供无线通信服务的权利。于是，无线服务供应商可以选择语音编码技术，以便由其在无线基础设施的投资中获得的最大回报。

一定的语音编码方案在编码站点存储了详细的数据库，并在解码站点复制了详细数据库。编码基础设施传输用于索引复制详细数据库保持空中接口可用带宽的基准数据。取代以在编码站点的整个语音序号调制载波信号，编码基础设施只是传输表示原始语音信号的较短的基准数据。解码基础设施使用较短的基准数据访问在解码站点的复制详细数据库，以便重构原始语音信号的复制品或表示。

如果在详细数据库中没有充分种类的激励向量来精确表示潜在原始语音信号下的语音，则语音信号的质量会受到影响。所支持的码标识符(例如二进制组合)的最大数是对可在详细数据库(例如码本)中表示的激励向量种类的一个限制。对于一定的语音信号成分，诸如短期预测成分，有限数目的可用激励向量可能无法使由激励向量表示的语音信号精确或清晰。于是，有时再生的语音可能是人造声音、失真的、不清晰的、或感知上令用户不愉快的。这样就需要提高再生语音的质量，同时遵循由在有限位数内传输基准或索引信息施加的带宽约束。

发明内容

一种编码器支持用于一个或多个语音信号帧的第一编码方案和第二编码方案。第一和第二编码方案定义了从编码器通过无线系统的空中接口传输的每帧的数据结构或每子帧的数据结构。对于无线系统的空中接口的一个信道来说，顺序的帧或帧组的数据结构可能影响语音信号的感知质量和整个编码速率。一种自适应编码配置涉及基于输入语音信号的分析或检验来选择编码方案，并根据选择的编码方案对输入的语音信号编码(例如音调预处理)。例如，该自适应编码配置涉及基于对输入语音信号的分析或检验，来选择和执行用于编码一帧或多帧语音信号的第一编码方案或第二编码方案。

检测器在一间隔期间检测语音信号是否具有触发特性(例如一般浊音或一般稳态成分)。选择器基于是否检测到触发特性来选择第一编码方案或第二编码方案，以便对与该间隔相关的帧编码。例如，如果在该间隔期间语音信号具有触发特性，则编码器可按照第一编码方案对与该间隔相关的帧中的语音信号编码。

第一编码方案具有音调预处理过程，用于处理输入的语音信号以形成趋向于理想浊音和稳态特性的修改的语音信号。音调预处理过程使编码器完全获得了用于具有大量语音成分的输入语音信号的有效带宽、长期预测过程的优点，否则这是不可能的。音调预处理过程从某些稳态和浊音输入语音成分形成修改的语音信号。修改的语音信号具有基本上稳态和基本上浊音质量，便于适用于基本上是浊音和稳态输入语音成分的长期预测编码过程的每帧有效位使用，同时保持语音的目标感知质量。

通过稍微偏好于用于输入的语音信号的较多的语音成分的自适应码本，音调预处理过程很好地适用于降低必须的最小带宽或通过空中接口传输信息的传输速率，而在语音信号的感知质量中没有造成明显的或实质的劣化。根据本发明的一个方面，与短期预测成分在固定码本中需要的激励向量的数目相比，基本上稳态和浊音输入的语音信号的长期预测成分，可以通过自适应码本中的较少数目的激励向量适当地表示。这样，编码器可使用由音调预处理过程和后继的编码节省的剩余位，提供帧中不同的位分配，以改进用于短期预测成分、残留语音成分或两者的固定码本的精确性或分辨率。

根据本发明的另一个方面，第二编码方案使长期预测模式逐个子帧地对音调编码。长期预测模式适合一般语音的周期成分不是稳态的或小于完全周期并需要从自适应码本中进行更大频率更新的场合，以便通过长期预测过程获得理想感知质量的再生语音。

结合以下附图和详细说明，本发明的其它系统、方法、特征和优点对于业内专业人员将是或将成为显而易见的。于是，所有这些附加的系统、方法、特征和优点都包括在本说明中，都在本发明的范围内，都受所附权利要求书的保护。

附图说明

参照以下附图能够更好地理解本发明。在所有不同的图示中相同的标号指示对应的部件或过程。

图1是表示编码器和解码器的示意性实施例的框图。

图2是用于对语音信号编码的方法的一个实施例的流程图。

图3是根据图2的音调预处理技术的流程图。

图4是另一编码方法的流程图。

图5是位分配过程的流程图。

图6和图7是分别用于示意性的较高速率编码方案和较低速率编码方案的位分配的图表。

具体实施方式

多速率编码器可以包括不同的编码方案，以便获得通过空中接口的不同的传输速率。每一不同的传输速率可使用一个或多个编码方案实现。最高的编码速率可称为全速率编码。较低的编码速率可称为半速率编码，其中半速率编码具有大约为全速率编码最大速率一半的最大传输速率。编码方案可包括通过合成分析的编码方案，其中原始的语音信号与合成语音信号比较，以便优化原始语音信号与合成语音信号之间的感知相似性或客观相似性。码激励线性预测编码方案(CELP)是通过合成分析编码方案的一例。

根据本发明，图1示出编码器11，它包括与分析部分12及自适应码本部分14连接的输入部分10。进而，自适应码本部分14连接到固定码本部分16。与自适应码本部分14和固定码本部分16两者相关的多路复用器60连接到发送器62。

发送器62和接收器66与通信协议一同表示无线相同的空中接口64。来自源或说话者的输入语音加到编码站点的编码器11。发送器62从编码站点向位于编码站点远处的解码站点的接收器66，发送电磁信号(例如射频或微波信号)。用表示输入语音信号的基准信息调制电磁信号。多路信号分离器68对基准信息进行多路信号分离，以便输入到解码器70。解码器70产生输入语音的复制或表示，称为在解码器70处的输出语音。

输入部分10具有输入端，用于接收输入的语音信号。输入端馈送给高通滤波器18，该滤波器衰减低于截止频率(例如80Hz)的输入语音信号，以便降低输入语音信号中的噪声。高通滤波器18馈送给感知加权滤波器20及线性预测编码(LPC)分析器30。感知加权滤波器20可馈送给音调预处理模块22和音调估计器32两者。进而，感知加权滤波器20可通过音调预处理模块22连接到第一累加器46的输入端。音调预处理模块22包括检测器24，用于检测触发语音特性。

在一实施例中，检测器24可涉及分类单元，该单元(1)标识噪声状清音语音及(2)在输入语音信号的间隔中在非稳态浊音与稳态浊音语音之间进行区分。检测器24可检测或便于检测输入语音信号的间隔中存在还是缺失触发特性(例如一般浊音和一般稳态语音成分)。在另一实施例中，检测器24可集成到音调预处理模块22和语音特性分类器26中，以便检测输入语音信号间隔中的触发特性。在另一实施例中，检测器24集成到语音特性分类器26中，而不是音调预处理模块22。其中检测器22是这样集成的，语音特性分类器26连接到选择器34上。

分析部分12包括LPC分析器30、音调估计器32、话音活动检测器28及语音特性分类器26。LPC分析器30连接到话音活动检测器28，用于检测输入语音信号中语音或寂静的存在。音调估计器32连接到模式选择器34，用于基于从检测器24接收的输入选择音调预处理过程或响应的长期预测过程。

自适应码本部分14包括连接到合成滤波器42(例如短期预测滤波器)的第一激励产生器40。进而，合成滤波器42馈送给感知加权滤波器20。加权滤波器20连接到第一累加器46的输入端，其中最小化器48连接到第一累加器46的输出端。最小化器48向第一激励产生器40提供反馈命令，以便使第一累加器46的输出端的误差信号最小化。自适应码本部分14连接到固定码本部分16，其中将第一累加器46的输出和误差信号一起馈送给第二累加器44的输入。

固定码本部分16包括连接到合成滤波器42(例如短期预测滤波器)的第二激励产生器58。进而，合成滤波器42馈送给感知加权滤波器20。加权滤波器20连接到第二累加器44的输入端，其中最小化器48连接到第二累加器44的输出端。残留信号出现在第二累加器44的输出端。最小化器48向第二激励产生器58提供反馈命令以便使残留信号最小化。

在另一实施例中，自适应码本部分14的合成滤波器42和感知加权滤波器20被组合为单个的滤波器。

在另一实施例中，固定码本部分16的合成滤波器42和感知加权滤波器20被组合为单个的滤波器。

在另一实施例中，编码器的三个感知加权滤波器20可由两个感知加权滤波器20代替，其中每一感知加权滤波器20与最小化器48之一的输入串联。于是，在以上的另一实施例中在输入部分10去掉了感知加权滤波器20。

根据图1，输入语音信号输入到输入部分10。输入部分10把语音分解为成分部分，这包括(1)输入语音信号的短期成分或包络，(2)输入语音信号的长期成分或音调滞后，以及(3)从输入语音信号去掉了短期成分和长期成分的残留成分。编码器11使用长期成分、短期成分和残留成分，以便搜索自适应码本36和固定码本50优选激励向量，把输入语音信号表示为基准信息以便通过空中接口64传输。

输入部分10的感知加权滤波器20具有第一时间对振幅的响应，它与输入语音信号的共振峰的第二时间对振幅的响应相反。共振峰表示关键振幅对语音信号的频率的响应，这刻画出与LPC分析器30的线性预测编码分析的一致的语音信号。调节感知加权滤波器20以补偿在基准语音信号(例如输入语音信号)与合成语音信号之间否则会出现的感知上引起的误差最小化中的缺陷。

将输入语音信号提供给线性预测编码(LPC)分析器30(例如LPC分析滤波器)，以确定用于合成滤波器42(例如短期预测滤波器)的LPC系数。将输入语音信号输入到音调估计器32。音调估计器32对于输入语音的浊音段确定音调滞后值和音调增益系数。输入语音信号的浊音段一般涉及周期性波形。

音调估计器32可进行至少一次开环音调分析，以便估计音调滞后。音调滞后是指在语音信号的浊音语音或话音成分中明显的重复成分(例如一般周期性波形)的时间度量。例如，音调滞后可表示一般周期性语音信号的相邻振幅峰值之间的时间持续。如图1所示，可基于加权的语音信号估计音调滞后。另外，音调滞后可表示为频率域中的音调频率，其中音调频率表示语音信号的第一谐波。

音调估计器32使出现在不同子帧中的信号之间的相关性最大化，以便为估计的音调滞后确定候选项。音调估计器32最好对音调滞后不同范围的组内的候选项进行划分。在使候选项之中的延迟规一化之后，音调估计器32可基于以下一个或多个因素从候选项中选择代表性的音调滞后：(1)先前的帧相对于与候选的音调滞后相关的后继的帧是浊音还是清音；(2)先前的帧中的音调滞后是否在后继帧的候选音调滞后的规定的范围内，以及(3)先前的两个帧是否是浊音，以及两个先前的音调滞后是否在后继帧的后继候选音调滞后的规定的范围内。音调估计器32向自适应码本36提供估计的代表性音调滞后，以便于在自适应码本36中开始搜索最好的激励向量。自适应码本部分11后来加细估计的代表性音调滞后，以便从自适应码本36中选择优化的或最好的激励向量。

语音特性分类器26最好执行语音分类过程，其中逐帧或逐个子帧在应用间隔期间把语音划分为各种类别。语音分类可包括一个或多个以下范畴：(1)寂静/背景噪声，(2)噪声状清音语音，(3)清音语音，(4)语音的过渡启动，(5)爆破语音，(6)非稳态浊音，以及(7)稳态浊音。稳态浊音语音表示语音的周期性成分，其中音调(频率)或音调滞后在考虑的间隔期间变化不大于最大允差。非稳态浊音语音是指一种语音的周期性成分，其中在考虑的间隔期间音调(频率)或音调滞后变化大于最大允差。噪声状清音语音是指可模拟为噪声信号诸如高斯噪声的语音的非周期性成分。语音的过渡启动是指在说话者寂静之后或语音信号的低振幅偏移之后立即出现的语音。语音分类器可接受原始输入语音信号、音调滞后、音调相关性数据及话音活动检测器数据，以便对于相关的间隔诸如帧或子帧把原始语音信号分类为上述类别之一。以上的语音类别可规定出现在输入语音信号的间隔中的一个或多个触发特性。在间隔中一定的触发特性的出现或缺失可便于为与该间隔相关的帧或子帧选择适当的编码方案。

第一激励产生器40包括自适应码本36和第一增益调节器38(例如第一增益码本)。第二激励产生器58包括固定码本50、第二增益调节器52(例如第二增益码本)及与固定码本50和第二增益调节器52相连的控制器54。固定码本50和自适应码本36定义了激励向量。一旦PLC分析器30确定了合成滤波器42的滤波器参数，编码器11就搜索自适应码本36及固定码本50，以便选择适当的激励向量。第一增益调节器38可用来对自适应码本36的激励向量的振幅分度。第二增益调节器52可用来对固定码本50中的激励向量的振幅分度。控制器54使用来自语音特性分类器26的语音特性，帮助从固定码本50或其中的子码本中适当选择最好的激励向量。

自适应码本36可包括表示波形段或其它能量表示的激励向量。自适应码本36的激励向量可适应再生或模拟语音信号的长期变化。自适应码本36先前的合成激励向量可输入到自适应码本36以确定自适应码本36中当前的激励向量的参数。例如，编码器可响应由自适应码本36、固定码本50或两者输出的过去的激励向量的输入，改变其码本中当前激励向量。最好基于过去合成的激励逐帧或逐子帧更新自适应码本36，虽然其它更新间隔可产生可接受的结果并属于本发明的范围。

自适应码本36中的激励向量与对应的自适应码本指标相关。在一实施例中，自适应码本指标可与音调滞后值等价。音调估计器32最初在优先的音调滞后值或优先的自适应指标邻域中确定代表性的音调滞后。优先的音调滞后值，与码本所过程一致，把第一累加器46输出端的误差信号降低到最小。自适应码本指标或音调滞后的粒度一般限制在固定位数，用于通过空中接口64传输以节省谱带宽。谱带宽可表示允许用于通信系统的一个或多个信道(例如下行信道、上行信道或两者)电磁波谱的最大带宽。例如，为了遵循带宽限制，在一个信道上可能需要通过话音信息的半速率编码以7位或全速率编码以8位传输音调滞后信息。这样，为了传送用于从自适应码本36中选择对应的激励向量的音调滞后值，如果使用7位可有128个状态，而使用8位可有256个状态。

编码器11可在逐帧或逐子帧的基础上采用来自自适应码本36的不同的激励向量。类似地，可逐帧改变或更新一个或多个合成滤波器42的滤波器系数。然而，在自适应码本36或固定码本50的每一优选激励向量的搜索或选择期间，滤波器系数最好保持固定。实际上，帧可表示大约20毫秒的时间间隔，而子帧可表示从大约5到10毫秒范围内的时间间隔，虽然帧和子帧的其它持续时间也属于本发明的范围。

自适应码本36与用于对自适应码本36中的激励向量的增益分度的第一增益调节器38相关。增益可表示为对应于对应的激励向量的标量。在另一实施例中，增益可表示为增益向量，其中增益向量与固定编码50或自适应码本36的激励向量不同段相关联。

第一激励产生器40连接到合成滤波器42。第一激励向量产生器40通过访问自适应码本36的适当的激励向量，提供合成语音信号的长期预测成分。基于来自第一激励产生器40的第一激励信号的输入，合成滤波器42输出第一合成语音信号。在一实施例中，第一合成语音信号具有由自适应码本36贡献的长期预测成分，以及由合成滤波器42贡献的短期预测成分。

第一合成信号与加权的输入语音信号比较。加权的输入语音信号是指至少由感知加权滤波器20滤波或处理过的输入语音信号。如图1所示，将第一合成信号和加权的输入语音信号输入到第一累加器46以获得误差信号。最小化器48接受该误差信号，并通过调节(即搜索和施加)自适应码本36中的激励向量的优先选择，通过调节第一增益调节器38(例如第一增益码本)的优先选择，或通过调节以上两种选择使误差信号最小化。激励向量和增益标量(或增益向量)的优先选择施加到通过空中接口64传输给解码器70的子帧或整个帧。在调节或搜索每一不同优先激励向量和增益向量期间，合成滤波器42的滤波器系数保持固定。

第二激励产生器58可基于从固定码本50中选择的激励向量产生激励信号。固定码本50可包括基于能量脉冲、脉冲位能脉冲、高斯噪声信号或任何其它适当的波形建模的激励向量。可使固定码本50的激励向量适应于再生输入语音信号的短期变化或谱包络变化。进而，固定码本50的激励向量可贡献于噪声状信号、过渡、残留成分，或其它不足以表示为长期信号成分的表示。

固定码本50中的激励向量与对应的固定码本指标74相关联。固定码本指标74是指数据库中的地址、表中的地址，或者是对存储激励向量的其它数据结构的引用。例如，固定码本指标74可表示激励向量存储在编码器11的电子存储器中的存储器单元或寄存器单元。

固定码本50与用于对固定码本50中的激励向量的增益分度的第二增益调节器52相关联。增益可表示为对应于对应的激励向量的标量。在另一实施例中，增益可表示为增益向量，其中增益向量与固定码本50或自适应码本36的激励向量不同段相关联。

第二激励产生器58连接到合成滤波器42(例如短期预测滤波器)，它可称为线性预测编码(LPC)滤波器。基于来自第二激励产生器58的的激励信号的输入，合成滤波器42输出第二合成语音信号。如图所示，将第二合成语音信号与从第一累加器46输出的差分误差信号进行比较。将第二合成信号和差分误差信号输入到第二累加器44，以便在第二累加器44的输出端获得残留信号。最小化器48接受残留信号，并通过调节(即搜索和施加)固定码本50中的激励向量的优先选择，通过调节第二增益调节器52(例如第二增益码本)的优先选择，或通过调节以上两种选择使残留信号最小化。激励向量和增益标量(或增益向量)的优先选择施加子帧或整个帧。在调节期间，合成滤波器42的滤波器系数保持固定。

LPC分析器30为合成滤波器42(例如短期预测滤波器)提供滤波器系数。例如，LPC分析器30可基于输入的基准激励信号(例如非激励信号)提供滤波器系数。虽然将差分误差信号施加到第二累加器44的输入端，但在另一实施例中，加权的输入语音信号可直接施加到第二累加器44的输入端，以达到与上述基本上相同的结果。

对固定码本50向量的优先选择最好使在对固定码本50的其它可能的向量选择中量化误差为最小。类似地，对自适应码本36激励向量的优先选择最好使在对自适应码本36的其它可能的向量选择中量化误差为最小。一旦根据图1作出优先的选择，多路复用器60多路复用固定码本指标74、自适应码本指标72、第一增益指示符(例如第一码本指标)、第二增益指示符(例如第二码本指标)以及与选择相关的滤波器系数，以便形成基准信息。滤波器系数可包括用于一个或多个以下滤波器的滤波器系数：合成滤波器42、感知加权滤波器20和其它可用的滤波器中的至少一个。

发送器62或收发器连接到多路复用器60。发送器62通过如图1所示的无线系统的电磁信号(例如射频或微波信号)，从编码器11向接收器66发送基准信息。多路复用的基准信息可被发送，以便逐子帧、逐帧或者在与带宽限制及感知语音质量目标相符的其它适当的时间间隔对输入语音信号进行更新。

接收器66连接到用于对基准信息进行信号分离的信号分离器68。进而，信号分离器68连接到用于把基准信息解码为输出语音信号的解码器70。如图1所示，解码器70接受通过空中接口64从编码器11发送来的基准信息。解码器70使用接收的基准信息生成优先的激励信号。基准信息便于复制自适应码本及复制固定码本对编码器70处的码本的访问。解码器70的一个或多个激励产生器向复制合成滤波器施加优先激励信号。在编码器11和解码器70处对于滤波器系数使用相同的值或近似相同的值。由复制合成滤波器和复制自适应码本的贡献获得的输出语音信号是输入到编码器11的输入语音信号的复制品或表示。这样，基准数据通过空中接口64以有效带宽方式被发送，因为与输入到输入部分10的原始语音信号相比基准数据由较少的位、字、或字节组成。

在另一实施例中，一定的滤波器系数不是从编码器向解码器发送，其中滤波器系数是在语音信息通过空中接口64发送前建立的，或根据内部对称状态和编码器与解码器的算法来更新。

图2示出了根据本发明用于对输入语音信号编码的一种方法的流程图。图2的方法在步骤S10开始。一般来说，步骤S10和步骤S12处理输入语音信号触发特性的检测。触发特性可包括任何由语音特性分类器26、检测器24或两者处理或分类的特性。如图2所示，在步骤S10和S12，触发特性包括输入语音信号的一般浊音和一般稳态语音成分。

在步骤S10，检测器24或编码器11确定输入的语音信号间隔是否包含一般浊音语音成分。浊音语音成分是指语音信号的周期部分或准周期部分。准周期部分可表示某种程度偏离理想周期浊音语音成分的波形。输入语音信号的间隔可表示为帧、帧组、帧的一部分、相邻帧的重叠部分、或任何其它适用于评价输入语音信号成分特性的时间周期。如果间隔包括一般浊音语音成分，则该方法以步骤S12继续。如果不包含一般浊音语音成分，则该方法以步骤S18继续。

在步骤S12，检测器24或编码器11确定在间隔内浊音语音成分是否是一般稳态或某种程度稳态。一般浊音语音成分是一般稳态或某种程度稳态的，如果满足以下一个或多个条件：(1)浊音语音信号的主频或音调滞后在帧或间隔内的变化不大于最大范围(例如预定的百分比)；(2)在帧或间隔内语音信号的谱内容一般保持不变或变化不大于最大范围；以及(3)在帧或间隔内语音信号的能量水平一般保持不变或变化不大于最大范围。然而，另一实施例中，在认为浊音语音成分一般是稳态之前最好满足以上至少两个条件。一般来说，最大范围或或多个范围可通过输入语音信号的感知语音编码测试或波形特性来确定，这足以支持输入语音信号的精确再生。在音调滞后的场合，最大范围可表示为相对于浊音语音成分的中心或主频率的频率范围，或表示为相对于浊音语音成分的中心或主音调滞后的时间范围。如果间隔内浊音语音成分一般是稳态的，则该方法以步骤S14继续。如果间隔内浊音语音成分一般不是稳态的，该方法以步骤S18继续。

在步骤S14，音调预处理模块22执行音调预处理过程，以调整输入的语音信号用于编码。调整是指人工最大化(例如数字信号处理)自然出现的一般稳态浊音语音成分的稳态性质。如果输入语音信号自然出现的一般稳态浊音成分不同于理想的稳态浊音成分，则使音调预处理适合于把自然出现的一般稳态浊音成分引向理想的稳态浊音成分。音调预处理可调整输入信号以便与另外情形相比使信号更趋于稳态浊音状态，以便降低表示和通过空中接口传输编码语音信号所必须的带宽。另外，音调预处理过程可便于使用不同的话音编码方案，这些方案特色是在固定码本指标74与自适应码本指标72之间进行存储单元的不同的分配。使用音调预处理，不同的帧类型和附带的位分配可有助于提高感知语音质量。

音调预处理过程包括音调跟踪方案，该方案可在一个或多个离散时间间隔内修改输入信号的音调滞后。离散时间间隔可指帧、帧的一部分、子帧、子帧组、采样、或采样组。音调跟踪过程试图在多个帧期间或基于整体从一相邻的帧到另一帧，把输入的语音信号音调滞后模拟为音调滞后对时间的一系列连续的段。于是，音调预处理过程可以按符合音调轨迹整体模式的方式降低一帧内局部波动。

音调预处理可根据几种可选用的技术来实现。根据第一技术，步骤S14可涉及以下过程：对输入的语音信号估计所估计的音调轨迹。估计的音调轨迹表示在超过一帧的时间周期上音调整体模式的估计。可将音调轨迹估计为对于音调轨迹符合最低累积通路误差，其中一部分音调轨迹与每一帧对累积通路误差的贡献相关联。通路误差提供了实际的音调轨迹(即被测量的)与估计的音调轨迹之间差别的度量。修改输入的语音信号以便比其它情形更好地遵循或匹配估计的音调轨迹。

将输入的语音信号模拟为音调滞后对时间的一系列段，其中每一段占据一离散时间间隔。如果暂时逼近其它段的主题段具有比暂时逼近段较短的滞后，则相对于其它段在时间上移动主题段，以便产生符合估计的音调轨迹的更一致的音调。使用时间上重叠的相邻的段可避免移动的段与主题段之间的不连续性。在一例子中，基于相邻段的重叠区域内插或平均可用来以连续的方式结合相邻段的边缘。

根据第二种技术，音调预处理进行作为语音输入信号的感知加权语音信号的连续时间扭曲。对于连续扭曲，从输入的语音信号或加权语音信号的至少一个过去的帧和当前帧中推导出输入音调轨迹。音调预处理模块22基于语音信号的多个帧确定输入音调轨迹，并改变与至少一个对应的采样相关联的音调滞后中的变量以便跟踪输入音调轨迹。

修改加权的语音信号以符合输入音调轨迹。对组成加权语音信号的采样逐个音调周期地进行修改。音调周期表示输入语音信号的音调的周期。如果一个音调周期先前的采样在时间接近落到后面的采样(例如相邻的音调周期的)，则先前的和后来的采样持续时间可能重叠，并被配置为避免音调轨迹重构/修改的段之间的不连续性。时间扭曲可对符合最大合计延迟的加权语音信号的采样引入可变延迟。例如，最大合计延迟可以是加权语音信号的20个采样(2.5ms)。

在步骤S18，编码器11向由检测器24在步骤S10和S12确定的一般不是浊音或一般不是稳态的输入语音信号或加权语音信号，施以预测编码过程。例如，编码器11施加预测编码过程，该过程包括更新过程，用于对于子帧或其它小于帧持续时间的持续时间更新自适应码本36音调滞后指标。如这里所使用的，时间片在持续时间上小于帧的持续时间。步骤S18自适应码本指标的更新频率大于适合表示一般浊音和一般稳态语音所需更新频率。

步骤S14之后在步骤S16，编码器11向与间隔相关联的预处理语音成分施加预测编码(例如代码激励线性预测编码或其变种)。预测编码包括从自适应码本36和固定码本50确定适当的激励向量。

图3示出与图2的步骤S14相关或进一步对其定义的音调预处理方法。图3的方法以步骤S50开始。

在步骤S50，对每一音调周期，音调预处理模块22估计感知加权输入语音信号或其它输入语音信号的估计音调周期相当的时间段大小。后继段的段大小可跟踪音调周期中的变化。

在步骤S52，音调估计器32对与该时间段相关联的感知加权输入语音信号确定输入音调轨迹。输入音调轨迹包括一系列相继帧的每帧的音调滞后的估计。

在步骤S54，音调预处理模块22建立目标信号，用于修改(例如时间扭曲)加权输入语音信号。在一例子中，音调预处理模块22建立目标信号用于基于所确定的输入音调轨迹修改时间段。在另一例子中，目标信号基于在步骤S52所确定的输入音调轨迹和由先前执行图3的方法先前修改的语音信号。

在步骤S56，音调预处理模块22修改(例如扭曲)时间段以获得修改的段。为了给出修改的段，修改段的开始点固定在过去，并移动修改段的结束点以获得对音调周期的最佳代表适配。末端的移动延伸或压缩与段大小相关联的感知加权信号的时间。在一例子中，修改段开始处的采样几乎不移动，且最大移动出现在修改段的末端。

音调复合(主脉冲)一般表示音调周期感知上最重要的部分。音调周期的音调复合定位在朝向修改段的末端，以便允许扭曲对感知上最重要的部分有最大的贡献。

在一实施例中，通过内插符合音调轨迹的先前修改的加权语音的采样及适当的时间窗口(例如汉明加权Sinc窗口)从时间段获得修改的段。加权函数强调音调复合并减弱音调复合之间的噪声。加权是根据音调预处理分类通过增加对较高周期性段的音调复合的强调适配的。加权可根据音调预处理分类通过增加对较高周期性段的音调复合的强调而变化。

修改的段被映射到感知加权输入语音信号的采样上，以调节符合目标信号的感知加权输入语音信号，产生修改的语音信号。映射定义包括感知加权输入语音信号采样的扭曲函数和时间偏移函数。

根据图3的方法的一实施例，音调估计器32、预处理模块22、选择器34、语音特性分类器26和话音活动检测器28共同支持音调预处理加权语音信号。语音特性分类器26可获得音调预处理控制参数，用来控制图3的音调预处理方法一个或多个步骤。

音调预处理控制参数可分类为对应的类别成员。可以有几类控制参数。第一类用来重置音调预处理以防止在音调预处理期间引起累积的延迟超过最大合计的延迟。第二类、第三类、和第四类指示话音强度或振幅。第二类到第四类的话音强度彼此不同。

第一类可允许或暂停步骤S56的执行。如果帧的第一类或其它分类指示帧主要是背景噪声或低音调相关性的清音语音，则音调预处理模块22重置音调预处理过程，以防止累积的延迟超过最大延迟。于是，主题帧在步骤S56不变，且音调预处理的累积延迟被重置为零，使得下一个帧能够被适当改变。如果帧的第一类或其它分类主要是脉冲状清音语音，则在步骤S56累积的延迟被保持而没有任何信号的扭曲，且输出信号是符合输入信号累积延迟的简单的时间偏移。

对于音调预处理控制参数的其余的分类，执行音调预处理算法以便在步骤S56扭曲语音信号。其余的音调预处理控制参数可控制在步骤S56采用的扭曲程度。

在步骤S56修改语音之后，音调估计器32可估计音调增益和对于修改的语音信号的音调相关性。基于音调周期确定音调增益和音调相关性。估计音调增益以使目标信号和最终修改的信号之间的均方误差最小化。

图4包括根据本发明对语音信号编码的另一方法。图4的方法类似于图2的方法，所不同在于图4的方法在步骤S20参照强化的自适应码本，而不是标准自适应码本。强化的自适应码本与标准自适应码本相比，具有对应于更大数目的可能的激励向量的更大数目的量化间隔。在可能需要的场合，图1的自适应码本可看作是强化的自适应码本或标准自适应码本。图2和图4中相同的标号指示相同的元件。

已经结合图2对步骤S10、S12和S14进行了描述。以步骤S20开始，在步骤S10或步骤S12之后，编码器施加预测编码方案。步骤S20的预测编码方案包括强化的自适应码本，它比标准自适应码本具有较大的存储规格和较高的分辨率(即较低的量化误差)。于是，图4的方法通过更多选择来自强化的自适应码本的激励向量增进了输入语音再生的精确性。

在步骤S14之后的步骤S22，编码器11向与间隔相关的预处理语音成分施加预测编码方案。编码使用带有较小存储规格的标准的自适应码本。

图5示出根据本发明对语音信号编码的方法。该方法以步骤S11开始。

一般来说，步骤S11和步骤S13处理输入语音信号中的触发特性的检测。触发特性可包括通过语音特性分类器26、检测器24或两者处理或分类的任何特性。如图5所示，在步骤S11和步骤S13触发特性包括语音信号的一般浊音和一般稳态语音成分。

在步骤S11，解码器24或编码器11确定语音信号的帧是否包含一般浊音语音成分。一般浊音语音成分是指语音信号的周期性部分或准周期性部分。如果输入语音信号的帧包含一般浊音语音，则该方法以步骤S13继续。然而，如果语音信号帧不包含浊音语音成分，则该方法以步骤S24继续。

在步骤S13，检测器24或编码器11确定帧内浊音语音成分是否一般是稳态。如果在帧或间隔内浊音语音信号的主频或音调滞后变化不大于最大范围(例如预定的百分比)，则浊音语音成分一般是稳态。最大范围可表示为相对于浊音语音成分中心或主频的频率范围，或表示为相对于浊音语音成分中心或主音调滞后的时间范围。最大范围可通过输入语音信号的感知语音编码测试或波形确定。如果浊音语音成分在帧内是稳态的，则该方法以步骤S26继续。否则，如果浊音语音成分在帧内一般不是稳态的，则该方法以步骤S24继续。

在步骤S24，编码器11指定帧作为具有第二数据结构的第二帧类型。第二帧类型的第二数据结构的示意性例子示于图6，这将在稍后更详细地说明。

在步骤S24的另一种步骤中，如果可使用较高的编码速率(例如全速率编码)，则编码器11指定帧为第二帧类型，并如果可使用较小的编码速率(例如半速率编码)，则编码器11指定帧为第四帧类型。编码速率的可用性可取决于无线通信系统上语音信号再生的目标质量模式。第四帧类型的一示意性的例子示于图7，这将在稍后更详细地描述。

在步骤S26，编码器指定帧为具有第一数据结构的第一帧类型。第一帧类型的一示意性例子示于图6，这将在稍后更详细地描述。

在步骤S26的另一种步骤中，如果可应用较高的编码速率(例如全速率编码)，则编码器11指定帧为第一帧类型，并且如果可应用较小的编码速率(例如半速率编码)，则编码器11指定帧为第三帧类型。编码速率的可应用性可取决于无线通信系统语音信号再生的目标质量模式。第三帧类型的一示意性例子示于图7，这将在稍后更详细地说明。

在步骤S28，与对于第二帧类型的自适应码本指标72相比，编码器11对于第一帧类型的自适应码本指标72，每帧分配较少数目的存储单元(例如位)。进而，与对第二帧类型固定码本指标74相比，编码器对第一帧类型固定码本指标74，分配较大数存储单元(例如位)。以上存储单元的分配可对第二帧类型强化长期预测编码，并对第一帧类型降低与固定码本相关联的量化误差。与第一帧类型的存储单元的第一分配相比，第二帧类型的每帧存储单元的第二分配，向自适应码本指标分配更大数目的存储单元，以便于基于逐个子帧而不是逐帧地进行长期预测编码。换言之，第二编码方案与第一编码方案相比，具有每帧较大数目的存储单元(例如位)的音调轨迹。与第二分配相比，每帧存储单元的第一分配对固定码本指标分配更大数目的存储单元，以降低与固定码本指标相关联的量化误差。

第一帧类型与第二帧类型之间每帧存储单元分配中的差可根据一分配比值来定义。如这里所使用的，分配比值(R)等于自适应码本指标的每帧存储单元数(A)除以自适应码本指标的每帧存储单元数(A)加上固定码本指标的每帧存储单元数(F)。分配比值在数学上表示为R＝A/(A+F)。于是第二帧类型的分配比值大于第一帧类型的分配比值，以促使再生语音的强化的感知质量。

在自适应码本指标与固定码本指标之间第二帧类型具有不同于第一帧类型的平衡以便使再生语音信号的感知质量最大化。因为第一帧类型携带一般稳态浊音数据，故较少数目自适应码本指标的存储单元(例如位)即可提供符合目标感知标准的原始语音信号的真实再生。反之，需要较大数目的存储单元适当表示第二帧类型的残余语音特性，以便符号目标感知标准。因为语音信号的长期信息一般是均匀周期性的，因而对第二帧自适应码本指标需要较少数目的存储单元。这样，对于第一帧类型，语音信号的过去采样对未来语音信号的估计提供了可靠的基础。存储单元的总数与存储单元较少数目之间的差提供了位或字剩余，这可用于对第一帧类型强化固定码本50的性能，或降低空中接口所使用的带宽。通过改进对语音信号中噪声状语音成分和过渡的建模精度，固定码本能够提高语音的质量。

步骤S28之后在步骤S30中，编码器11通过无线通信系统的空中接口64，从编码器11向解码器70发送对于自适应码本指标72和过固定码本指标74每帧分配的存储单元(例如位)。编码器11可包括速率确定模块，用于确定自适应码本指标72和固定码本指标74通过空中接口64所需的传输速率。例如，速率确定模块可接收来自对每一对应的时间间隔语音分类的语音分类器26的输入，对于无线通信系统的特定用户台的语音质量模式选择，以及来自音调预处理模块22的分类输出。

图6和图7分别示出较高速率编码方案(例如全速率)和较低速率编码方案(例如半速率)。如图所示，较高速率编码方案提供了通过空中接口64每帧较高的传输速率。较高速率编码方案支持第一帧类型和第二帧类型。较低速率编码方案支持第三帧类型和第四帧类型。第一帧、第二帧、第三帧和第四帧表示通过无线系统的空中接口64从编码器11向解码器60所传输的数据结构。类型标识符71是区分帧类型的符号或位表示。例如，在图6中类型标识符用来区分第一帧类型与第二帧类型。

数据结构提供了用于表示代表语音信号的基准数据的格式。基准数据可包括滤波器系数指示器76(例如LSF)、自适应码本指标72、固定码本指标74、自适应码本增益指标80及固定码本增益指标78，或其它如前所述的基准数据。先前参照图1曾经说明过上述基准数据。

第一帧类型一般表示稳态浊音语音。一般稳态浊音语音的特征在于，语音信号的长期成分一般是周期性波形或准周期波形。第二帧类型用来对不同于一般稳态浊音语音的语音编码。按这里所使用的，不同于稳态浊音语音的语音是指残余的语音。残余的语音包括语音通特性其它类别之中的语音的噪声成分，爆破音，启动过渡，清音语音。第一帧类型和第二帧类型最好在帧内包括相等数目的子帧(例如4子帧)。第一帧和第二帧的每一个可大约为20毫秒长，虽然也可采用其它不同的帧持续时间实施本发明。第一帧和第二帧每一个包含大约相等的存储单元总数(例如170位)。

标有第一编码方案97的列定义了第一帧类型的位分配和数据结构。标有第二编码方案99的列定义了第二帧类型的位分配和数据结构。就分配给固定码本指标74和自适应码本指标72存储单元的平衡来说，第一帧的存储单元分配不同于第二帧中存储单元的分配。具体来说，第二帧类型比第一帧类型向自适应码本指标72分配较多的位。反之，第二帧类型比第一帧类型对固定码本指标74分配较少的位。在一个例子中，第二帧类型对自适应码本指标72分配每帧26位，而对固定码本指标74分配每帧88位。同时，第一帧类型向自适应码本指标72分配每帧8位，而只向固定码本指标74分配每帧120位。

滞后值对自适应码本36内的激励向量项提供基准。第二帧类型比第一帧类型适于传输每单位时间(例如帧)较大数目的滞后值。在一实施例中，第二帧类型逐个子帧传输滞后值，而第一帧类型逐帧传输滞后值。对于第二帧类型，自适应码本36指标或数据可根据以下的差分编码方案从编码器11和解码器70发送。第一滞后值作为八位代码字传输。第二滞后值作为五位代码字传输，其值表示第一滞后值与绝对第二滞后值之间的差。第三滞后值是作为表示滞后的绝对值的八位代码字传输。第四滞后值作为表示第三滞后值和绝对第四滞后值之间的差的五位代码字传输。于是，尽管传输的位的原始数目有波动，因为差分编码的优点，第一滞后值到第四滞后值的分辨率基本上是均匀的。

对于图7中所示较低速率编码方案，编码器11支持中间列所述的第三编码方案103，及最右侧列所述的第四编码方案101。第三编码方案103与第四帧类型相关联。第四编码方案101与第四帧类型相关联。

如图7中间列所示，第三帧类型是第二帧类型的变种。与第二帧类型相比，第四帧类型配置为通过空中接口64以较小速率进行传输。类似地，如图7最右列所示，第三帧类型是第一帧类型的变种。于是，在说明书中所公开的任何实施例中，在较低速率编码技术或较低感知质量足够情形下，第三编码方案103可代替第一编码方案99。类似地，在本说明书公开的任何实施例中，在较低速率编码技术或较低感知质量足够情形下，第四编码方案101可代替第二编码方案97。

与第二帧类型相比，第三帧类型配置为通过空中接口64以较小速率传输。对于图6的较低速率编码方案每帧的总位数，小于对于图7的较高速率编码方案的每帧总位数，以便于较低的传输速率。例如，对于较高速率编码方案的总位数可大约等于170位，而对于较低速率编码方案的位数可大约等于80位。第三帧类型最好每帧包括三个子帧。第四帧类型最好每帧包括两个子帧。

按可比较的方式，在第三帧类型与第四帧类型之间的位分配，不同于存储单元在第一帧类型和第二帧类型内分配的差别。与第三帧类型相比，第四帧类型对于自适应码本指标72每帧具有较大数目的存储单元。例如，第四帧类型对自适应码本指标72分配每帧14位，而第三帧类型每帧分配7位。对于第三帧类型每帧总位与每帧自适应码本36位之间的差别表示剩余。剩余可用来相对于第四帧类型改进第三帧类型固定码本50的分辨率。在一例子中，第四帧类型具有每帧30位的自适应码本36分辨率，而第三帧类型具有每帧39位的自适应码本36的分辨率。

实际上，编码器可使用不同于较高速率编码方案和较低速率编码方案的一个或多个附加的编码方案，以便通过空中接口64从编码器站点到解码器站点进行语音信号通信。例如，附加的编码方案可包括四分之一速率编码方案和八分之一速率编码方案。在一实施例中，附加的编码方案不使用自适应码本36数据或固定码本50的数据。而是附加的编码方案只从编码器向解码器传输滤波器系数数据和能量数据。

第二帧类型对第一帧类型的选择，以及第四帧类型对第三帧类型的选择与检测器24、语音特性分类器26、或两者相关。如果检测器24确定语音在间隔期间一般是稳态浊音，则第一帧类型和第三帧类型可用于编码。实际上，可基于质量模式选择和语音信号内容来选择第一帧类型和第三帧类型用于编码。质量模式可表示由无线服务的服务供应商确定的语音质量水平。

根据本发明的一种方式，用于对输入语音信号编码的语音编码系统，在自适应码本指标与固定码本指标之间，依据输入语音信号的触发特性分配帧的存储单元。存储单元不同的分配便于提高再生语音的感知质量，同时保持无线系统空中接口可用带宽。

描述本发明的进一步的技术细节在以下共同未决申请中阐述：美国申请序号09/154,660，1998年11月18日提交，标题为“SPEECH ENCODERADAPTIVELY APPLYING PITCH PREPROCESSING WITH CONTINUOUSWARPING”，该申请在此一并结合以资参考。

虽然已经描述了本发明的各种实施例，但对业内一般专业人员明显的是在本发明的范围内可能有更多的实施例和实现方式。于是，除了依据所附权利要求及其等价物之外本发明不受限制。

Claims

1.一种语音编码系统包括：

检测器，用于检测输入语音信号在一间隔期间一般是否具有触发特性；

编码器，支持可用于与该间隔相关联的帧的语音信号的第一编码方案和第二编码方案至少之一，第一编码方案具有预处理过程，用于处理输入的语音信号以形成趋向于一般理想的浊音和稳态特性的修改的语音信号；以及

选择器，用于基于在输入语音信号的间隔期间是否检测到触发特性而选择第一编码方案和第二编码方案之一；

其中该第一编码方案使用用于以所选择的速率对输入语音信号进行编码的第一帧类型，且该第二编码方案使用用于以该相同的所选择速率对输入语音信号进行编码的第二帧类型，其中该第二帧类型不同于该第一帧类型。

2.根据权利要求1的语音编码系统，其中触发特性包括语音信号的一般浊音和一般稳态语音成分。

3.根据权利要求1的语音编码系统，其中如果所述检测器确定在帧期间语音信号一般是稳态且一般是周期性的，则选择器选择第一编码方案。

4.根据权利要求1的语音编码系统，其中如果检测器确定在帧期间语音信号一般是非稳态的，则选择器选择第二编码方案。

5.根据权利要求1的语音编码系统，还包括：

感知加权滤波器，用于对输入语音信号滤波；

音调-预处理模块，具有连接到该感知加权滤波器输出端的输入端，该音调-预处理模块确定一目标信号，用于使加权语音信号时间扭曲。

6.根据权利要求1的语音编码系统，还包括音调-预处理模块，用于基于语音信号的多个帧确定输入音调轨迹，并改变与采样相关联的音调滞后中的变化以跟踪输入音调轨迹。

7.根据权利要求1的语音编码系统，其中第一编码方案具有在固定码本指标与自适应码本指标之间每帧存储单元的第一分配，第二编码方案具有在固定码本指标与自适应码本指标之间每帧存储单元的第二分配，其中该第一分配不同于该第二分配。

8.根据权利要求7的语音编码系统，其中与存储单元的第一分配相比，每帧存储单元的第二分配向自适应码本指标分配较大数目的存储单元，以便于基于逐个子帧进行长期预测编码。

9.根据权利要求7的语音编码系统，其中与存储单元的第二分配相比，每帧存储单元的第一分配向固定码本指标分配较大数目的存储单元，以降低与固定码本指标相关联的量化误差。

10.根据权利要求7的语音编码系统，其中第二编码方案与第一编码方案相比具有较高的分配比值，分配比值由分配给自适应码本指标的存储单元数除以分配给自适应码本指标的存储单元数与分配给固定码本指标的存储单元数之和来确定。

11.根据权利要求7的语音编码系统，其中所选择用于对语音信号进行编码的速率是全速率，其中第一编码方案使用用于以全速率对语音信号进行编码的第一帧类型，而第二编码方案使用用于以全速率对语音信号进行编码的第二帧类型。

12.根据权利要求7的语音编码系统，其中如果所选择的速率为较高速率编码，则第一编码方案使用第一帧类型且第二编码方案使用第二帧类型，并如果所选择的速率为较低速率编码，则第一编码方案使用第三帧类型且第二编码方案使用第四帧类型。

13.根据权利要求1的语音编码系统，其中所述触发特性是要检测输入语音信号在所述间隔期间一般是否具有一般浊音和一般稳态特性，其中所述第二编码方案具有长期预测过程，用于基于逐个子帧处理输入的语音信号。

14.根据权利要求13的语音编码系统，其中如果所述检测器确定在帧期间语音信号一般不是周期性的，则所述选择器选择第二编码方案。

15.根据权利要求13的语音编码系统，其中如果所述检测器确定在帧期间语音信号一般是非稳态的，则所述选择器选择第二编码方案。

16.根据权利要求13的语音编码系统，其中第二编码方案与第一编码方案相比具有每帧较大位数的音调轨迹，以表示音调轨迹。

17.根据权利要求1的语音编码系统，其中所述第一帧类型为滤波器系数指示器分配25位，为类型指示器分配1位，为自适应码本指标分配8位，为固定码本指标分配120位，为自适应码本增益分配6位，以及为固定码本增益分配10位。

18.根据权利要求17的语音编码系统，其中所述第二帧类型为滤波器系数指示器分配27位，为类型指示器分配1位，为自适应码本指标分配26位，为固定码本指标分配88位，以及为自适应码本增益和固定码本增益分配28位。

19.根据权利要求1的语音编码系统，其中所述第二帧类型为滤波器系数指示器分配27位，为类型指示器分配1位，为自适应码本指标分配26位，为固定码本指标分配88位，以及为自适应码本增益和固定码本增益分配28位。

20.根据权利要求12的语音编码系统，其中所述第一帧类型为滤波器系数指示器分配25位，为类型指示器分配1位，为自适应码本指标分配8位，为固定码本指标分配120位，为自适应码本增益分配6位，以及为固定码本增益分配10位。

21.根据权利要求20的语音编码系统，其中所述第三帧类型为滤波器系数指示器分配21位，为类型指示器分配1位，为自适应码本指标分配7位，为固定码本指标分配39位，为自适应码本增益分配4位，以及为固定码本增益分配8位。

22.一种语音编码方法，包括以下步骤：

检测输入语音信号在一间隔期间是否具有触发特性；

基于所述触发特性的检测，选择第一编码方案和第二编码方案之一，应用于对于与该间隔相关的帧的输入语音信号；

如果在输入语音信号中检测到触发特性，根据第一编码方案处理该输入的语音信号，以形成趋向于一般理想的浊音和稳态特性的修改的语音信号；以及

其中该第一编码方案使用用于以所选择的速率对输入语音信号进行编码的第一帧类型，而该第二编码方案使用用于以该相同的所选择速率对输入语音信号进行编码的第二帧类型，其中该第二帧类型不同于该第一帧类型。

23.根据权利要求22的方法，其中所述检测步骤包括检测输入语音信号在所述间隔期间一般是否具有作为触发特性的一般浊音及一般稳态成分。

24.根据权利要求22的方法，还包括这样的步骤，即支持第一编码方案和第二编码方案，该第一方案具有在固定码本指标与自适应码本指标之间每帧存储单元的第一分配，该第二编码方案具有在固定码本指标与自适应码本指标之间每帧存储单元的第二分配，其中该第二分配不同于该第一分配。

25.根据权利要求22的方法，还包括这样的步骤，即如果在所述间隔期间没有检测到触发特性，则根据第二编码方案的长期预测过程，基于逐个子帧处理输入语音信号。

26.根据权利要求22的方法，其中所述检测步骤包括检测输入语音信号在所述间隔期间一般是否具有一般浊音及一般稳态特性，其中所述第二编码方案具有长期预测过程，用于基于逐个子帧处理输入的语音信号。

27.根据权利要求22的方法，其中所述第一帧类型为滤波器系数指示器分配25位，为类型指示器分配1位，为自适应码本指标分配8位，为固定码本指标分配120位，为自适应码本增益分配6位，以及为固定码本增益分配10位。

28.根据权利要求27的方法，其中所述第二帧类型为滤波器系数指示器分配27位，为类型指示器分配1位，为自适应码本指标分配26位，为固定码本指标分配88位，以及为自适应码本增益和固定码本增益分配28位。

29.根据权利要求22的方法，其中所述第二帧类型为滤波器系数指示器分配27位，为类型指示器分配1位，为自适应码本指标分配26位，为固定码本指标分配88位，以及为自适应码本增益和固定码本增益分配28位。