CN103460284B

CN103460284B - 音频信号音轨脉冲位置的编码与译码

Info

Publication number: CN103460284B
Application number: CN201280016442.4A
Authority: CN
Inventors: 汤姆·贝克斯特伦; 纪尧姆·福奇斯
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2011-02-14
Filing date: 2012-02-10
Publication date: 2016-05-18
Anticipated expiration: 2032-02-10
Also published as: EP2676267A1; TR201903388T4; ES2715191T3; CA2827156C; EP3471092B1; EP3471092A1; PL2676267T3; HK1245987B; EP3239978B1; ZA201306841B; PL3471092T3; CN103460284A; SG192747A1; AR085361A1; CA2827156A1; RU2013142068A; US9595263B2; PT3239978T; BR112013020700B1; MX2013009345A

Abstract

提出一种用以译码一编码音频信号的装置，其中，一或多个音轨是与该编码音频信号相关联，这些音轨中的每一者具有多个音轨位置及多个脉冲。该装置包含一脉冲信息译码器（110）及一信号译码器（120）。该脉冲信息译码器（110）是适用以译码多个脉冲位置，其中这些脉冲位置中的每一者指示这些音轨中的一者的这些音轨位置中的一者来指示该音轨的这些脉冲中的一者的位置，及其中该脉冲信息译码器是经配置来藉由使用指示这些音轨中的至少一者的音轨位置总数的一音轨位置数目、指示这些音轨中的至少一者的脉冲总数的一总脉冲数目、及一个状态数目而译码这些多个脉冲位置。该信号译码器（120）是适用于藉由使用这些多个脉冲位置及与该编码音频信号相关联的多个预测滤波器系数而产生一合成音频信号来译码该编码音频信号。

Description

音频信号音轨脉冲位置的编码与译码

技术领域

本发明是有关于音频处理及音频编码领域，更明确言之，是有关于音频信号中音轨脉冲位置的编码与译码。

背景技术

音频处理及/或音频编码已经按照许多方式进展。在音频编码中，线性预测编码器扮演重要角色。当编码音频信号（例如包含语音的音频信号）时，线性预测编码器信道通常编码音频信号的频谱包络的表示型态。为了达成该目的，线性预测编码器可决定预测滤波器系数来以编码形式表示该声音的频谱包络。然后，滤波器系数可由线性预测译码器用来通过使用这些线性预测编码器产生合成音频信号而译码该编码音频信号。

线性预测编码器的重要实例为ACELP编码器（ACELP=代数代码激励线性预测编码器）。ACELP编码器广为人使用，例如用于USAC（USAC=统一语音与音频编码）且可具有额外应用领域，例如用于LD-USAC（低延迟统一语音与音频编码）。

ACELP编码器信道是通过决定预测滤波器系数而编码音频信号。为了达成更佳编码，ACELP编码器基于欲编码的音频信号，及基于已经决定的预测滤波器系数而决定残差信号（又称目标信号）。残差信号例如可以是差信号，表示欲编码的音频信号与按照预测滤波器系数及可能地按照音准（pitch）分析所得的适应性滤波器系数编码的该信号部分之间的差值。然后ACELP编码器针对编码该残差信号。为了达成该目的，编码器编码代数码本参数，这些代数码本参数是用来表示该残差信号。

为了编码该残差信号，使用代数码本。通常代数码本包含多个音轨，例如四个音轨各自包含16音轨位置。于此种配置中，藉个别代数码本可表示共计4×16=64样本位置，相对应于欲编码的音频信号的一子帧的样本数目。

码本的这些音轨可以交插，使得码本的音轨0可表示该子帧的样本0、4、8、…、60，使得码本的音轨1可表示该子帧的样本1、5、9、…、61，使得码本的音轨2可表示该子帧的样本2、6、10、…、62，及使得码本的音轨3可表示该子帧的样本3、7、11、…、63。各个音轨可有固定数目的脉冲。或者每个音轨的脉冲数目可改变，例如取决于其它状况而改变。脉冲例如可以是正或负，例如可以+1（正脉冲）或0（负脉冲）表示。

为了编码该残差信号，当编码时，码本配置可经选择使得最佳表示该残差信号的其余信号。为了达成该目的，可用脉冲可位于最佳地反映出欲编码的信号位置的适当音轨位置。此外，可指定相对应脉冲为正或为负。

在译码器侧，ACELP译码器将首先解码代数码本参数。ACELP译码器也可解码适应性码本参数。为了决定代数码本参数，ACELP译码器可针对代数码本的各个音轨决定多个脉冲位置。此外，ACELP译码器也可译码在一音轨位置的脉冲是正或负脉冲。再者，ACELP译码器也可解码适应性码本参数。基于此项信息，ACELP译码器通常产生激励信号。然后，ACELP译码器施加这些预测滤波器系数于该激励信号来产生合成音频信号而获得译码音频信号。

在ACELP中，音轨上的脉冲通常是编码如下。若该音轨具有长度16，及若此一音轨上的脉冲数目为1，则可通过其位置（4位）及符号（1位）共计5位编码脉冲位置。若该音轨具有长度16及脉冲数目为2，则第一脉冲是通过其位置（4位）及符号（1位）编码。至于第二脉冲，则只需编码位置（4位），原因在于若该第二脉冲是在第一脉冲左方则可选择第二脉冲的符号为正，若是在第一脉冲右方则可选择第二脉冲的符号为正，及若是在第一脉冲的相同位置则可选择第二脉冲为与第一脉冲相同符号。因此，总计共需9位来编码两个脉冲。比起分开地各通过5位编码脉冲位置，因而针对每一对脉冲节省1位。

编码比2更大的脉冲数目，可成对地编码脉冲，及若脉冲数为奇数，则分开地编码最末脉冲。如此则例如针对5脉冲的音轨，需要9+9+5=23位。若有4音轨，则要求4×23=92位来编码具有4音轨及每个音轨5脉冲的长度64的子帧。但若位数可以更进一步减少则更有价值。

若能提供具有改良编码或译码构思的编码装置及相应的译码装置将极有价值，该装置具有针对脉冲信息表示型态使用较少位而以改良方式来编码或译码脉冲信息的手段，如此将例如减低传输各自编码地音频信号的传输速率，及再者，如此将例如减少储存各自编码地音频信号需要的储存空间。

发明内容

因此本发明的一目的是提供音频信号的音轨脉冲的编码及译码的改良构思。本发明的目的可通过根据权利要求1的译码装置、根据权利要求9的编码装置、根据权利要求13的解码方法、根据权利要求14的编码方法、及根据权利要求15的计算机程序达成。

依据实施例，假设一个状态数目可供译码装置使用。再者假设指示与该编码音频信号相关联的至少一个音轨的音轨位置总数的音轨位置数目、及指示至少一个音轨的脉冲数目的总脉冲数目可供本发明的译码装置使用。较佳地，该音轨位置数目及该总脉冲数目是可供与该编码音频信号相关联的各个音轨使用。

举例言之，具有4音轨有5脉冲，各自可达成粗略地6.6×10^21状态，依据实施例，可按照73位编码，比较前述现有技术的编码器使用92位编码，更有效约21%。

首先，提供一种构思，如何以有效方式编码一音频信号的一音轨的多个脉冲位置。后文中，该构思扩延成允许不仅编码一音轨的脉冲位置，同时也允许编码该脉冲是正或负。此外，然后该构思扩延成允许以有效方式针对多个音轨编码脉冲信息。此等构思同等适用于译码器侧。

此外，实施例又更基于发现若编码策略使用预定数目的位，使得在各个音轨上有相同脉冲数目的任一种配置皆要求相等数目的位。若可用位数目为固定，则可能直接地选定使用该给定位量可编码多少个脉冲，如此允许以预定质量编码。此外，使用此种办法，无需尝试不等量脉冲直到达成期望的位率，反而可以直接地选择正确脉冲量，因而减低复杂度。

基于前述假设，可编码及/或译码一音频信号帧的一音轨的多个脉冲位置。

虽然可采用本发明来编码或译码任一种音频信号，例如语音信号或音乐信号，本发明特别可用于编码或译码语音信号。

在另一实施例中，脉冲信息译码器又更适用以使用音轨位置数目、总脉冲数目、及状态数目来译码多个脉冲符号，其中这些脉冲符号中的每一个指示多个脉冲中的一者的符号。信号译码器可适用以还使用多个脉冲符号，通过产生合成音频信号而译码该编码音频信号。

依据又一实施例，其中一或多个音轨可包含至少一个最末音轨及一或多个其它音轨，该脉冲信息译码器可适用以从该状态数目产生一第一子状态数目及一第二子状态数目。该脉冲信息译码器可经配置来基于该第一子状态数目而译码这些脉冲位置的一第一群组，及该脉冲信息译码器更可经配置来基于该第二子状态数目而译码这些脉冲位置的一第二群组。这些脉冲位置的该第二群组可只包含指示该最末音轨的音轨位置的脉冲位置。这些脉冲位置的该第一群组可只包含指示一或多个其它音轨的音轨位置的脉冲位置。

依据另一实施例，脉冲信息译码器可经配置来通过将该状态数目除以f（p_k,N）而获得一整数部分及一余数作为除法结果来产生该第一子状态数目及该第二子状态数目，其中该整数部分为该第一子状态数目，及其中该余数为该第二子状态数目，其中p_k指示针对一或多个音轨中的每一个的脉冲数目，及其中N指示针对一或多个音轨中的各一者的音轨位置数目。此处，f（p_k,N）乃返回于长度N具有p_k脉冲的音轨中可达成的状态数目的函数。

在另一实施例中，该脉冲信息译码器可适用以进行一测试比较该状态数目或一已更新状态数目与一阈值。

该脉冲信息译码器可适用以通过比较该状态数目或一已更新状态数目是否大于、大于或等于、小于、或小于或等于该阈值而进行该测试，及其中该脉冲信息译码器还适用取决于该测试结果而更新该状态数目或一已更新状态数目。

在一实施例中，该脉冲信息译码器可经配置来针对这些多个音轨中的一者的各个音轨位置，比较该状态数目或该已更新状态数目与该阈值。

依据一实施例，该脉冲信息译码器可经配置来划分这些音轨中的一者成为包含这些多个音轨位置中的至少一个音轨位置的一第一音轨区划，及成为包含这些多个音轨位置中的其他剩余音轨位置的一第二音轨区划。该脉冲信息译码器可经配置来基于该状态数目而产生一第一子状态数目及一第二子状态数目。此外，该脉冲信息译码器可经配置来基于该第一子状态数目，译码与该第一音轨区划相关联的脉冲位置的一第一群组。再者，该脉冲信息译码器可经配置来基于该第二子状态数目，译码与该第二音轨区划相关联的脉冲位置的一第二群组。

依据一实施例，提出一种编码一音频信号的装置。该装置包含适用以决定与该音频信号相关联的多个预测滤波器系数的一信号处理器，用以基于该音频信号及这些多个预测滤波器系数而产生一残差信号。此外，该装置包含一脉冲信息编码器适用以编码与一或多个音轨相关的多个脉冲位置来编码该音频信号，这些一或多个音轨是与该残差信号相关联。这些音轨中的各一者具有多个音轨位置及多个脉冲。这些脉冲位置中的各一者指示这些音轨中的一者的这些音轨位置中的一者来指示该音轨的这些脉冲中的一者的位置。该脉冲信息编码器是经配置来通过产生一状态数目而编码这些多个脉冲位置，使得这些脉冲位置仅基于该状态数目、指示这些音轨中的至少一者的音轨位置总数的一音轨位置数目、及指示这些音轨中的至少一者的脉冲总数的一总脉冲数目才能被译码。

依据另一实施例，该脉冲信息编码器可适用以编码多个脉冲符号，其中这些脉冲符号中的各一者指示这些多个脉冲中的一者的一符号。该脉冲信息编码器还可经配置来通过产生该状态数目而编码这些多个脉冲符号，使得这些脉冲符号近基于该状态数目、指示这些音轨中的至少一者的音轨位置总数的该音轨位置数目、及该总脉冲数目就可被译码。

在一实施例中，该脉冲信息编码器是经配置来针对这些音轨中的一者的各个音轨位置，将一整数值加至针对于一音轨位置的各个脉冲的一中间数目来获得该状态数目。

依据另一实施例，该脉冲信息编码器可经配置来划分这些音轨中的一者成为包含这些多个音轨位置中的至少一个音轨位置的一第一音轨区划，及成为包含这些多个音轨位置中的其他剩余音轨位置的一第二音轨区划。此外，该脉冲信息编码器可经配置来编码与该第一区划相关联的的一第一子状态数目。再者，该脉冲信息编码器可经配置来编码与该第二区划相关联的的一第二子状态数目。此外，该脉冲信息编码器可经配置来组合该第一子状态数目与该第二子状态数目而获得该状态数目。

附图说明

图1显示依据一实施例用以译码一编码音频信号的装置，

图2显示依据一实施例用以编码一音频信号的装置，

图3显示针对具有两个无符号脉冲及三个音轨位置的一音轨的全部可能配置，

图4显示针对具有一个有符号脉冲及两个音轨位置的一音轨的全部可能配置，

图5显示针对具有两个有符号脉冲及两个音轨位置的一音轨的全部可能配置，

图6为例示说明一实施例的流程图，阐释依据一实施例藉脉冲信息译码器所进行的处理步骤，及

图7为例示说明一实施例的流程图，该流程图阐释依据一实施例藉脉冲信息编码器所进行的处理步骤。

具体实施方式

图1例示说明译码一编码音频信号的装置，其中一或多个音轨是与该编码音频信号相关联，这些音轨中的各一者具有多个音轨位置及多个脉冲。

该装置包含一脉冲信息译码器110及一信号译码器120。该脉冲信息译码器110是适用以译码多个脉冲位置。这些脉冲位置中的各一者指示这些音轨中的一者的这些音轨位置中的一者来指示该音轨的这些脉冲中的一者的位置。

该脉冲信息译码器110是经配置来通过由使用指示这些音轨中的至少一者的音轨位置总数的一音轨位置数目、指示这些音轨中的至少一者的脉冲总数的一总脉冲数目、及一个状态数目而译码这些多个脉冲位置。

该信号译码器120是适用于通过由使用这些多个脉冲位置及与该编码音频信号相关联的多个预测滤波器系数而产生一合成音频信号来译码该编码音频信号。

状态数目为已经依据后述实施例通过编码器编码的数目。状态数目例如包含在一精简表示型态中有关多个脉冲位置的信息，该表示型态例如为要求少数位的表示型态，及当有关该音轨位置数目及总脉冲数目的信息在该译码器为可利用时可被译码的表示型态。

在一实施例中，该音频信号的一个音轨或各个音轨的该音轨位置数目及/或总脉冲数目在该译码器为可利用，原因在于该音轨位置数目及/或总脉冲数目为不变的静态数值且为接收器所已知。举例，针对各个音轨，该音轨位置数目可以总是为16，及总脉冲数目可以总是为4。

在另一实施例中，该音频信号的一个音轨或各个音轨的该音轨位置数目及/或总脉冲数目例如可通过编码装置而明确地传输至该译码装置。

在又一实施例中，译码器可决定该音频信号的一个音轨或各个音轨的该音轨位置数目及/或总脉冲数目，该决定方式是通过分析并不显式地陈述该音轨位置数目及/或总脉冲数目的其它参数，而从这些其它参数可推导出该音轨位置数目及/或总脉冲数目。

在其它实施例中，译码器可分析可利用来推导出该音频信号的一个音轨或各个音轨的该音轨位置数目及/或总脉冲数目的其它数据。

在又一实施例中，该脉冲信息译码器可适用也解码一脉冲为正脉冲或负脉冲。

在另一实施例中，该脉冲信息译码器又更可适用以译码脉冲信息，包含有关多个音轨的脉冲的信息。脉冲信息例如可以是有关于一音轨中的脉冲位置信息及/或一脉冲为正脉冲或负脉冲的信息。

图2例示说明编码音频信号的装置，包含信号处理器210及脉冲信息编码器220。

信号处理器210是适用以决定与该音频信号相关联的多个预测滤波器系数，用以基于该音频信号及这些多个预测滤波器系数而产生一残差信号。

脉冲信息编码器220是适用以编码与一或多个音轨相关的多个脉冲位置来编码该音频信号。这些一或多个音轨是与由信号处理器210所产生的该残差信号相关联。这些音轨中的各一者具有多个音轨位置及多个脉冲。此外，这些脉冲位置中的各一者指示这些音轨中的一者的这些音轨位置中的一者来指示该音轨的这些脉冲中的一者的位置。

该脉冲信息编码器220是经配置来通过产生一状态数目而编码这些多个脉冲位置，使得这些脉冲位置仅基于该状态数目、指示这些音轨中的至少一者的音轨位置总数的一音轨位置数目、及指示这些音轨中的至少一者的脉冲总数的一总脉冲数目就能被译码。

后文中，呈示有关通过产生一状态数目而编码脉冲位置及可能地编码脉冲符号（正脉冲或负脉冲）的本发明的实施例的基本构思。

本发明的实施例的编码原理是基于下述发现，若考虑在具有n个音轨位置的一音轨中的k个脉冲的全部可能配置的状态列举，则是足以编码一音轨的脉冲的实际状态。通过尽可能少数位编码此种状态，提供期望的精简编码。藉此，呈示状态列举的构思，其中脉冲位置及可能也脉冲符号的各丛表示一个状态，及各个状态是独特地列举。

图3针对简单情况例示说明此点，在该处阐释全部可能的配置，此时考虑具有两个脉冲及三个音轨位置的一音轨。两个脉冲可位在相同音轨位置。在图3的实例中，不考虑脉冲的符号（例如脉冲是正或负），例如于此一实例中，全部脉冲皆可视为正脉冲。

在图3中，例示说明针对位在具有三个音轨位置（图3中：音轨位置1、2及3）的一音轨中两个无方向性脉冲的全部可能配置。只有六个不同的可能状态（图3中标示为0至5），描述脉冲如何分布在该音轨。藉此，使用0至5的范围的状态数目来描述所呈示的实际配置是足够的。举例，若图3实例的状态数目具有数值（4），且若译码器知晓编码方案，则译码器可获得结论状态数目=4，表示该音轨具有一个脉冲在音轨位置0，及另一个脉冲在音轨位置2。于是在图3的实例中，3位即足以编码状态数目来识别图3的实例的六个不同状态中的一者。

图4例示说明针对位在具有两个音轨位置（图4中：音轨位置1及2）的一音轨中一个方向性脉冲的全部可能配置。图4中考虑脉冲的符号（例如脉冲是正或负）。有四个不同的可能状态（图4中标示为0至3），描述脉冲如何分布在该音轨，也描述其符号（正或负）。使用0至3的范围的状态数目来描述所呈示的实际配置是足够的。举例，若图4实例的状态数目具有数值（2），且若译码器知晓编码方案，则译码器可获得结论状态数目=2，表示该音轨具有一个脉冲在音轨位置1，及该脉冲为正脉冲。

图5例示说明又另一情况，在该处阐释当考虑具有两个脉冲及两个音轨位置的一音轨时的全部可能配置。脉冲可位在相同音轨位置。在图5所示实例中，考虑脉冲的符号（例如脉冲是正或负）。假设在同一个音轨位置的脉冲具有相同符号（例如在同一个音轨位置的音轨脉冲是全正或全负）。

图5中例示说明位在具有两个音轨位置（图5中：音轨位置1及2）的一音轨中两个有符号脉冲（例如脉冲是正或负）的全部可能配置。只有八个不同的可能状态（图5中标示为0至7），描述脉冲如何分布在该音轨。藉此，使用0至7的范围的状态数目来描述所呈示的实际配置是足够的。举例，若图5实例的状态数目具有数值（3），且若译码器知晓编码方案，则译码器可获得结论状态数目=3，表示该音轨具有一个脉冲在音轨位置0，及另一个脉冲在音轨位置1而该脉冲为负。于是在图5的实例中，3位即足以编码状态数目来识别图5的实例的八个不同状态中的一者。

在ACELP中，残差信号可通过固定数目的有符号脉冲编码。如前述，脉冲例如可分布在四个交插音轨，使得音轨0含有位置mod（n,4）==0，音轨=1含有位置mod（n,4）==1，等等。各个音轨可有经预先界定的有符号单位脉冲数目，脉冲可重迭，但重迭时脉冲有相同符号。

通过编码脉冲，须达成从脉冲位置及其符号映射至使用最小可能的位数量的表示型态。此外，脉冲编码须具有固定的位耗用量，亦即任何脉冲丛具有相等数目的位。

各音轨首先独立地编码，然后各个音轨的状态被组合成一个数目，表示整个子帧的状态。此方法给予数学上最佳的位耗用，给定全部状态有相等机率，及位耗用量是固定的。

状态列举构思可运用不同状态丛的精简表示型态说明：

设欲编码的残差信号为x_n。假设考虑例如代数码本的四个交插音轨，则第一音轨具有样本x₀、x₄、x₈、…x_N-4，第二音轨具有样本x₁、x₅、x₉、…x_N-3等。假设第一音轨是使用一个有符号单位脉冲量化及T=8，故音轨长度为2（T=欲编码的残差信号长度（样本）。若t=8，及若4音轨是用来编码残差信号，则4音轨中的各一者具有2音轨位置。举例，第一音轨可考虑具有两个音轨位置x0及x4。则第一音轨的脉冲出现在下列中的任一者：

x0	+1	-1	0	0
					x4	0	0	+1	-1

此一配置有四个不同状态。

同理，若第一音轨有两个脉冲，第一音轨具有两个音轨位置x0及x4。则脉冲可分配在下列脉冲丛：

x0	+2	-2	+1	+1	-1	-1	0	0
									x4	0	0	+1	-1	+1	-1	+2	-2

因而此一配置有8状态。

若残差信号的长度扩延至T=12，则4音轨各自有3音轨位置。第一音轨获得多一个样本，现在有音轨位置x0、x4及x8，使得具有：

上表表示若x8=0（x8不具脉冲）则针对x0及x4有8不同状态；若x8=1（x8具正脉冲）则针对x0及x4有不同状态；若x8=-1（x8具负脉冲）则针对x0及x4有不同状态；若x8=2（x8具两个正脉冲）则针对x0及x4有一个状态；及若x8=-2（x8具两个负脉冲）则针对x0及x4有一个状态。

此处，从先前二表获得第一列的状态数目。通过将状态数目加至第一列，发现此一配置共有18状态。

在T=12实例中，5位足够编码全部18个不同的可能状态。然后编码器例如从范围[0,…,17]选定状态数目来指定18配置中的一者。若译码器知晓编码方案，例如若译码器知晓哪个状态数目表示哪个配置，则可针对一音轨译码脉冲位置及脉冲符号。

后文中，将提供依据实施例的适当编码方法及相对应译码方法。依据实施例提供编码装置，其是经配置来执行后文呈示的编码方法中的一者。此外，依据额外实施例提供译码装置，其是经配置来执行后文呈示的译码方法中的一者。

在实施例中，为了产生状态数目或译码状态数目，可计算具有p个脉冲的N个音轨位置的可能配置数目。

脉冲可加符号，及可采用递归公式，计算针对具有N个音轨位置及p个有符号脉冲（脉冲可以是正或负，但在相同音轨位置的脉冲具有相同符号）的一音轨的状态数目f(p,N)，其中递归公式f(p,N)定义为：

公式1：

f (p, N) = Σ_{k = 0}^{p} f (k, N - 1) f (p - k, 1)

初始条件为

因具有一或多个脉冲的单一位置要求一个位（2状态）来用于符号。递归公式是用于全部不同丛的摘要。

亦即，给定p个脉冲，目前位置可具有q_N=0至p个脉冲，故其余N-1个位置有p-q_N个脉冲。在目前位置及其余N-1位置的状态数目相乘来获得具有这些脉冲组合的状态数目，组合经求和来获得状态总数。

在实施例中，递归函数可通过迭代重复算法计算，其中递归是以迭代重复置换。

因f(p,N)的评估就实时应用而言在数值上相当复杂，依据若干实施例，可采用询查表来计算f(p,N)。依据若干实施例，该表可已经离线计算。

后文中，提出额外构思用于状态数目的编码与译码：

设f(p,N)表示具有p个有符号脉冲的N个音轨位置的可能配置数目。

脉冲信息编码器现在可分析音轨：若在该音轨的第一位置不具有脉冲，则其余N-1个位置具有p个有符号脉冲，为了描述此丛，只需要f(p,N-1)个状态。

否则，若第一位置具有一或多个脉冲，则脉冲信息编码器可定义总状态是大于f(p,N-1)。

然后，在脉冲信息译码器，脉冲信息译码器例如可始于最末位置，及比较该状态与一阈值例如f(p,N-1)。若该状态为较大，则脉冲信息译码器可决定最末位置具有至少一个脉冲。然后脉冲信息译码器可从该状态扣除f(p,N-1)来获得已更新状态数目及将剩余脉冲数目减1来更新状态。

否则，若最末位置没有脉冲，则脉冲信息译码器可将剩余位置数目减1。重复此一程序直到没有脉冲剩下提供无符号的脉冲位置。

为了也将脉冲符号列入考虑，脉冲信息编码器可以最低状态位编码脉冲。在另一实施例中，脉冲信息编码器可以最高剩余状态位编码该符号。但以最低位编码脉冲符号为佳，原因在于就整数计算而言更容易处理。

在脉冲信息译码器中，若找到给定位置的第一脉冲，则脉冲符号是由最末位决定。然后，剩余状态向右移位一步骤来获得已更新状态数目。

在一实施例中，脉冲信息译码器是经配置来应用下列译码算法。在此译码算法中，在逐一步骤方法中，针对各个音轨位置例如前后相续，状态数目或已更新状态数目是与阈值（例如与f（p,k-1））比较。

依据一实施例，提供脉冲信息译码器算法：

依据一实施例，有关脉冲信息，脉冲信息编码器是经配置来施加下列编码算法。脉冲信息编码器进行与脉冲信息译码器的相同步骤但顺序相反。

依据一实施例，提供脉冲信息编码器算法：

通过使用此一算法编码状态数目，针对音轨中的一者的各个音轨位置在一音轨位置的各个脉冲，脉冲信息编码器将一整数值加至中间数目（例如中间状态数目），例如算法完成前的状态数目，来获得状态数目（的数值）。

脉冲信息的编码及译码办法，例如脉冲位置及脉冲符号可称作为“逐一步骤编码”及“逐一步骤译码”，原因在于音轨位置由编码及译码方法被视为前后相续，亦即逐一步骤。

图6为流程图例示说明一实施例，阐释依据一实施例由脉冲信息译码器所进行的处理步骤。

在步骤610，目前音轨位置k是设定为N。此处，N表示一音轨的音轨位置数目，其中音轨位置是编码从1至N。

在步骤620，测试k是否大于或等于1，亦即是否有任何剩余音轨位置尚未考虑。若k不大于或等于1，则全部音轨位置皆已考虑及结束处理。

否则在步骤630，测试状态是否大于或等于f（p,k-1）。若为是，则位置k至少存在有一个脉冲。若为否，则在音轨位置k不存在有（额外）脉冲，及处理继续步骤640，在该处k减1，使得将考虑下个音轨位置。

但若状态是大于或等于f（p,k-1），处理继续步骤642，一脉冲置于音轨位置k，及然后在步骤644，状态是通过将该状态减f（p,k-1）更新。然后在步骤650，测试目前脉冲是否为在音轨位置k第一个发现的脉冲。若为否，则在步骤680，剩余脉冲数目减1，及处理继续步骤630。

但若目前脉冲是在音轨位置k第一个发现的脉冲，处理继续步骤660，在该处测试s的最低位是否经设定。若为是，则在此音轨位置的脉冲符号是设定为负（步骤662），否则在此音轨位置的脉冲符号是设定为正（步骤664）。两种情况下，在步骤670然后状态向右移位一阶（s:=s/2）。然后，剩余脉冲数目也减1（步骤680），及处理继续步骤630。

图7为流程图例示说明一实施例，该流程图阐释依据一实施例由脉冲信息编码器所进行的处理步骤。

在步骤710，所找到的脉冲p的数目是设定为0，状态s是设定为0，及所考虑的音轨位置k是设定为1。

在步骤720，测试k是否小于或等于N，亦即是否仍有音轨位置尚未考虑（此处，N表示：一音轨的音轨位置数目）。若k是不小于或等于N，则全部音轨位置皆已经考虑及结束处理。

否则在步骤730，测试至少一个脉冲是否存在于位置k。若否，处理继续步骤740，在该处k增加1，使得将考虑下个音轨位置。

但若至少一个脉冲是存在于音轨位置k，则在步骤750测试目前考虑的脉冲是否为音轨位置k的最末脉冲。若否，则于步骤770，状态s是藉f（p,k-1）加至状态s更新，所找到的脉冲p数目加1，及处理继续步骤780。

若目前考虑的脉冲是音轨位置k的最末脉冲，则在步骤750的后，处理继续步骤755，及状态向左移位一阶（s:=s*2）。然后在步骤760，测试脉冲符号是否为负。若是，则s的最低位是设定为1（步骤762）；否则s的最低位是设定为0（或不变）（步骤764）。然后在两种情况下，进行步骤770，在该处状态s是通过f（p,k-1）加至状态s更新，所找到的脉冲p数目加1，及处理继续步骤780。

在步骤780，测试在位置k是否有另一脉冲。若是，则处理继续步骤750；否则，处理继续步骤740。

后文中，提供编码多个音轨的状态的联合状态数目的构思。

不幸，在多种情况下，单音轨的可能状态范围并非2的倍数，因而各状态的二进制表示型态无效。举例，若可能的状态数目为5，则需3位来以二进制数目表示。但若有4音轨各有5个状态，则整个子帧有5×5×5×5=625状态，可以10位（而非4×3=12位）表示。如此相当于每个音轨2.5位而非3位，如此每音轨节省0.5位，或相当于每个子帧节省2位（占总位耗用量的20%）。因此重要地是组合各音轨状态成为一个联合状态，原因在于藉此可减少二进制表示型态的无效率。注意相同方法可用于传输的任何数目。举例，因各个子帧可有一状态表示脉冲位置，及各帧可有例如4子帧，此等状态可组合成为一个联合状态。

给定子帧例如有4音轨，则通过联合编码各音轨状态，可减少位耗用而改良效率。举例，给定各音轨有p_k脉冲，及各音轨具有长度N，例如有N个音轨位置，则各音轨状态是在0至f(p_k,N)-1的范围。然后各音轨的状态s_k可经组合成为子帧的联合状态s，利用公式（假设每个子帧有4个音轨）

公式2：

s＝[[s₀f(p₀,N)+s₁]f(p₁,N)+s₂]f(p₂,N)+s₃

然后各音轨的状态可在译码器决定，通过将联合状态除以f(p_k,N)，藉此余数为最末音轨状态，及整数部分为其余音轨的联合状态。若音轨数目非为4，则方便于上式中适当地加或减项数。

注意，当每个音轨的脉冲数目大时，则可能的状态数目变大。举例，有4个音轨，每个音轨有6个脉冲，及音轨长度N=16，则状态为83-位数目，超过常规中央处理单元（CPU）上的最大二进制数目长度。接着须采取若干额外步骤来使用标准方法以极长整数评估上式。

当状态机率假设为相等时，也观察此一方法等于音轨状态的算术编码。

前文已经呈示逐一步骤办法用以编码及译码一音轨的脉冲信息，例如一音轨的脉冲位置及可能脉冲符号。其它实施例提供另一方法，称作为“分裂与征服”办法。

脉冲信息编码器是经配置来施加分裂与征服办法，将一音轨划分为两个音轨区划x₁及x₂，可考虑为两个向量，其中x=[x₁x₂]。基本构想是分开编码二向量x₁及x₂，及然后以下式组合二者

公式3：

s (x) = s (x_{1}) + f (p_{1}, N_{1}) s (x_{2}) + Σ_{k = 0}^{p_{1} - 1} f (k, N_{1}) f (p - k, N - N_{1})

上式中，须注意当脉冲数目为已知时，换言之，当向量分别地具有p₁及p₂=p-p₁脉冲时，s（x₁）及s（x₂）为向量x₁及x₂的状态。为了将向量x₁中具有0至p₁-1脉冲的全部状态列入考虑，须将加总项加至上式。

如上算法/公式可施加来通过施加以下两个前处理步骤来编码交插音轨脉冲。首先，设向量x_trackk包含音轨k上的全部样本，藉定义x=[x_track1,x_track ₂,x_track3,x_track4]而合并此等向量。观察如此只是样本的重新排序，使得来自音轨1的全部样本是置于第一组等等。

其次，注意每个音轨的脉冲数目通常为固定数目。接着若音轨1经常性有p₁脉冲，则针对全部值k≠p₁，音轨1上的状态数目为f(k,N₁)=0。此乃陈述音轨1没有任何状态不具p₁脉冲的另一个方式。正式地然后将状态数目公式定义为：

公式4：

针对具有p_k脉冲的完整音轨×_trackk，状态数目为（N=N_trackk）

否则，针对N>1

f (p, N) = Σ_{k = 0}^{p} f (k, N - 1) f (p - k, N - N_{1})

以及针对N=1：

通过样本的重新排序及使用如上针对状态数目的定义（公式4），可通过公式3计算全部音轨的联合状态。注意因状态数目大半含有零，当合并音轨状态时，公式3的总和为零。因此合并二音轨是与公式2相同。同理，方便显示采用两个办法，合并全部4音轨（或5）也获得相同结果。

依据一实施例，重新排序可用作为编码器的前处理步骤。在另一实施例中，重新排序可整合入编码器。同理依据一实施例，重新排序可用作为译码器的后处理步骤。在另一实施例中，重新排序可整合入译码器。

若一音轨上的脉冲数目为不固定，则方便适度修改状态数目公式，而仍然使用相同编码算法。

若适当选择合并音轨顺序，则观察于章节“组合音轨数据”呈示的方法及前述方法获得相等结果。同理，逐一步骤办法及分裂与征服方法获得相等结果。因此，依据哪个方法体现上更实用或哪个方法最佳匹配平台的运算限制，独立地选择哪个方法用在译码器及编码器。

依据一实施例，提供脉冲信息编码器算法，可以伪码描述

依据一实施例，采用此种编码算法，脉冲信息编码器是经配置来将音轨中的一者划分成一第一音轨区划及一第二音轨区划。脉冲信息编码器是经配置来编码与第一区划相关联的第一子状态数目。此外，脉冲信息编码器是经配置来编码与第二区划相关联的第二子状态数目。再者，脉冲信息编码器是经配置来组合第一子状态数目及第二子状态数目而获得该状态数目。

同理，依据一实施例，提供脉冲信息译码器算法，可以伪码描述

在实现该分裂与征服方法的一实施例中，脉冲信息译码器是经配置来基于该状态数目而产生第一子状态数目及第二子状态数目。脉冲信息译码器是经配置来基于该第一子状态数目而译码这些音轨中的一者的第一区划的脉冲位置的第一群组。此外，脉冲信息译码器是经配置来基于该第二子状态数目而译码这些音轨中的一者的第二区划的脉冲位置的第二群组。

虽然已经在装置上下文中描述若干方面，但显然这些方面也表示相对应方法的描述，在该处一方块或一装置是相对应于一方法步骤或一方法步骤的特征。同理，以方法步骤的脉络描述的构面也表示相对应装置的相对应方块或项或特征结构的描述。

取决于某些体现要求，本发明的实施例可以硬件或以软件体现。体现可使用数字储存媒介质执行，例如软盘、DVD、CD、ROM、PROM、EPROM、EEPROM或闪存，具有可电子读取控制信号储存于其上，这些信号与（或可与）可编程计算机系统协作，因而执行相应方法。

依据本发明的若干实施例包含具有可电子式读取控制信号的数据载体，这些控制信号可与可编程计算机系统协作，因而执行此处所述方法中的一者。

大致上，本发明的实施例可体现为具有程序代码的计算机程序产品，该程序代码是当计算机程序产品在计算机上运行时可执行这些方法中的一者。该程序代码例如可储存在机器可读取载体上。

其它实施例包含储存在机器可读取载体或非暂存性储存媒体上的用以执行此处所述方法中的一者的计算机程序。

换言之，因此，本发明方法的实施例为一种具有一程序代码的计算机程序，该程序代码是当该计算机程序于一计算机上运行时用以执行此处所述方法中的一者。

因此，本发明方法的又一实施例为数据载体（或数字储存媒体或计算机可读取媒体）包含用以执行此处所述方法中的一者的计算机程序记录于其上。

因此，本发明方法的又一实施例为表示用以执行此处所述方法中的一者的计算机程序的数据串流或信号序列。数据串流或信号序列例如可经配置来通过数据通信连结，例如通过因特网转移。

又一实施例包含处理构件例如计算机或可编程逻辑装置，其是经配置来或适用于执行此处所述方法中的一者。

又一实施例包含一计算机，其上安装有用以执行此处所述方法中的一者的计算机程序。

在若干实施例中，可编程逻辑装置（例如可编程现场门阵列）可用来执行此处描述的方法的部分或全部功能。在若干实施例中，可现场程序规划门阵列可与微处理器协作来执行此处所述方法中的一者。大致上这些方法较佳是通过任何硬件装置执行。

前述实施例是仅供举例说明本发明的原理。须了解此处所述配置及细节的修改及变化将为熟谙技艺人士显然易知。因此，意图仅受审查中的专利申请范围所限而非受藉以描述及解说此处实施例所呈示的特定细节所限。

Claims

1.一种用以译码一编码音频信号的装置，其中一或多个音轨是与所述编码音频信号相关联，所述音轨中的每一个具有多个音轨位置及多个脉冲，其中，所述装置包括：

一脉冲信息译码器(110)，用以译码多个脉冲位置，其中，所述脉冲位置中的每一个脉冲位置指示所述音轨中的一个音轨的所述音轨位置中的一个音轨位置，其中所述一个音轨的所述脉冲中的一个脉冲位于所述音轨位置中的所述一个音轨位置，及其中，所述脉冲信息译码器(110)被配置为通过使用指示所述音轨中的至少一个的音轨位置总数的一音轨位置数目、指示所述音轨中的至少一个的脉冲总数的一总脉冲数目、及一个状态数目而译码所述多个脉冲位置；及

一信号译码器(120)，用于通过使用所述多个脉冲位置及与所述编码音频信号相关联的多个预测滤波器系数而产生一合成音频信号来译码所述编码音频信号，

其中，所述脉冲信息译码器(110)还适用于使用所述音轨位置数目、所述总脉冲数目及所述状态数目而译码多个脉冲符号，其中，所述脉冲符号中的每一个指示所述多个脉冲中的一个的一符号，及

其中，所述信号译码器(120)适用于通过再使用所述多个脉冲符号而产生一合成音频信号来译码所述编码音频信号。

2.根据权利要求1所述的装置，其中，所述一或多个音轨是包含至少一个最末音轨及一或多个其它音轨，及

其中，所述脉冲信息译码器(110)是适用以从所述状态数目产生一第一子状态数目及一第二子状态数目，

其中，所述脉冲信息译码器(110)被配置为基于所述第一子状态数目而译码所述脉冲位置的一第一群组，及

其中，所述脉冲信息译码器(110)被配置为基于所述第二子状态数目而译码所述脉冲位置的一第二群组，

其中，所述脉冲位置的所述第二群组只包含指示所述最末音轨的音轨位置的脉冲位置，及

其中，所述脉冲位置的所述第一群组只包含指示所述一或多个其它音轨的音轨位置的脉冲位置。

3.根据权利要求2所述的装置，其中，所述脉冲信息译码器被配置为通过将所述状态数目除以f(p_k,N)而获得一整数部分及一余数作为除法结果来产生所述第一子状态数目及所述第二子状态数目，其中，所述整数部分为所述第一子状态数目，及其中，所述余数为所述第二子状态数目，其中，p_k指示针对所述一或多个音轨中的每一个的脉冲数目，其中，N指示针对所述一或多个音轨中的每一个的音轨位置数目，及其中，f(p_k,N)指示针对具有N个音轨位置和p_k个脉冲的音轨的可能配置的数目。

4.根据权利要求1所述的装置，其中，所述脉冲信息译码器(110)是适用以进行将所述状态数目或一已更新状态数目与一阈值相比较的一测试。

5.根据权利要求4所述的装置，其中，所述脉冲信息译码器(110)是适用以通过比较所述状态数目或一已更新状态数目是否大于、大于等于、小于、或小于等于所述阈值而进行所述测试，及其中，所述脉冲信息译码器(110)是更适用以取决于所述测试的结果而更新所述状态数目或一已更新状态数目。

6.根据权利要求5所述的装置，其中，所述脉冲信息译码器(110)被配置为针对所述多个音轨中的一个的各个音轨位置，比较所述状态数目或所述已更新状态数目与所述阈值。

7.根据权利要求1所述的装置，

其中，所述脉冲信息译码器(110)被配置为划分所述音轨中的一个成为包含所述多个音轨位置中的至少两个音轨位置的一第一音轨区划，及成为包含所述多个音轨位置中的至少另两个音轨位置的一第二音轨区划，

其中，所述脉冲信息译码器(110)被配置为基于所述状态数目而产生一第一子状态数目及一第二子状态数目，

其中，所述脉冲信息译码器(110)被配置为基于所述第一子状态数目，译码与所述第一音轨区划相关联的脉冲位置的一第一群组，及

其中，所述脉冲信息译码器(11)被配置为基于所述第二子状态数目，译码与所述第二音轨区划相关联的脉冲位置的一第二群组。

8.一种用以编码一音频信号的装置，所述装置包括：

一信号处理器(210)，用以决定与所述音频信号相关联的多个预测滤波器系数，用以基于所述音频信号及所述多个预测滤波器系数而产生一残差信号；及

一脉冲信息编码器(220)，用以编码与一或多个音轨相关的多个脉冲位置来编码所述音频信号，所述一或多个音轨是与所述残差信号相关联，所述音轨中的每一个具有多个音轨位置及多个脉冲，其中，所述脉冲位置中的每一个指示所述音轨中的一个音轨的所述音轨位置中的一个音轨位置，其中所述一个音轨的所述脉冲中的一个脉冲位于所述音轨位置中的所述一个音轨位置，其中，所述脉冲信息编码器(220)被配置为通过产生一状态数目而编码所述多个脉冲位置，使得所述脉冲位置仅基于所述状态数目、指示所述音轨中的至少一个的音轨位置总数的一音轨位置数目、及指示所述音轨中的至少一个的脉冲总数的一总脉冲数目就能被译码，

其中，所述脉冲信息编码器(220)被配置为针对所述音轨中的一个的各个音轨位置，将一整数值加至针对在一音轨位置的各个脉冲的一中间数目来获得所述状态数目。

9.根据权利要求8所述的装置，其中，所述脉冲信息编码器(220)是适用以编码多个脉冲符号，其中，所述脉冲符号中的每一个指示所述多个脉冲中的一个的一符号，其中，所述脉冲信息编码器(220)被配置为通过产生所述状态数目而编码所述多个脉冲符号，使得所述脉冲符号仅基于所述状态数目、指示所述音轨中的至少一个的音轨位置总数的所述音轨位置数目、及所述总脉冲数目就能被译码。

10.根据权利要求8所述的装置，其中，所述脉冲信息编码器(220)被配置为针对所述音轨中的一个的各个音轨位置，将f(p,k-1)加至针对在一音轨位置的各个脉冲的所述一中间数目来获得所述状态数目，其中，p指示发现的脉冲数目，k指示音轨位置，及其中，f(p,k-1)指示针对具有k-1个音轨位置且p个有符号的脉冲的音轨的可能配置数目。

11.根据权利要求8所述的装置，

其中，所述脉冲信息编码器(220)被配置为划分所述音轨中的一个成为包含所述多个音轨位置中的至少两个音轨位置的一第一音轨区划，及成为包含所述多个音轨位置中的至少另两个音轨位置的一第二音轨区划，

其中，所述脉冲信息编码器(220)被配置为编码与所述第一音轨区划相关联的的一第一子状态数目，

其中，所述脉冲信息编码器(220)被配置为编码与所述第二音轨区划相关联的的一第二子状态数目，及

其中，所述脉冲信息编码器(220)被配置为组合所述第一子状态数目与所述第二子状态数目而获得所述状态数目。

12.一种用以译码一编码音频信号的方法，其中，一或多个音轨是与所述编码音频信号相关联，所述音轨中的每一个具有多个音轨位置及多个脉冲，其中，所述方法是包含：

译码多个脉冲位置，其中，所述脉冲位置中的每一个指示所述音轨中的一个音轨的所述音轨位置中的一个音轨位置，其中所述一个音轨的所述脉冲中的一个脉冲位于所述音轨位置中的所述一个音轨位置，及其中，所述多个脉冲位置是通过使用指示所述音轨中的至少一个的音轨位置总数的一音轨位置数目、指示所述音轨中的至少一个的脉冲总数的一总脉冲数目、及一个状态数目而被译码；

使用所述音轨位置数目、所述总脉冲数目和所述状态数目来译码多个脉冲符号，其中，所述脉冲符号中的每一个指示所述多个脉冲中的一个的符号，以及

通过使用所述多个脉冲位置及与所述编码音频信号相关联的多个预测滤波器系数而产生一合成音频信号来译码所述编码音频信号，

其中，通过进一步使用所述多个脉冲符号来生成合成音频信号来译码所述编码音频信号。

13.一种用以编码一音频信号的方法，所述方法是包含：

决定与所述音频信号相关联的多个预测滤波器系数，用以基于所述音频信号及所述多个预测滤波器系数而产生一残差信号；及

编码与一或多个音轨相关的多个脉冲位置来编码所述音频信号，所述一或多个音轨是与所述残差信号相关联，所述音轨中的每一个具有多个音轨位置及多个脉冲，其中，所述脉冲位置中的每一个指示所述音轨中的一个音轨的音轨位置中的一个音轨位置，其中所述一个音轨的所述脉冲中的一个脉冲位于所述音轨位置中的所述一个音轨位置，其中，所述多个脉冲位置是通过产生一状态数目而被编码，使得所述脉冲位置仅基于所述状态数目、指示所述音轨中的至少一个的音轨位置总数的一音轨位置数目、及指示所述音轨中的至少一个的脉冲总数的一总脉冲数目就能被译码，

其中，针对所述音轨中的一个的各个音轨位置，通过将一整数值加至针对在一音轨位置的各个脉冲的一中间数目来获得所述状态数目，进行对多个脉冲位置的编码。