CN105849803B

CN105849803B - 谱峰位置的编码与解码

Info

Publication number: CN105849803B
Application number: CN201480057361.8A
Authority: CN
Inventors: V·格兰查罗夫; S·斯维里斯森
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 2013-10-18
Filing date: 2014-10-10
Publication date: 2019-10-15
Anticipated expiration: 2034-10-10
Also published as: AU2017203091A1; RU2750644C2; CN110910894B; EP3058567B1; EP3471096A1; CN110767241B; MX350815B; CN110767241A; PL3058567T3; MX368569B; CA2927877A1; DK3058567T3; ES2814601T3; PT3471096T; JP2019124947A; US10796705B2; CA2927877C; ZA201801760B; EP3226242B1; JP2016533515A

Abstract

提供一种编码器和解码器及其方法，用于音频编码中谱峰位置的编码和解码。根据第一方面，提供了一种音频信号段编码方法，用于编码谱峰位置。该方法包括确定出自两个无损谱峰位置编码方案中的哪一个要求最少位数量来编码音频信号段的谱峰位置；并且选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码方案。两个无损谱峰位置编码方案中的第一个适合于周期性的或半周期性的谱峰位置分布；以及两个无损谱峰位置编码方案中的第二个适合于稀疏谱峰位置分布。

Description

谱峰位置的编码与解码

技术领域

提出的技术一般涉及音频信号段编码/解码，以及具体涉及谱峰位置编码/解码。

背景技术

许多音频编码技术采用了人类的听觉特性。例如，可以不需要编码强音调附近的弱音调，这是由于人的听觉系统对这种弱音调更不敏感。传统的，所谓的感知音频编码，不同频率数据的量化是基于人类听觉模型的。例如，分配更多位给可感知的重要频率数据并因此更精细量化，反之亦然。

音频编码的一种类型是所谓的变换编码。在变换编码中，输入音频样本块被变换(例如，经由修改的离散余弦变换)、处理和量化。基于感知的重要性执行变换系数的量化。其中需要译码的一个音频参数是谱峰位置。图1a中示出了变换域中音频段的谱峰位置的示例。通常使用无损编码方案(诸如霍夫曼(Huffman)编码)来译码谱峰位置。然而，现有技术解决方案在谱峰译码上消耗大量位。

发明内容

以比现有技术解决方案更有效率的方式译码谱峰位置将是所期望的。

根据第一方面，提供了用于编码谱峰位置的一种音频信号段编码方法。该方法包括确定出自两个无损谱峰位置编码方案中的哪一个要求最少位数量来编码音频信号段的谱峰位置；并且选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码方案。两个无损谱峰位置编码方案的第一个适于周期性或半周期性谱峰位置分布；以及两个无损谱峰位置编码方案的第二个适于稀疏谱峰位置分布。这也对于下面描述的所有方面有效。

根据第二方面，提供了一种音频信号段编码器，用于编码谱峰位置。编码器配置成确定出自两个无损谱峰位置编码方案中的哪一个要求最少位数量来编码音频信号段谱峰位置；并且进一步选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码方案。

根据第三方面，提供了一种用户终端，其包括根据第二方面的音频信号段编码器。

根据第四方面，提供了一种音频信号段解码方法，用于解码谱峰位置。该方法包括：接收音频信号段的编码的谱峰位置；并还接收出自两个无损编码方案中的被选择用来编码谱峰位置的无损编码方案的指示符。该方法还包括一致于指示的编码方案来解码谱峰位置。

根据第五方面，提供了一种音频信号段解码器，用于解码谱峰位置。该解码器配置成接收音频信号段的编码的谱峰位置；并进一步接收出自两个无损编码方案的被选择用来编码谱峰位置的无损编码方案的指示符。该解码器进一步配置成一致于指示的编码方案来解码谱峰位置。

根据第六方面，提供了一种移动终端，其包括根据第五方面的音频信号段解码器。

附图说明

实施例，连同其进一步的目的及其优点，可以通过参考下面的描述连同附图而最佳理解，其中：

图1a和1b是谱峰位置分布的示例。

图2-4是示出了所提出技术的编码方法的示例性实施例的流程图。

图5-9是示出了所提出编码器的示例性实施例的框图。

图10是示出了所提出用户终端的一实施例的框图。

图11是示出了所提出技术的解码方法的一实施例的流程图。

图12-15是示出了所提出解码器的示例性实施例的框图。

图16是示出了所提出用户终端的一实施例的框图。

具体实施方式

贯穿附图，相同的附图标记可用于类似或对应的元素。

所提出技术涉及谱峰位置的无损编码，如从音频信号的短时段(例如10-40ms)提取。所提出技术还涉及根据此技术已经编码的谱峰位置的解码。

发明人认识到译码谱峰位置的常规方法失败于致力于以下事实：音频信号中的峰位置可以在分布中具有非常突然的变化，这使得通过单一编码方案编码峰位置的低效率。在某些情况下，频谱能够是半周期的，这使得差分或delta编码方案非常高效。在其他情况下，谱峰能够是聚集的，留下大的稀疏区域。

所提出技术的主要思想是对不同峰位置分布使用指定的编码方案，并且以闭环方式在编码方案之间切换。不同的编码方案中的每个应该适合于具体峰位置分布。适合意味着例如编码方案对于某一类谱峰分布特别高效。当在本文中陈述编码方案A适合于峰分布C以及编码方案B适合于峰分布D，可以假定对于峰分布C，A一般比B更高效，而对于峰分布D，B一般比A更高效。

假设我们具有N个谱峰位置{P₁，P₂，P₃，...，P_N}的集合，其必须以无损方式压缩和传送。峰的数量以及它们的分布随时间变化。图1a和图1b中示出了谱峰位置的两个不同集合的示例。

图1a示出了接近周期的谱峰分布。这种情况可由例如以下所描述的delta编码来高效地处理。

图1b示出了稀疏的并且在两个相邻峰之间具有较大距离的谱峰分布。由于峰之间大的delta，这种情况很难通过delta编码处理。

发明人已经发现峰数量和它们的分布的大的变化可(具有益处地)通过采用备选性压缩或编码方案来处理。在此，集中在两个示例性编码方案，其可表示为delta编码和稀疏编码，并且在下面描述。delta编码能够备选地表示为周期编码。然而，使用多于两个的适合于不同谱峰位置分布的编码方案也是可行的。

delta编码

此编码方案适合于像图1a中所示的那个峰分布，其可以是特征为周期或半周期或接近周期的。delta编码的思想是在音频信号段中的连续谱峰位置P_j或{P₁，P₂，P₃，...，P_N}之间形成差值，本文表示为d或Δ，如下：

d₁＝P₁-P₀

d₂＝P₂-P₁

...

d_N＝P_N-P_N-1 (1)

所述差值(也表示为delta)然后使用适合的编码方法译码。差值的优选编码方法是霍夫曼编码。假设我们具有M个不同大小的delta。它们映射到可变长度的代代码字，例如

{d(1)，d(2)，d(3)，...，d(M)}→{0，10，11，111110} (2)

这里，d(1)是最常出现的差值或步长d_j并且因此映射至最短代码字“0”，而d(M)非常稀少并且因此映射至最长代码字“111110”。在此示例中，最长代码字要求6位，但是较长或较短的代码字也是可行的。通过映射最频繁的delta至最短代码字和映射最稀少的delta至最长代码字，用于译码delta的位数量将被最小化。这种编码方法是高效的，只要没有太多太频繁出现的不同步长。换句话说：不同的步长越多，代码字越长，并且当映射至长代码字的步长出现频繁时，编码方法的效率降低。

霍夫曼代码字被传送至解码器，并且解码器提取对应的delta。通过已知d_j和P_j-1，解码器能够通过迭代重构P_j。

除了delta，解码器还需要知道初始位置P₀。由于，峰之间最少距离上施加的约束，P₀被认为作为特殊情况。例如，可以存在限制：相邻峰必须被2个空位置分离。因为在这种情况下不存在比3更短的delta，在剩下的段或帧期间，不需要霍夫曼代码字用于这种delta。然而，音频信号段P₀中的绝对第一峰能够出现在刻度(频谱)的起始，其距0的偏移小于3。为了避免这个问题，而不必须对于这些可能的小于3的初始delta添加多个霍夫曼代码字，使用从-3确定的偏移替代从0确定的偏移。因此，当P₀位于例如位置1时，使用代码字Δ＝4。这种简单操作的结果是限制使用的霍夫曼代码字的数量是可能的。这将最少化所使用的霍夫曼代码字的长度，因为在一般情况下，更少的霍夫曼代码字给予更短的霍夫曼代码字。

稀疏编码

此编码方案适合于像图1b中所示的那个峰分布，其可以是特征为稀疏。稀疏被认为意味着连续峰之间可以存在大距离以及峰不必需是周期性的。假设谱峰位置向量的以下示例，其中那些一“1”表示峰的存在以及零“0”指示峰的缺失：

{01000000000000000100} (3)

在delta编码中，这将意味着{P₁＝2和P₂＝18}，)。以上的示例性峰位置向量应该示出了频谱峰相对于其他峰的差值相隔很远，甚至在更真实的向量中，不认为距离16是相隔很远的。

此稀疏编码方案的第一步是要形成例如5位的相等大小的组，如下：

{01000，00000，00000，00100} (4)

然后检查每个组的非零元素，例如通过对每个组内的元素进行或运算。结果存储在第二位向量，其长度缩短为1/5。此位向量下面以粗体示出以便更容易区分：

{01000，00000，00000，00100}→{1001} (5)

在此示例性实施例中，应该传送至解码器的位流将看起来像：

{1001，01000，00100} (6)

解码器从位流读取信令层“1001”。这些4位指示位流中将跟随的是第1和第4组的描述，而第2和第3组必须填0。

由于上面提及的两个连续峰之间最小允许距离中的约束，上面的方案可修改以实现进一步的(仍然无损的)压缩增益。因为对于每个5-dim向量只有8个可能的级别，由于峰应该至少分开两个位置的约束，这些向量能够只有3位的索引，见下面的表1。在此实施例中，位流看上去如下：

{1001，001，010} (7)

而不是如更上面的示例中的5位，只要求3个位标识每个非零位组。

表1：5-dim向量的索引。从位流提取3-位索引，并且重构在上面组和表中表示的对应5-dim向量。

组	索引
		10000	000
01000	001
		00100	010
00010	011
		00001	100
10010	101
		10001	110
01001	111

表1

备选的无损稀疏谱峰位置编码方案能够基于或运算位的逻辑操作，如[1]中所描述的。

上述每个编码方案都具有对于某些峰位置分布的问题：

●稀疏编码方案的问题是如果输入不够稀疏，其能够实际增加数据量。

●delta编码方案的问题是对于异常值它是非常低效率的，例如当距离多数是小的时，有非常大的delta步长。

然而，上述两种编码方案能够看作是互补的，并且发明人已实现通过组合它们的优势，能够形成非常高效的编码系统。闭环判定逻辑的示例概述如下：

如果L_d＞L_s

使用稀疏编码

否则

使用delta编码 (8)

其中

L_d是delta编码方案所消耗的位总数量，

L_s是稀疏编码方案所消耗的位总数量。

判定逻辑(8)要求两种编码方案都是实际可执行的。在一些情况下，当两个连续峰之间的最大距离d_max比对于delta编码可能的最大距离T更大时，基于预存储的霍夫曼表，delta编码方案消耗的位总数量L_d不能明确计算。为了适合这种情况，判定逻辑(8)可稍微修改成：

如果{(d_max＞T)或(L_d＞L_s)}

使用稀疏编码

否则

使用delta编码 (9)

判定逻辑(9)中的或语句的第一部分可认为是捷径，因为如果距离d_max＞T，delta编码不必须明确执行。以不同方式表达：当对于音频信号段或帧，满足准则d_max＞T时，应不执行delta编码，并且可决定使用稀疏编码而不比较两编码方法的结果。也就是说，在这种情况下，L_d可以被默认大于L_s，并且只需要执行稀疏编码。

图2和图3是流程图，示出了根据至少一个实施例的提出的技术的方法。该方法意在由音频编码器(coder)执行，其也可表示为音频译码器(encoder)，可操作于译码音频信号段。在此实施例中，判定逻辑(9)被实现，并且无损编码方案的示例数量为二。方法包括201确定出自两个无损谱峰位置编码方案中的哪一个要求最少位数量来编码音频信号段的谱峰位置；以及202选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码方案。此实施例也能够参考图3来更详细的描述。在步骤301中，确定d_max(或者备选地表示为Δ_max)大于T；(d_max＞T)。该条件能够(明显地)备选地被用公式表示例如为d_max≥T’。当d_max大于T时，稀疏编码被选择304，并且可以使用稀疏编码方案编码谱峰位置。这能够实现当d_max＞T时，在译码谱峰位置前，作出关于使用哪个编码方案的判定。delta编码能够配置用于高效地编码小于T的delta，而不必要处理大于T的delta。换句话说，霍夫曼表的大小可连同稀疏峰位置编码方案来被优化，以便对于在某一大小以上的delta而稀疏编码方案的效率被实现(通过此类delta在霍夫曼表中没有被表示)。这种优化导致了霍夫曼表中的整体短代码字大小，其对编码效率非常有利。稀疏编码方案是对于d_max＞T要求最少位数的编码方案。

当d_max不大于T时，即当不满足条件301时；使用两个编码方案译码谱峰位置302。即，相应地使用delta编码和稀疏编码译码谱峰位置，呈现两个不同结果。每个编码方案要求一定位数量以译码当前谱峰位置的集合，参见上面的L_d和L_s。可观察到该位数量并且可比较该数量以确定对于当前峰分布，哪个编码方案最高效。基于不同方法要求的相应位数量，可以确定哪个编码方案要求最少的位数量以译码当前谱峰位置的集合，并且要求最少位数量的编码方案可以被选择303。所述确定，即在这种情况下的所要求位数量的比较，能够认为并入步骤303中或步骤302中。所选择的编码方案(在步骤304中或步骤303中选择)可然后被指示306至编码器(与译码的谱峰位置关联)。也就是说，与用所选编码方案译码的编码的谱峰位置的版本的传送相关联。未选择的其它编码方案译码的版本将不被使用并且可被丢弃。

delta编码，其也可表示为两个无损谱峰位置编码方案的第一个，适合于周期性或半周期性谱峰位置分布的译码；和稀疏编码，也还能够表示为两个无损谱峰位置编码方案的第二个，适合于稀疏谱峰位置分布。如上所述，delta编码优选的包括峰位置的delta编码和delta代码的霍夫曼编码。这能够可备选地称为delta-霍夫曼编码。

如上所述，稀疏谱峰位置编码方案可包括将表示谱峰位置的位向量分成连续相等大小的位组(见公式(4))；或运算每个位组中的位以形成组位向量(见公式(5))；通过采用两个连续峰之间最小允许距离中的约束来压缩非零位组(见公式(6)和表1)；并且通过将该组位向量和已压缩非零位组连结以进一步形成压缩位向量(见公式(7))。术语“或运算”在此也认为包括变体，其中组中的位以一些其他方式检查一“1”，呈现与或运算相同的结果。例如，能够逐一检查该组的位，以及如果检测到“1”，则确定该组是非零位组。

图4是流程图，示出了根据一实施例的实现至少上述判定逻辑(8)的提出的技术的方法。步骤401根据至少两个适合于不同谱峰位置分布的无损谱峰位置编码方案来编码音频信号段的谱峰位置。步骤402选择要求最少位数量来编码音频信号段谱峰位置的谱峰位置编码方案。步骤401和402能够与图3中步骤302和303相同。

本文描述的步骤、功能、规程、模块、单元和/或块可以使用任何常规技术在硬件中实现，诸如离散电路或集成电路技术，包括通用电子电路和专用电路。

具体的示例包括一个或多个适合地配置的数字信号处理器和其他已知电子电路，例如执行特定功能的离散逻辑门互连，或专用集成电路。

备选的，至少一些上述步骤、功能、规程、模块、单元和/或块可以在软件中实现，诸如用于由包含一个或多个处理单元的适当处理电路执行的计算机程序。

当由一个或多个处理器执行时，本文示出的流程图或图可认为是计算机流程图或图。对应的设备可被定义为一组功能模块，其中由处理器执行的每个步骤对应一个功能模块。在此情况下，功能模块实现为处理器上运行的计算机程序。

处理电路的示例包括，但不限于，一个或多个微处理器、一个或多个数字信号处理器，DSP，一个或多个中央处理单元，CPU，视频加速硬件和/或任何适当的可编程逻辑电路诸如一个或多个现场可编程门阵列，FPGA，或一个或多个可编程逻辑控制器，PLC。

也应当理解，可以可能重使用任何常规装置或单元(在其中提出的技术被实现)的一般处理能力。还可以重使用已有软件，例如通过重新编程已有软件或通过增加新的软件组件。

本文描述的实施例还涉及对译码音频信号可操作的译码器。编码器配置成执行通过上述编码器执行的方法的至少一个实施例。编码器关联于如图3所示和如上所述方法的相同技术特征、目的和优点。编码器将简要描述以避免不必要的重复。

下面将参照图5描述配置成启用上述方法的执行以用于谱峰位置编码的示例性编码器500。编码器可包含在用户终端中或包含在网络节点中，诸如网关。如上所述，可以假设编码器500配置成具有执行两个无损谱峰位置编码方案的功能性。

图5是示出了所提出编码器10的一实施例的框图。此实施例包括存储器24和处理器22形式的处理部件。该存储器包括指令，例如采用计算机程序形式，当其由处理部件执行时使得编码器10确定出自两个无损谱峰位置编码方案的哪一个要求最少位数量来编码音频信号段的谱峰位置。优选的，编码器10配置成应用如上所述的判定逻辑(9)。可执行确定参数d_max是否超出阈值，以及如果没有超出，在用两个编码方案译码谱峰位置之后，比较由两个编码方案编码谱峰位置所要求的位数量。指令的执行进一步使得编码器10选择要求最少位数量来编码音频信号段谱峰位置的谱峰位置编码方案。编码器10配置两个编码方案，其也可以是存储在存储器24中指令的部分，或备选的在编码器的一些其他部分中存储或实现(未示出)。如之前，两个无损谱峰位置编码方案中的第一个适合于周期性或半周期性谱峰位置分布；以及两个无损谱峰位置编码方案中的第二个适合于稀疏谱峰位置分布。这也能够描述为，编码器10以两种不同编码模式有效地译码谱峰。

该指令可存储为计算机可读媒体(有形非易失性媒体)上的计算机程序产品20并且可被传送至存储器24，如在图左侧由虚线箭头所指示。音频信号段通过输入单元IN转发至处理器22，并且所编码的谱峰位置通过输出单元OUT转发至解码器。所选编码方案可明确通知解码器，如图5中虚线箭头指示的，或作为备选的，通过以可能的解码模式对已接收的位流的试解码，可以在解码器检测方案并选择成功的那个方案。第一种备选的复杂度小，但要求更多的带宽。第二种备选要求较小的带宽，但是更复杂。以下描述了应用至其他实施例的其他类似备选。

图6示出了编码器10的一备选实施例。图6示出了编码器10，可操作以译码音频信号。编码器10包括确定单元603，其配置成确定出自两个无损谱峰位置编码方案中的哪一个要求最少的位数量来编码音频信号段谱峰位置。编码器10进一步包括选择单元604，配置成选择要求最少位数量来编码音频信号段谱峰位置的谱峰位置编码方案。

图7是示出了所提出编码器10的示例性实施例的框图。编码器10配置成执行实现至少如上所述判定逻辑(8)的用于谱峰位置编码的方法。转发音频信号段至信号分析单元16，其分析段以用于编码目的。从该分析提取的特征之一是谱峰位置的集合。可以通过使用适和的现有技术方法来执行此分析。这些谱峰位置被转发至谱峰位置编码器12，其配置成根据至少两个适合于不同谱峰位置分布的无损谱峰位置编码方案来编码音频信号段的谱峰位置。每个编码方案总的位数量，即用于译码谱峰位置的相应方法所要求的位数量，被转发至编码方案选择器14，其配置成选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码方案。所选编码的谱峰位置被转发至输出单元18并转发至解码器。

图8是示出了所提出编码器10的另一实施例的框图。谱峰位置的集合被转发至编码器10，其包括谱峰位置编码模块12，用于根据至少两个适合于不同谱峰位置分布的无损谱峰位置编码方案来编码音频信号段的谱峰位置。编码器10还包括编码方案选择模块14，用于选择要求最少位数量来编码音频信号段谱峰位置的谱峰位置编码方案。所选编码的谱峰位置被转发至解码器。所选编码方案也可被指示给如上所述的解码器。

当编码器10配置成支持上述判定逻辑(9)，编码方案选择模块14应进一步配置成确定出自至少两个无损谱峰位置编码方案中的哪一个要求最少位数量来编码谱峰位置，这还取决于与两个连续峰位置之间最大距离相关的准则。也就是说，在谱峰位置译码之前，编码方案选择模块14应配置成确定最大距离d_max是否超出预定阈值，并根据结果采取措施(参看图3)。

图9示出了所提出编码器10的另一实施例的框图。此实施例基于处理器22，例如微处理器，其执行计算机程序30用于编码音频信号段的谱峰位置。计算机程序存储在存储器24中。处理器22与存储器通过系统总线通信。输入音频信号段由与处理器22和存储器24连接的控制I/O总线的输入/输出(I/O)控制器26接收。从软件30获得的编码的谱峰位置通过I/O总线由I/O控制器26的从存储器24输出。计算机程序30包括编码单元32(其用于根据适合于不同谱峰位置分布的两个无损谱峰位置编码方案来编码音频信号段的谱峰位置)和编码单元34(用于确定和选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码方案)。

存在于存储器中的计算机程序可组织成适当功能模块，当由处理器执行时，配置成执行上述步骤和/或任务的至少部分。图8中示出了这种功能模块的示例。软件或计算机程序可被实现为计算机程序产品，其通常装载或存储在计算机-可读媒体上(有形非易失性媒体)。计算机可读媒体可包括一个或多个可移动或非可移动存储装置，包括但不限于只读存储器ROM、随机存取存储器RAM、光盘CD、数字多用途盘DVD、通用串行总线USB、存储器、硬盘驱动器HDD存储装置、闪存或任何其他常规存储装置。计算机程序可因此加载至计算机的操作存储器或等效处理装置中以用于通过其处理电路执行。

例如，计算机程序包括可由处理电路执行的指令，由此处理电路能够或可操作来执行本文描述的步骤、功能、规程和/或块。计算机或处理电路不必专用于执行本文描述的步骤、功能、规程和/或块，而还可执行其他任务。

本发明也包括用户终端，其包括如上所述的音频信号段编码器。用户终端可以是有线或无线装置。

如本文使用的，术语“无线装置”可指用户装备UE、移动电话、蜂窝电话、装配有无线电通信能力的个人数字助理PDA、智能电话、装配有内部或外部移动宽带调制解调器的笔记本电脑或个人电脑PC、具有无线电通信能力的平板PC、便携式电子无线电通信装置、装配有无线电通信能力的传感器装置或类似的。具体地，术语“UE”应理解为非限制性术语，其包括装配有无线电电路的任何装置，用于根据任何相关通信标准进行无线通信。

如在本文使用的，术语“有线装置”可指的是当配置成有线连接至网络时的至少一些上述装置，具有或不具有无线通信能力，例如PC。

图10是示出了所提出用户终端50的一实施例的框图。该示例示出了UE。来自麦克风的音频信号被转发至模拟/数字转换器A/D，并且根据所提出技术通过编码器10处理数字信号。具体地，编码器10编码如上所述的音频信号段的谱峰位置(通常编码器可执行其他任务，诸如音频信号段的频率转换和编码描述段的其他参数，但由于这些任务是本领域众所周知的并且不构成所提出技术的重要部分，因此没有描述它们)。所编码谱峰位置(和其他参数)被转发至无线电单元40以用于传输至解码器。可选地，所选编码方案也可被转发至如上所述的解码器。

本文描述的实施例也涉及音频信号段解码方法用于谱峰位置的解码。此方法是与前述编码方法对应的方法。

图11是示出了所提出技术的解码方法的一实施例的流程图。在步骤1101中，接收音频信号段的编码的谱峰位置。在步骤1102中，接收已选择用于编码的编码方案指示符。在步骤1103中，以与指示的编码方案对应的解码模式解码谱峰位置。这也可表示为根据指示的编码方案解码谱峰位置，即使用与指示的编码方案对应的解码方案。指示的编码方案是出自两个无损谱峰编码方案中的一个，其中，如之前所述的，两个无损谱峰位置编码方案的第一个适于周期性或半周期性谱峰位置分布；以及两个无损谱峰位置编码方案的第二个适于稀疏谱峰位置分布。

当适合于稀疏谱峰位置分布的编码方案被指示时，所编码谱峰位置以组位向量和由组位向量压缩的非零位组的形式被接收。这与前面描述的稀疏编码方案对应。该组位向量中的相应位置可然后表示位的连续相等大小组。此外，包含谱峰的相等大小组应与不包括谱峰的相等大小组分开。包括谱峰的相等大小组也可表示为非零位组，并在该组位向量中与不包括谱峰的相等大小组相比被不同地指示。例如，在组位向量中，非零位组能够由“1”指示，和不包括谱峰的组能够由“0”指示，如上面的表达(5)-(7)。

非零位组(如果其任何在组位向量中指示)，可然后基于两个连续峰之间最小允许距离中的约束来被解压缩。也就是说，以压缩形式可以连结至组位向量的非零位组可以通过使用表(如上述表1)重映射来解压缩。由于与峰之间最小允许距离有关的约束或限制，不是所有的序列是可能的非零位组，以及因此每个可能序列可映射至更短序列，即被压缩，如前所述。

“零位”组，即不包含任何谱峰的组，如果在组位向量中被指示，能够通过生成零序列解压缩。这种零序列应与解压缩的非零位组的大小相同，因为组应是相等大小的。假设稀疏编码方案或模式用于稀疏谱峰位置，通常将有零位组在组位向量中被指示。

当已指示的谱峰位置编码方案是适合于周期或半周期谱峰位置分布的编码方案时，所接收的谱峰位置的解码可包括对应前述译码的霍夫曼解码或delta解码。用于霍夫曼解码的霍夫曼表的大小可连同前述第二谱峰位置编码方案来优化。

在备选实施例中，在译码器并没有将选择的编码方案指示给解码器的情况下，所提出技术的解码方法可包括适于不同谱峰位置分布的两个谱峰位置解码模式中谱峰位置的所谓的试解码。导致谱峰位置的集合被成功解码的解码方案或模式被认为与所选编码方案对应。

本文描述的实施例也涉及可操作来解码音频信号的解码器。解码器配置成执行用于上述谱峰位置的解码的音频信号段解码方法的至少一个实施例。解码器相关联于与用于上述谱峰位置编码和解码对应的编码器和方法相同的技术特征、目的和优点。解码器将被简要描述以避免不必要的重复。

图12示出了提出的音频信号段解码器110的一实施例的框图。输入单元116接收编码的谱峰位置和编码方案指示符。解码器110包括谱峰位置解码器112，其配置成以解码模式解码谱峰位置，该解码模式对应指示的适合于不同谱峰位置分布的出自两个谱峰位置编码模式中的一个。输出单元118输出已解码的谱峰位置。以某种“解码模式”解码能够备选地被表示为使用与某种指示的编码方案对应的解码方案以解码接收到的编码的谱峰位置。

在一个实施例中，谱峰位置解码器112配置成接收音频信号段的编码的谱峰位置；接收选择用于编码谱峰位置的编码方案的指示符；并以与指示的编码方案对应的解码模式解码谱峰位置。后者能够备选地表示为如基于指示的编码方案解码谱峰位置，或表示为根据指示的编码方案解码谱峰位置。图13是示出了所提出音频信号段解码器110的另一实施例的框图。编码的谱峰位置和编码方案指示符被转发至谱峰位置解码模块112，其输出所解码的谱峰位置。

在一个实施例中，图13的解码器110包括谱峰位置解码模块112，用于将已接收的音频信号段的编码的谱峰位置以解码模式解码成谱峰位置，该解码模式与已选择用于编码谱峰位置的编码方案的接收的指示符对应。

在另一实施例中，图13的解码器110包括谱峰位置解码模块112，用于将音频信号段的已接收的编码的谱峰位置以适合于不同谱峰位置分布的至少两个谱峰位置解码模式试解码成谱峰位置，并输出成功解码的谱峰位置的集合。

图14是示出了所提出解码器的一实施例的框图。此实施例包括处理器22和存储器24，其中存储器包含由处理器可执行的指令。指令的执行使得解码器110可操作用于以解码模式解码谱峰位置，该解码模式对应适合于不同谱峰位置分布的至少两个谱峰位置编码模式中的一个。该指令可存储为计算机可读媒体上的计算机程序产品120并且被传送至存储器24，如图右侧虚线箭头所示。编码的谱峰位置和编码方案通过输入单元IN转发至处理器22，并且已解码谱峰位置通过输出单元OUT输出。

在一个实施例中，由处理器的指令执行使图14的解码器可操作用于接收音频信号段的编码的谱峰位置；接收编码谱峰位置的所选择的编码方案的指示符；以及以与指示的编码方案对应的解码模式解码谱峰位置。

图14是示出了所提出解码器110的另一实施例的框图。此实施例基于处理器22，例如微处理器，其执行计算机程序130用于解码音频信号段的谱峰位置。计算机程序存储在存储器24中。处理器22通过系统总线与存储器通信。输入的编码的谱峰位置和编码方案指示符由与处理器22和存储器24连接的控制I/O总线的输入/输出(I/O)控制器26接收。从软件130获取的(已解码)谱峰位置由I/O控制器26通过I/O总线从存储器24输出。计算机程序130包括编码单元132用于接收音频信号段的编码的谱峰位置；编码单元134用于接收编码谱峰位置的所选择的编码方案的指示符；以及编码单元136用于以与指示的编码方案对应的解码模式解码谱峰位置。后者也能够表示为：用于根据指示的编码方案解码谱峰位置。

存在于存储器中的计算机程序可组织成适当功能模块，当由处理器执行时，配置成执行上述步骤和/或任务的至少部分。图15中示出了这种功能模块的示例。

图16是示出了所提出用户终端的一实施例的框图。该示例示出了UE。来自天线的无线电信号被转发至无线电单元160，以及来自无线电单元的数字信号由解码器110根据所提出的技术来处理。特别的，解码器110解码如上所述的音频信号段的编码的谱峰位置(通常解码器可执行其他任务，如描述段的其它参数的解码，但由于这些任务是在本领域众所周知的并且不形成所提出技术的重要部分，因此没有描述这些任务)。已解码的谱峰位置(和其他参数)被转发至与扬声器连接的信号重构单元142。也可在解码器接收所选编码方案，如上所述。

如上所述的实施例仅仅作为示例给出，并且应当理解所提出的技术并不局限于此。本领域技术人员将理解在不脱离本发明的范围的情况下可对实施例可作出各种修改、组合和改变。具体地，当技术上可能时，不同实施例中不同部分的解决方案能够与其他配置组合。

缩写

ASIC专用集成电路

CPU中央处理器

DSP数字信号处理器

FPGA现场可编程门阵列

PLC可编程逻辑控制器

参考文献

[1]D.Salomon，G.Motta，″Handbook of Data Compression″，Fifth Edition，2010，p.1111.

Claims

1.一种用于编码谱峰位置的音频信号段编码方法，所述方法包括：

- 确定出自两个无损谱峰位置编码方案中的哪一个用于编码音频信号段的所述谱峰位置，其中第一无损谱峰位置编码方案适合于周期性的或半周期性的谱峰位置分布，以及第二无损谱峰位置编码方案适合于稀疏谱峰位置分布；并且其中所述确定基于所述音频信号段中两个谱峰之间最大距离d_max和基于使用所述两个方案编码所述音频信号段之后相应方案所要求的位数量的比较；

- 当所述音频信号段中两个谱峰之间最大距离d_max超出阈值T时，选择所述第二无损谱峰位置编码方案；以及

- 当所述最大距离d_max没有超出所述阈值T时，选择要求最少位数量来编码所述音频信号段的所述谱峰位置的谱峰位置编码方案。

2.如权利要求1所述的方法，其中所述第一无损谱峰位置编码方案包括：

- 峰位置的delta编码；

- delta代码的霍夫曼编码。

3.如权利要求2所述的方法，其中大于阈值T的delta没有在霍夫曼表中表示。

4.如权利要求1-3中任一所述的方法，其中所述第二无损谱峰位置编码方案包括以下步骤：

- 将表示所述谱峰位置的位向量分成连续相等大小位组；

- 或运算每个位组中的位以形成组位向量；

- 通过采用两个连续峰之间最小允许距离中的约束来压缩非零位组；

- 通过将所述组位向量和所压缩的非零位组连结以形成压缩的位向量。

5.一种用于谱峰位置编码的音频信号段编码器，所述编码器配置成：

6.根据权利要求5所述的音频信号段编码器，被配置以第一无损谱峰位置编码方案，所述第一无损谱峰位置编码方案包括：

- 峰位置的delta编码；

- delta代码的霍夫曼编码。

7.根据权利要求6所述的音频信号段编码器，其中大于阈值T的delta没有在霍夫曼表中表示。

8.根据权利要求5-7中任一所述的音频信号段编码器，被配置以第二无损谱峰位置编码方案，所述第二无损谱峰位置编码方案包括：

- 将表示所述谱峰位置的位向量分成连续相等大小位组；

- 或运算每个位组中的位以形成组位向量；

9.一种用户终端，包括根据权利要求5-8中任一所述的音频信号段编码器。

10.一种用于谱峰位置解码的音频信号段解码方法，所述方法包括：

- 接收音频信号段的编码的谱峰位置，其中根据权利要求1-4中任一所述的方法编码所述谱峰位置；

- 接收出自两个无损编码方案的被选择来编码所述谱峰位置的无损编码方案的指示符；以及

- 一致于指示的编码方案来解码所述谱峰位置；

其中所述两个无损谱峰位置编码方案中的第一个适合于周期性的或半周期性的谱峰位置分布；以及所述两个无损谱峰位置编码方案中的第二个适合于稀疏谱峰位置分布。

11.根据权利要求10所述的方法，其中当所指示的谱峰位置编码方案是适合于稀疏谱峰位置分布的编码方案时，所述编码的谱峰位置以组位向量和由所述组位向量指示的压缩的非零位组的形式被接收。

12.根据权利要求11所述的方法，其中所述组位向量中的相应位置表示连续相等大小组，以及其中包括谱峰的相等大小组，即非零位组，与不包含谱峰的相等大小组相比在所述组位向量中不同地被指示。

13.根据权利要求11或12所述的方法，进一步包括：

- 基于两个连续峰之间最小允许距离中的约束来解压缩任何非零位组，以及

- 通过生成零序列来解压缩不包括谱峰的任何组。

14.根据权利要求10-12任一所述的方法，其中当所述指示的谱峰位置编码方案是适合于周期性的或半周期性的谱峰位置分布的编码方案时，峰位置的解码包括霍夫曼解码和delta解码。

15.权利要求14所述的方法，其中大于阈值T的delta没有在霍夫曼表中表示。

16.一种用于谱峰位置解码的音频信号段解码器，所述解码器配置成：

- 接收音频信号段的编码的谱峰位置，其中使用根据权利要求5-8中任一所述的音频信号段编码器来编码所述谱峰位置；

- 接收出自两个无损编码方案的被选择来编码所述谱峰位置的无损编码方案的指示符；以及被配置成

- 一致于指示的编码方案来解码所述谱峰位置；

17.根据权利要求16所述的音频信号段解码器，被配置成当所指示的谱峰位置编码方案是适合于稀疏谱峰位置分布的编码方案时，所述编码的谱峰位置以组位向量和由所述组位向量指示的压缩的非零位组的形式被接收。

18.根据权利要求17所述的音频信号段解码器，其中所述组位向量中的相应位置表示连续相等大小组，以及其中包括谱峰的相等大小组，即非零位组，与不包含谱峰的相等大小组相比在所述组位向量中不同地被指示。

19.根据权利要求17或18所述的音频信号段解码器，被配置成：

- 基于两个连续峰之间最小允许距离中的约束来解压缩任何非零位组，以及配置成

- 通过生成零序列来解压缩不包括谱峰的任何组。

20.根据权利要求16-18中任一所述的音频信号段解码器，被配置成当所述指示的谱峰位置编码方案是适合于周期性的或半周期性的谱峰位置分布的编码方案时，由霍夫曼解码和delta解码来解码峰位置。

21.根据权利要求20所述的音频信号段解码器，其中大于阈值T的delta没有在霍夫曼表中表示。

22.一种用户终端，包括根据权利要求16-21中任一所述的音频信号段解码器。