CN114023341A

CN114023341A - 音响信号编码装置和解码装置以及编码方法和解码方法

Info

Publication number: CN114023341A
Application number: CN202111171436.3A
Authority: CN
Inventors: 河岛拓也; 江原宏幸
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2014-07-25
Filing date: 2015-07-03
Publication date: 2022-02-08
Also published as: EP3413307A1; US11521625B2; US10643623B2; AU2015291897A1; KR20170035827A; CA2958429C; EP3174050B1; US20200219518A1; CN106133831A; MX356371B; BR112017000629B1; EP3174050A4; SG11201701197TA; US10311879B2; MX2016015786A; EP3723086A1; EP3174050A1; AU2015291897B2; PL3174050T3; RU2017102311A

Abstract

本公开公开了一种音响信号编码装置，包括：时间频率变换单元(101)，通过对输入音响信号执行到频域的转换来生成频谱，将频谱分割为规定的频带的子带，以及输出子带频谱；子带能量量化单元(102)，对每个子带求量化子带能量；音调计算单元(103)，分析子带频谱的音调性并输出分析结果；比特分配单元(104)，基于音调性的分析结果和量化子带能量，从子带之中选择由第2量化单元(107)对其执行量化的第2子带，以及确定要分配给子带之中的由第1量化单元(106)对其执行量化的第1子带的第1比特数；以及复用单元(108)，将从第1量化单元(106)和第2量化单元(107)输出的编码信息、量化子带能量和音调性的分析结果复用成信息并输出复用信息。

Description

音响信号编码装置和解码装置以及编码方法和解码方法

本申请是申请日为2015年7月3日、申请号为：201580015301.4、发明名称为“音响信号编码装置、音响信号解码装置、音响信号编码方法以及音响信号解码方法”的发明专利申请的分案申请。

技术领域

本发明涉及改善语音信号或音乐信号等的音响信号(acoustic signal)的音质的编码技术、以及解码技术。

背景技术

将音响信号以低比特率压缩的编码技术，是实现移动通信中的电波等的有效利用的重要的技术。而且，近年来对通话语音的质量提高的期待不断高涨，期望实现现场感高的通话服务。为了实现这样的通话服务，将频带宽的音响信号以高比特率编码即可。但是，该途径(approach)与电波和频带的有效利用相反。

这里，作为例子，研讨在G.719标准(非专利文献1)中所采用的音响信号编码技术。

在G.719标准中，在将音响信号编码时，对将音响信号变频后的频谱分配规定的比特。具体地说，将频谱分割为具有规定的带宽的子带，将从能量较大的子带起用于顺序地通过点阵向量量化进行量化的单位(必要比特数的单位)如以下那样分配。

(1)

从全子带之中对能量最大的子带分配1单位(unit)。

由于每1频谱每次分配1比特，所以例如若子带内的频谱样本数为8，则1单位为8比特(再有，每1频谱可分配的比特数最大为9比特，例如若子帧的频谱样本数为8，则最终可分配至72比特)。

(2)

分配了1单位的子带将量化子带能量下降2级(6dB)。如果对分配了1单位的子带的比特分配超过最大值(9比特)，则在下次之后的循环中从量化对象中除去。

(3)

返回到上述(1)，反复进行相同的处理。

图6表示各子带中的子带能量。横轴表示频率，纵轴表示对数刻度的振幅。在图中，子带能量不是以点而是以横线表示，其一个一个的宽度表示各子带的带宽。

图7、图8是表示使用了按G.719标准规定的编码方法的情况下的对各子带的比特分配结果例子的图。各图的横轴表示频率，纵轴表示被分配的比特数。而且，图7是比特率为128k bit/s的情况，图8是比特率为64k bit/s的情况。

在128k bit/s的情况下，可分配的比特资产丰富，所以对很多的子带(频谱)，可分配最大值即9比特，能够高质量地保证音响信号。

相对于此，在64k bit/s的情况下，虽然没有被分配了最大值即9比特的子带，但相反地也没有未被分配比特的子带，可以说抑制音响信号的质量的劣化，并且还能够兼顾电波和频带的有效利用。

现有技术文献

专利文献

专利文献1：日本特表2013－534328号公报

专利文献2：国际公开第2005/027095号

非专利文献

非专利文献1：ITU—T Standard G.719、2008年

发明内容

但是，有实现进一步的电波和频带的有效利用的需要。这里，使用在G.719标准中采用的上述方法，以20kbp/s左右以下的低比特率将32kHz左右的采样频率的音响信号编码的情况下，有不能确保用于将全部的子带量化的单位(比特数)的问题。

图9是表示使用了按20k bit/s的G.719标准确定的编码方法的情况下的对各子带的比特分配结果例子的图。这样，高频带部分当然根据情况对听觉上重要的低频带部分也不能分配比特的结果，该子带中的频谱不能编码，音响信号的质量的劣化明显。

相对于此，还考虑采用动态地变更比特的分配方法的方法(专利文献1)。

但是，通过不变更编码方法(量化方法)而以单一的编码方法(量化方法)变更比特分配方法，在应对音响信号的质量劣化上也有限度。

本发明提供用于使整体的比特率降低，并实现高质量的音响信号的编码技术和解码技术。

本发明的音响信号编码装置包括：时间频率变换单元，将输入音响信号转换到频域并生成频谱，将频谱分割为每个规定的频带的子带，输出子带频谱；子带能量量化单元，对每个子带求量化子带能量；音调计算单元，分析子带频谱的音调性并输出分析结果；比特分配单元，基于音调性的分析结果和量化子带能量，从子带之中选择由第2量化单元量化的第2子带，确定被分配给由第1量化单元量化的第1子带的第1比特数；以及复用单元，将包含从第1量化单元及第2量化单元输出的编码信息、量化子带能量和音调性的分析结果的信息进行复用并输出。第1量化单元将第1子带中包含的子带频谱，使用由第1比特数组成的比特进行脉冲编码，第2量化单元将第2子带中包含的子带频谱，使用基音滤波器进行编码。

本发明的音响信号编码装置，包括：时间频率变换单元(101)，通过对输入音响信号执行到频域的转换来生成频谱，将频谱分割为规定的频带的子带，以及输出子带频谱；子带能量量化单元(102)，对每个子带求量化子带能量；音调计算单元(103)，分析子带频谱的音调性并输出分析结果；比特分配单元(104)，基于音调性的分析结果和量化子带能量，从子带之中选择由第2量化单元(107)对其执行量化的第2子带，以及确定要分配给子带之中的由第1量化单元(106)对其执行量化的第1子带的第1比特数；以及复用单元(108)，将从第1量化单元(106)和第2量化单元(107)输出的编码信息、量化子带能量和音调性的分析结果复用成信息并输出复用信息，第1量化单元(106)通过使用第1比特数来脉冲编码第1子带中包含的子带频谱之中的子带频谱；第2量化单元(107)通过使用基音滤波器，或者通过使用不同于第1量化单元使用的编码方法、用于获得从第2量化单元(107)输出的编码信息的编码方法，或者通过使用计算第2子带的滞后信息的编码方法来编码第2子带中包含的子带频谱之中的子带频谱。

本发明的用于解码编码信息的音响信号解码装置，包括：分离单元(201)，将编码信息分离为第1编码信息、第2编码信息、通过量化子带之中的每个子带的能量而获得的量化子带能量、以及对子带之中的每个子带计算的音调性的分析结果；比特分配单元(203)，基于音调性的分析结果和量化子带能量，从子带之中选择由第2解码单元对其执行解码的第2子带，以及确定要分配给子带之中的由第1解码单元对其执行解码的第1子带的第1比特数；以及频率时间转换单元(207)，通过对从第2解码单元输出的频谱执行到时域的转换来生成输出音响信号并将其输出，第1解码单元通过使用第1比特数解码第一编码信息来生成第1解码频谱，第2解码单元通过解码第2编码信息或者通过组合第2解码频谱和第1解码频谱来生成第2解码频谱，或者第2解码单元通过使用第二解码方法解码第二编码信息来生成第二解码信息，其中第二解码方法不同于用于生成第1解码频谱的第一解码方法，并且通过使用第2解码频谱和第1解码频谱执行解码来生成再生频谱。

本发明的终端装置，包括：如上所述的音响信号编码装置；以及发送编码信息的天线。

本发明的终端装置，包括：接收编码信息并将其输出到分离单元(201)的天线；以及如上所述的音响信号解码装置。

本发明的音响信号编码方法，包括：通过对输入音响信号执行到频域的转换来生成频谱；将频谱分割为规定的频带的子带并输出子带频谱；对每个子带求量化子带能量；分析子带频谱的音调性并输出分析结果；基于音调性的分析结果和量化子带能量，从子带之中选择第2子带；确定要分配给子带之中的第1子带的第1比特数；通过使用第1比特数对第1子带中包含的子带频谱之中的子带频谱进行编码来生成第1编码信息；通过使用基音滤波器或者编码方法对第2子带中包含的子带频谱之中的子带频谱进行编码来生成第2编码信息，其中编码方法不同于第1量化单元使用的编码方法或者编码方法计算第2子带的滞后信息；将第1编码信息和第2编码信息复用在一起并输出。

本发明的解码编码信息的音响信号解码方法，音响信号解码方法包括：将编码信息分离为第1编码信息、第2编码信息、通过量化子带之中的每个子带的能量而获得的量化子带能量、以及对子带之中的每个子带计算的音调性的分析结果；基于音调性的分析结果和量化子带能量，从子带之中选择第2子带；确定要分配给子带之中的第1子带的第1比特数；通过使用第1比特数解码第1编码信息来生成第1解码频谱；通过解码第2编码信息来生成第2解码频谱，以及通过使用第2解码频谱和第1解码频谱执行解码或者通过组合第2解码频谱和第1解码频谱或者通过使用不同于用于生成第1解码频谱的第一解码方法的第二解码方法解码第二编码信息来生成第二解码信息来生成再生频谱，或者通过使用第2解码信息和第1解码频谱执行解码来生成再生频谱；以及通过对再生频谱执行到时域的转换来生成输出音响信号并将其输出。

本发明提供了具有用于如上所述的方法的程序代码的计算机程序。

再有，这些概括性的并且具体的方式，也可以通过系统、方法、集成电路、或计算机程序来实现，也可以通过系统、装置、方法、集成电路和计算机程序的任意的组合来实现。

根据本发明的编码装置、解码装置等，可使整体的比特率降低，还能够编码和解码高质量的音响信号。

附图说明

图1是本发明的实施方式1中的编码装置的结构图。

图2是本发明的实施方式1中的编码装置的比特分配单元的详细结构图。

图3是表示本发明的实施方式1中的编码装置的动作的说明图。

图4是本发明的实施方式2中的解码装置的结构图。

图5是本发明的实施方式2中的解码装置的比特分配单元的详细结构图。

图6是说明现有技术的编码装置中的子带能量的说明图。

图7是说明现有技术的编码装置中的对子带的比特分配结果的说明图。

图8是说明现有技术的编码装置中的对子带的比特分配结果的说明图。

图9是说明现有技术的编码装置中的对子带的比特分配结果的说明图。

具体实施方式

以下，对本发明的实施方式的结构和动作，参照附图进行说明。再有，对本发明的编码装置的输入信号、和来自解码装置的输出信号即音响信号是语音信号、频带更宽的音乐信号、进而还包含混合了它们的信号的概念。

在本发明中，“输入音响信号”是音乐信号和语音信号、或者含包含混合了两者的信号的概念。此外，“量化子带能量”是子带内的子带频谱的能量的总和或平均即量化了子带能量所得的能量，子带能量例如能够以子带内的子带频谱的平方和来求。“音调性”是指在特定的频率分量中频谱的峰值成立的程度，其分析结果能够以数值或符号等表现。“脉冲编码”是指使用脉冲近似频谱的编码。

“相对低是指在子带间比较更低，例如低于全子带的平均的情况、低于规定的值的情况对应于此。“高频带的子带”是指多个子带之中位于高频率侧的子带。

再有，在实施方式和权利要求的范围中记载的、第1(频谱)量化单元、第2(频谱)量化单元、第1(频谱)解码单元、第2(频谱)解码单元、第1子带、第2子带、第3子带、第4子带、第1比特数、第2比特数、第3比特数、第4比特数分别意味着类别，没有意味着顺序。

(实施方式1)

图1是表示实施方式1的音响信号编码装置100的结构和动作的框图。图1所示的音响信号编码装置100包括时间-频率变换单元101、子带能量量化单元102、音调计算单元103、比特分配单元104、归一化单元105、第1频谱量化单元106、第2频谱量化单元107、复用单元108。此外，在复用单元108上，连接着天线A。而且，将音响信号编码装置100和天线A合并，构成终端装置或基站装置。

时间-频率变换单元101将时域的输入音响信号变换到频域，生成输入音响信号频谱(以下，设为“频谱”。)。作为时间-频率转换的例子，可列举MDCT(改进离散余弦变换)，但不限定于此，例如，也可以使用DCT(离散余弦变换)、DFT(离散傅立叶变换)、傅立叶变换等。

此外，时间-频率变换单元101将频谱分割为规定的频带即子带。规定的频带，除了为等间隔的情况之外，例如也可以是在高频带中较宽、在低频带中较窄等的不同的间隔。

然后，时间-频率变换单元101将分割为每个子带的频谱作为子带频谱输出到子带能量量化单元102、音调计算单元103、和归一化单元105。

子带能量量化单元102对每个子带求子带频谱的能量即子带能量，将它进行量化，求量化子带能量。具体地说，能够以子带内的子带频谱的平方和来求子带能量，但不限于此。例如，能够对每个子带将子带频谱的振幅积分来求子带能量。此外，在将子带能量进行平均的情况下，将平方和除以子带内的频谱数(子带宽度)。然后，将这样求得的子带能量按规定的节距宽度量化。

然后，将求得的量化子带能量输出到归一化单元105、和比特分配单元104，同时将编码了量化子带能量后的编码量化子带能量输出到复用单元108。

音调计算单元103对各子带中包含的子带频谱进行分析，判定音调性。音调性是指在特定的频率分量中频谱的峰值成立的程度，是包含意味着存在明显的峰值的峰值性的概念。例如，能够以作为对象的子带内的平均频谱的振幅和在该子带内存在的最大频谱的振幅之比定量地求，在该值超过规定的阈值的情况下，定义为该子带的频谱具有音调性(峰值性)。在本实施方式中，超过规定的阈值的情况生成“1”作为峰值/音调标志，规定的阈值以下的情况生成“0”作为峰值/音调标志，将它作为分析结果输出到比特分配单元104和复用单元108。当然，也可以将上述比直接作为分析结果输出。

音调计算单元的意义如下。

在低比特率条件下，在如噪声的频谱那样、频谱的能量分散在整个子带的频谱的高效率的量化上，使用基于基音滤波器的方法(即，利用低频带频谱表现高频带频谱的方法)是有效的。因此，从子带内的频谱的峰值性/音调性的尺度(峰值功率和平均功率之比等)判定子带内的能量分散度，峰值性/音调性不高的频谱的子带成为基于基音滤波器量化的对象。

比特分配单元104参照每个子带的量化子带能量和峰值/音调标志，对各子带中的子带频谱，从意味着能够用于编码的总比特数的、比特资产中分配比特。具体地说，计算和确定对由第1频谱量化单元量化的子带即第1子带分配的比特数，即第1比特数，将其输出到第1频谱量化单元106，作为分配比特信息。此外，选择和确定由第2频谱量化单元107量化的子带、即第2子带，将其输出到第2频谱量化单元107作为量化模式。

比特分配单元104的结构及动作的细节将后述。

再有，在本实施方式中，比特分配单元104以峰值/音调标志和每个子带的量化子带能量的顺序进行参照，但参照的顺序是任意的。

此外，在第2频谱量化单元107中成为量化的对象的第2子带，可以将全频带作为候选，但一般地，量化子带能量较低的频带和音调性较低的频带主要是高频带，所以也可以仅将在特定的高频带中存在的子带作为对象。例如，能够仅将高频带的4个或5个子带作为对象。

或者，通常，低频带侧的音调性较高，高频带侧的音调性较低，所以音响信号实质上高频带侧的子带成为基于基音滤波器量化的对象。因此，也可以是从以音调性选择出的子带中高频带侧全部成为基音滤波器的量化的对象，仅发送该子带的号作为量化模式的方法。

归一化单元105通过将各子带频谱以被输入的量化子带能量进行归一化(除法运算)，生成归一化子带频谱。由此，子带间的振幅的大小的差异被归一化。然后，归一化单元105将归一化子带频谱输出到第1频谱量化单元106和第2频谱量化单元107。

再有，归一化单元105是任意的结构。

此外，归一化单元105在本实施方式中是一个的结构，但也可以配置在第1频谱量化单元106和第2频谱量化单元107各自的前级而为两个。

第1频谱量化单元106是第1量化单元的一例，使用由比特分配单元104分配的第1比特数组成的比特，将被输入的归一化子带频谱之中属于要由第1频谱量化单元106量化的第1子带的子带频谱进行量化。然后，将量化的结果作为量化频谱输出到第2频谱量化单元107，同时将量化频谱编码并将生成的第1编码信息输出到复用单元108。

第1频谱量化单元106使用脉冲编码单元，但作为脉冲编码单元的例子，可列举进行点阵向量量化的点阵向量量化单元、进行以少数的脉冲近似子带频谱的脉冲编码的脉冲编码单元。即，只要是适合于音调性高的频谱的量化的量化方法、以少数的脉冲进行量化的方法，能够使用任意的量化单元。

再有，在非常低的比特率中，能够期待用比点阵向量量化少的少数脉冲近似子带频谱的脉冲编码的量化方式维持更好音质的效果。

第2频谱量化单元107是第2量化单元的一例，例如能够采用以下那样的扩展频带(基音滤波器的预测模型)的量化法。

这里，基音滤波器是进行用以下的式1表示的处理的处理块。

y[i]＝x[i]+β×y[i-T]

(1)

一般地，基音滤波器指对于时间轴的信号增强基音周期(T)的(频率轴上增强基音分量)滤波器，在抽头数为1的情况下，对于离散信号x[i]，例如是以式1表示的数字滤波器。但是，本实施方式中的基音滤波器，被定义作为进行用式1表示的处理的处理块，不必一定对于时间轴的信号进行基音增强。

在本实施方式中，将所述基音滤波器(以式1表示的处理块)适用于量化MDCT系数列Mq[i]。具体地在式1中，设为x[i]＝0(i≥K，K为作为编码对象的MDCT系数的频率下限)、y[i]＝Mq[i](i＜K)并计算y[i](K≤i≤K’，K’为作为编码对象的MDCT系数的频率上限)。将设为编码对象的MDCT系数Mt[i]和算出的y[i]的误差为最小的T作为滞后信息进行编码。基于这样的基音滤波器的频谱编码，公开在专利文献2等中。

第2频谱量化单元107参照量化模式确定要由第2频谱量化单元107量化的第2子带(归一化子带频谱)。由此，所述K和K’被确定。然后，搜索确定后的第2子带(频率K～K’)中的归一化子带频谱(所述Mt[i]，相当于K≤i≤K’)与量化频谱(所述Mq[i]，相当于i＜K)之间的关系中相关为最大的量化频谱的子带或频带，将该位置作为滞后信息(相当于所述T)生成。滞后信息，作为例子可列举子带或频带的绝对位置或相对位置、或子带的号。然后，第2频谱量化单元107将滞后信息编码，作为第2编码信息输出到复用单元108。

再有，在本实施方式中，将编码量化子带能量由复用单元108进行复用并发送，在解码单元侧能够生成增益，所以增益不进行编码。但是，也可以将增益编码并传送。在那时计算与要量化的第2子带相关为最大的量化频谱的子带之间的增益，第2频谱量化单元107将滞后信息和增益编码，作为第2编码信息输出到复用单元108。

再有，一般来说，高频带的子带的带宽设定得宽于低频带的子带的带宽，但对于被复制的低频带的子带的一部分，由于能量较小，所以还可能有不为点阵向量量化的对象的情况。在这样的情况下，那样的子带视为零频谱、或进行噪声附加而避免子带间的频谱的突变即可。

复用单元108将量化子带能量、第1编码信息、第2编码信息和峰值/音调标志进行复用，作为编码信息输出到天线A。

然后，天线A向音响信号解码装置发送编码信息。编码信息经由各种节点或基站到达音响信号解码装置。

接着，说明比特分配单元104的细节。

图2是表示实施方式1的音响信号编码装置100的比特分配单元104的详细的结构和动作的框图。图2所示的比特分配单元104由比特库111、比特库112、比特分配计算单元113、量化模式确定单元114构成。

比特库111参照音调计算单元103的输出即峰值/音调标志，确保在峰值/音调标志为“0”的情况下、由第2频谱量化单元107进行的第2频谱量化所需要的比特数。

在本实施方式中，基于基音滤波器，确保滞后信息的编码上需要的比特数。而且，从能够用于量化的总比特数即比特资产中除去被确保的比特数，剩余的比特资产被输出到比特库112。再有，从子带能量量化单元102供给比特资产，这表现了除去了为了将量化子带能量进行可变长度编码所需要的比特数后的比特，能够用于第1频谱量化单元106、第2频谱量化单元107、和峰值/音调标志的量化(编码)。子带能量量化单元102不限于生成比特资产的信息。

比特库112确保用于峰值/音调标志的比特数。例如，在本实施方式中，以高频带的5子带传送峰值/音调标志，所以比特库112确保5比特。

然后，比特库112将从比特库111输入的比特资产中除去了由比特库112确保的比特数所得的比特数，输出到自适应比特分配单元中的比特分配计算单元113。再有，比特库111和比特库112中确保的比特数的合计为第3比特数。此外，峰值/音调标志为零的子带对应于第3子带。

再有，比特库111和比特库112也可以调换顺序。此外，在本实施方式中，分为比特库111和比特库112的块，但也可以将比特库在一个块中同时地进行。或者，也可以在比特分配计算单元113之中进行这些动作。

比特分配计算单元113计算由第1频谱量化单元106量化的对子带的比特分配。具体地说，首先，将从比特库112输出的比特数参照量化子带能量分配给各子带。分配方法，如在现有技术部分中说明的，以量化子带能量的大小判断听觉上是否重要，对被认为重要的子带重点地进行比特分配。作为结果，量化子带能量为零、或低于零及规定的值的子带中没有被分配比特。

此外，参照分配时被输入的峰值/音调标志，从比特分配的对象中排除峰值/音调标志为“0”的子带(第3子带)。即，仅将峰值性较高的子带(这里为峰值/音调标志被设定为“1”的子带)作为比特分配的对象子带分配比特。然后，确定要被分配比特的子带(第1子带)，同时合并对各子带分配的比特数并设为分配比特信息，将其首先输出到量化模式确定单元114。

量化模式确定单元114接收从比特分配计算单元113输出的分配比特信息和峰值/音调标志。然后，在存在音调性较高(第1频谱量化单元106的量化对象)而没有被比特分配的高频带子带的情况下，该子带重新定义为由第2频谱量化单元107量化的子带(第4子带)，为了从分配比特信息减去而将由第2频谱量化单元量化所必要的比特数(第4比特数)输出到比特分配计算单元113。即，对该频带分配用于由第2频谱量化单元107量化而必要的比特数，输出该分配的比特数(第4比特数)。也可以取代为，从第1频谱量化单元106可使用的比特资产中减去相当于分配的比特数，将其输出到比特分配计算单元113。

此外，量化模式确定单元114确定由第2频谱量化单元107量化的子带，将其输出到第2频谱量化单元107作为量化模式。具体地说，将音调为低的(峰值/音调标志为“0”)高频带子带(第3子带)、以及没有被分配比特的高频带子带(第4子带)确定为由第2频谱量化单元107量化的子带(第2子带)，作为量化模式输出。

在比特分配计算单元113中，通过从比特库112输入的比特数(比特资产)中减去从量化模式确定单元114接收到的比特数(第4比特数)，再次更新比特资产，再次计算对由第1频谱量化单元106量化的子带的比特分配。在从量化模式确定单元接受更新后的比特资产的情况下，使用更新后的比特资产，再次计算对由第1频谱量化单元106量化的子带的比特分配。最终，第1比特数为从总比特数(比特资产)减去第3比特数和第4比特数所得的值。

然后，将再次计算后的比特数(第1比特数)和由第1频谱量化单元106量化的子带(第1子带)的信息作为分配比特信息，这次输出到第1频谱量化单元106。

再有，第1次中由比特分配计算单元113计算了比特分配的结果，在任何子带都不必进行被比特分配等的再次计算情况下，也可以直接将分配比特信息输出到第1频谱量化单元106。

图3是表示实施方式1的音响信号编码装置100的动作的流程图，具体地说，是表示比特分配单元104的动作的流程图。

首先，比特分配单元104从子带能量量化单元102获取量化子带能量(S1)。

接着，比特分配单元104从音调计算单元103获取高频带中的峰值/音调标志(S2)。

然后，比特分配单元104基于峰值/音调标志，确定要由第2频谱量化单元107量化的子带(第3子带)，并且在比特库111和比特库112中，确保用于由第2频谱量化单元107量化的比特(第3比特数)(S3)。

在比特分配计算单元113中，基于量化子带能量，比特分配单元104确定对作为第1频谱量化单元106的量化对象的子带分配的比特数(S4)。

在量化模式确定单元114中，比特分配单元104检查由比特分配计算单元113确定的对高频带子带的分配比特，根据需要，再次确定要由第2频谱量化单元107量化的子带(第2子带)，更新用于第1子带量化单元106的比特资产(S5)。

然后，在最后，比特分配单元104再次使用在比特分配计算单元113中更新后的比特资产，再次计算对第1频谱量化单元106的比特分配(第1比特数)(S6)。

以上，根据本实施方式的音响信号编码装置，能够降低整体的比特率，并且能够实现高质量的音响信号的编码。

特别地，根据图2、图3的结构和动作，在子带宽度特别宽的高频带中，不发生没有量化的(比特分配为“0”)子带，能够实现将由第1量化单元量化的子带数为最大的比特分配。因此，能够在有限的比特率中提取最佳性能，能够实现自适应比特分配。

(实施方式2)

图4是表示实施方式2的音响信号解码装置200的结构和动作的框图。图4所示的音响信号解码装置200，由分离单元201、子带能量解码单元202、比特分配单元203、第1频谱解码单元204、第2频谱解码单元205、解归一化单元206、频率-时间转换单元207构成。此外，在分离单元201中，连接着天线A。而且，将音响信号解码装置200和天线A合并，构成终端装置或基站装置。

分离单元201接收由天线A接收到的编码信息，将编码量化子带能量、第1编码信息、第2编码信息、和峰值/音调标志进行分离。然后，编码量化子带能量被输出到子带能量解码单元202，第1编码信息被输出到第1频谱解码单元204，第2编码信息被输出到第2频谱解码单元205，而峰值/音调标志被输出到比特分配单元203。

子带能量解码单元202将编码量化子带能量进行解码，生成解码量化子带能量，输出到比特分配单元203和解归一化单元206。

比特分配单元203参照每个子带的解码量化子带能量、以及峰值/音调标志，确定在第1频谱解码单元204和第2频谱解码单元205中分配的比特的分配。具体地说，确定在由第1频谱解码单元204解码了第1编码信息时被分配的比特数(第1比特数)和被分配比特的子带(第1子带)，作为分配比特信息输出，同时确定和选择由第2频谱解码单元205解码的第2编码信息要被解码的子带(第2子带)，将其输出到第2频谱解码单元205作为量化模式。

如图5所示，比特分配单元203与在编码装置侧中说明的比特分配单元104的结构和动作相同，所以动作的细节，引用编码装置侧的比特分配单元104的说明。

第1频谱解码单元204使用分配比特信息中表示的第1比特数，解码第1编码信息，生成第1解码频谱，并输出到第2频谱解码单元205。

第2频谱解码单元205对在量化模式中确定的子带使用第1解码频谱，解码第2编码信息，生成第2解码频谱，结合该第2解码频谱和第1解码频谱，生成再生频谱并输出。

解归一化单元206参照解码量化子带能量，调整再生频谱的振幅(增益)，将它输出到频率-时间转换单元207。

频率-时间转换单元207将频域的再生频谱转换为时域的输出音响信号并输出。作为频率-时间转换的例子，可列举以频率-时间列举的转换的逆转换。

以上，根据本实施方式的音响信号解码装置，能够降低整体的比特率，并且能够实现高质量的音响信号的解码。

(总结)

以上，在实施方式1、2中说明了本发明的音响信号编码装置和音响信号解码装置。本发明的编码装置和解码装置也可以是以主板和半导体元件为代表的半完成品和部件级别的形式，是还包含终端装置和基站装置那样的完成品级别的形式的概念。在本发明的编码装置和解码装置为半完成品和部件级别的形式的情况下，通过与天线、DA/AD转换器、放大单元、扬声器、以及话筒等组合，成为完成品级别的形式。

再有，图1、图2、图4、图5的框图表示设计为专用的硬件的结构和动作(方法)，并且包含通过在通用的硬件中安装用于执行本发明的动作(方法)的程序，并由处理器执行来实现的情况。作为用作通用的硬件的电子计算机，例如可列举个人计算机、智能手机等的各种移动信息终端、以及移动电话等。

此外，设计为专用的硬件不限于移动电话和固定电话等的完成品级别(消费电子)，还包括主板和半导体元件等半完成品和部件级别。

根据本公开的实施例，至少公开了如下音响信号编码装置、音响信号解码装置、音响信号编码方法以及音响信号解码方法。

根据本公开的实施例的音响信号编码装置，包括：时间频率变换单元，将输入音响信号转换到频域并生成频谱，将所述频谱分割为每个规定的频带的子带，输出子带频谱；子带能量量化单元，对每个所述子带求量化子带能量；音调计算单元，分析所述子带频谱的音调性并输出分析结果；比特分配单元，基于所述音调性的分析结果和所述量化子带能量，从所述子带之中选择由第2量化单元中量化的第2子带，确定被分配给由第1量化单元量化的第1子带的第1比特数；以及复用单元，将包含从所述第1量化单元及所述第2量化单元输出的编码信息、所述量化子带能量和所述音调性的分析结果的信息进行复用并输出，所述第1量化单元将所述第1子带中包含的子带频谱，使用由所述第1比特数组成的比特进行脉冲编码；所述第2量化单元将所述第2子带中包含的子带频谱，使用基音滤波器进行编码。

根据本公开的实施例的音响信号编码装置，所述比特分配单元从高频带的所述子带中选择所述第2子带。

根据本公开的实施例的音响信号编码装置，所述比特分配单元将所述音调性低于规定的阈值的所述子带选择作为所述第2子带。

根据本公开的实施例的音响信号编码装置，所述比特分配单元将所述量化子带能量为零或低于规定的值的所述子带选择作为所述第2子带。

根据本公开的实施例的音响信号编码装置，所述比特分配单元将从能够用于量化的总比特数减去对所述第2子带分配的第2比特数后所得的比特数，确定作为所述第1比特数。

根据本公开的实施例的音响信号编码装置，所述比特分配单元计算从所述总比特数之中、对基于所述音调性的分析结果选择出的第3子带分配的第3比特数，在将从所述总比特数减去所述第3比特数后的比特数基于所述量化子带能量分配给所述第1子带时，将未被分配比特的所述子带选择作为第4子带，计算在将所述第4子带由所述第2量化单元编码的情况下被分配的第4比特数，将所述第3子带和所述第4子带重新选择作为由所述第2量化单元量化的所述第2子带，将从所述总比特数减去所述第3比特数和所述第4比特数后的比特数确定作为对由所述第1量化单元量化的所述第1子带分配的所述第1比特数。

根据本公开的实施例的音响信号编码装置，所述音调计算单元的分析结果，作为表示音调性是否高于规定的阈值的标志被输出。

根据本公开的实施例的音响信号解码装置，其解码从音响信号编码装置输出的编码信息，包括：分离单元，将所述编码信息分离为第1编码信息、第2编码信息、量化了对每个子带求得的能量的量化子带能量、以及对每个子带计算的音调性的分析结果；比特分配单元，基于所述音调性的分析结果和所述量化子带能量，从所述子带之中选择由第2解码单元解码的所述第2子带，确定对由第1解码单元解码的第1子带分配的所述第1比特数；以及频率时间转换单元，将从所述第2解码单元输出的频谱转换到时域，生成输出音响信号并输出，所述第1解码单元通过将所述第1编码信息使用由所述第1比特数组成的比特进行解码，生成第1解码频谱，所述第2解码单元解码所述第2编码信息，生成第2解码频谱，通过使用所述第2解码频谱和所述第1解码频谱进行解码，生成再生频谱。

根据本公开的实施例的终端装置，包括：权利要求1所述的音响信号编码装置；以及发送所述编码信息的天线。

根据本公开的实施例的基站装置，包括：权利要求1所述的音响信号编码装置；以及发送所述编码信息的天线。

根据本公开的实施例的终端装置，包括：接收所述编码信息并输出到所述分离单元的天线；以及权利要求8所述的音响信号解码装置。

根据本公开的实施例的基站装置，包括：接收所述编码信息并输出到所述分离单元的天线；以及权利要求8所述的音响信号解码装置。

根据本公开的实施例的音响信号编码方法，包括以下步骤：将输入音响信号转换到频域并生成频谱；将所述频谱分割为每个规定的频带的子带并输出子带频谱；对每个所述子带求量化子带能量；分析所述子带频谱的音调性并输出分析结果；基于所述音调性的分析结果和所述量化子带能量，从所述子带之中选择第2子带；确定被分配给第1子带的第1比特数；将所述第1子带中包含的所述子带频谱，使用由所述第1比特数组成的比特进行编码并生成第1编码信息；将所述第2子带中包含的所述子带频谱，使用基音滤波器进行编码并生成第2编码信息；将所述第1编码信息和所述第2编码信息进行复用并输出。

根据本公开的实施例的解码从音响信号编码装置输出的编码信息的音响信号解码方法，包括以下步骤：将所述编码信息分离为第1编码信息、第2编码信息、量化了对每个子带求得的能量的量化子带能量、以及对每个子带计算的音调性的分析结果；基于所述音调性的分析结果和所述量化子带能量，从所述子带之中选择第2子带；确定对第1子带分配的第1比特数；将所述第1编码信息使用由所述第1比特数组成的比特进行解码并生成第1解码频谱；解码所述第2编码信息并生成第2解码频谱，使用所述第2解码频谱和所述第1解码频谱进行解码并生成再生频谱；将所述再生频谱转换到时域，生成输出音响信号并输出。

工业实用性

本发明的音响信号编码装置和音响信号解码装置，可应用于与音响信号的记录、传输、再生有关的设备和部件。

标号说明

100 音响信号编码装置

101 时间-频率变换单元

102 子带能量量化单元

103 音调计算单元

104 比特分配单元

105 归一化单元

106 第1频谱量化单元

107 第2频谱量化单元

108 复用单元

111 比特库

112 比特库

113 比特分配计算单元

114 量化模式确定单元

200 音响信号解码装置

201 分离单元

202 子带能量解码单元

203 比特分配单元

204 第1频谱解码单元

205 第2频谱解码单元

206 解归一化单元

207 频率-时间转换单元

211 比特库

212 比特库

213 比特分配计算单元

214 量化模式确定单元

Claims

1.一种音响信号编码装置，包括：

时间频率变换单元(101)，通过对输入音响信号执行到频域的转换来生成频谱，将所述频谱分割为规定的频带的子带，以及输出子带频谱；

子带能量量化单元(102)，对每个子带求量化子带能量；

音调计算单元(103)，分析所述子带频谱的音调性并输出分析结果；

比特分配单元(104)，基于所述音调性的分析结果和所述量化子带能量，从所述子带之中选择由第2量化单元(107)对其执行量化的第2子带，以及确定要分配给所述子带之中的由第1量化单元(106)对其执行量化的第1子带的第1比特数；以及

复用单元(108)，将从所述第1量化单元(106)和所述第2量化单元(107)输出的编码信息、所述量化子带能量和所述音调性的分析结果复用成信息并输出复用信息，

所述第1量化单元(106)通过使用所述第1比特数来编码所述第1子带中包含的子带频谱之中的子带频谱；以及

所述第2量化单元(107)通过使用基音滤波器，或者通过使用不同于所述第1量化单元使用的编码方法、用于获得从第2量化单元(107)输出的编码信息的编码方法，或者通过使用计算第2子带的滞后信息的编码方法来编码所述第2子带中包含的子带频谱之中的子带频谱。

2.如权利要求1所述的音响信号编码装置，

所述比特分配单元(104)从处于高频率范围的子带之中选择所述第2子带。

3.如权利要求2所述的音响信号编码装置，

所述比特分配单元(104)将所述子带之中的音调性低于规定的阈值的子带选择作为所述第2子带。

4.如权利要求2所述的音响信号编码装置，

所述比特分配单元(104)将所述子带之中的量化子带能量等于零或低于规定的值的子带选择作为所述第2子带。

5.如权利要求1所述的音响信号编码装置，

所述比特分配单元(104)通过从可用于量化的总比特数减去要分配给所述第2子带的第2比特数来确定所述第1比特数。

6.如权利要求5所述的音响信号编码装置，

所述比特分配单元(104)计算所述总比特数之中要分配给第3子带的第3比特数，所述第3子带是基于音调性的分析结果从所述子带之中选择的；

在通过从所述总比特数减去所述第3比特数而获得的比特数基于量化子带能量而被分配给所述第1子带时，将所述子带之中的未被分配比特的子带选择作为第4子带，以及计算在由所述第2量化单元(107)对所述第4子带执行编码的情况下被分配的第4比特数，以及

将所述第3子带和所述第4子带选择作为由所述第2量化单元(107)对其执行量化的另外的第2子带，以及将通过从所述总比特数减去所述第3比特数和所述第4比特数而获得的比特数确定为要分配给由所述第1量化单元(106)对其执行量化的第1子带的第1比特数。

7.如权利要求1所述的音响信号编码装置，

来自所述音调计算单元(103)的分析结果，作为表示音调性是否高于规定的阈值的标志被输出。

8.如权利要求1所述的音频信号编码装置，所述装置被配置为：

获得量化的子带能量，

获得高频范围内的峰值/音调标志，

识别所述第2量化单元将要对其执行量化的子带并确保在所述第2量化单元的量化中要使用的比特，

基于量化的子带能量确定要分配给将由所述第1量化单元对其进行量化的子带的比特数，

检查分配给高频范围内的子带的比特数，根据需要再次识别所述第2量化单元将要对其执行量化的第二子带，并更新用于所述第1量化单元的比特预算，以及

使用更新的比特预算重新计算用于所述第1量化单元的比特分配。

9.一种用于解码编码信息的音响信号解码装置，包括：

分离单元(201)，将所述编码信息分离为第1编码信息、第2编码信息、通过量化子带之中的每个子带的能量而获得的量化子带能量、以及对子带之中的每个子带计算的音调性的分析结果；

比特分配单元(203)，基于所述音调性的分析结果和所述量化子带能量，从所述子带之中选择由第2解码单元对其执行解码的第2子带，以及确定要分配给所述子带之中的由第1解码单元对其执行解码的第1子带的第1比特数；以及

频率时间转换单元(207)，通过对从所述第2解码单元输出的频谱执行到时域的转换来生成输出音响信号并将其输出，

所述第1解码单元通过使用所述第1比特数解码所述第一编码信息来生成第1解码频谱，以及

所述第2解码单元通过解码所述第2编码信息或者通过组合第2解码频谱和第1解码频谱来生成第2解码频谱，或者所述第2解码单元通过使用第二解码方法解码第二编码信息来生成第二解码信息，其中所述第二解码方法不同于用于生成所述第1解码频谱的第一解码方法，并且通过使用所述第2解码频谱和所述第1解码频谱执行解码来生成再生频谱。

10.如权利要求9所述的音频信号解码装置，其中编码的第2信息是编码的滞后信息，其中解码的第2信息是解码的滞后信息，并且其中所述第2解码单元使用所述第1解码频谱和所述滞后信息来计算所述再生频谱。

11.一种终端装置，包括：

权利要求1所述的音响信号编码装置；以及

发送编码信息的天线。

12.一种终端装置，包括：

接收编码信息并将其输出到分离单元(201)的天线；以及

权利要求9所述的音响信号解码装置。

13.一种音响信号编码方法，包括：

通过对输入音响信号执行到频域的转换来生成频谱；

将所述频谱分割为规定的频带的子带并输出子带频谱；

对每个所述子带求量化子带能量；

分析所述子带频谱的音调性并输出分析结果；

基于所述音调性的分析结果和所述量化子带能量，从所述子带之中选择第2子带；

确定要分配给所述子带之中的第1子带的第1比特数；

通过使用所述第1比特数对所述第1子带中包含的子带频谱之中的子带频谱进行编码来生成第1编码信息；

通过使用基音滤波器或者编码方法对所述第2子带中包含的子带频谱之中的子带频谱进行编码来生成第2编码信息，其中所述编码方法不同于所述第1量化单元使用的编码方法或者所述编码方法计算第2子带的滞后信息；以及

将所述第1编码信息和所述第2编码信息复用在一起并输出。

14.一种解码编码信息的音响信号解码方法，所述音响信号解码方法包括：

将所述编码信息分离为第1编码信息、第2编码信息、通过量化子带之中的每个子带的能量而获得的量化子带能量、以及对子带之中的每个子带计算的音调性的分析结果；

确定要分配给所述子带之中的第1子带的第1比特数；

通过使用所述第1比特数解码所述第1编码信息来生成第1解码频谱；

通过解码所述第2编码信息来生成第2解码频谱，以及通过使用所述第2解码频谱和所述第1解码频谱执行解码或者通过组合所述第2解码频谱和所述第1解码频谱或者通过使用不同于用于生成所述第1解码频谱的第一解码方法的第二解码方法解码所述第二编码信息来生成第二解码信息来生成再生频谱，或者通过使用所述第2解码信息和所述第1解码频谱执行解码来生成再生频谱；以及

通过对所述再生频谱执行到时域的转换来生成输出音响信号并将其输出。

15.一种具有用于执行权利要求13或权利要求14的方法的程序代码的计算机程序。