WO2012149843A1

WO2012149843A1 - 音频信号编解码方法和设备

Info

Publication number: WO2012149843A1
Application number: PCT/CN2012/072778
Authority: WO
Inventors: 齐峰岩; 刘泽新; 苗磊
Original assignee: 华为技术有限公司
Priority date: 2011-07-13
Filing date: 2012-03-22
Publication date: 2012-11-08
Also published as: US11127409B2; US9984697B2; US20200135219A1; PT3174049T; US20130018660A1; EP3174049B1; US10546592B2; US9105263B2; KR20160149326A; KR101690121B1; JP6702593B2; JP2018106208A; ES2718400T3; JP5986199B2; EP2613315B1; KR20140005358A; JP2016218465A; JP6321734B2; CN102208188B; EP3174049A1

Description

音频信号编解码方法和 i殳备

技术领域

本发明实施例涉及音频编解码技术领域，并且更具体地，涉及音频信号编解码方法和设备。

发明背景

目前的通信传输越来越重视音频的质量，所以要求编解码时在保证语音质量的前提下要尽可能地提高音乐质量。由于音乐信号信息量极为丰富，不能采用传统语音的 CELP ( Code Exc i ted Linear Predict ion, 码激励线性预测）编码模式，通常是利用变换编码的方法，在频域来处理音乐信号，提升音乐信号的编码质量。但如何有效地用有限的编码比特高效率的编码信息成为目前音频编码的主要研究课题。

目前的音频编码技术通常采用 FFT ( Fas t Four i er Transform, 快速傅立叶变换 )或 MDCT ( Modif ied Di screte Cos ine Transform, 改进离散余弦变换 )将时域信号转换到频域，然后对频域信号进行编码。由于在低比特率下有限的量化比特不能满足量化所有的音频信号，所以一般还要采用 BWE ( Bandwidth Extens ion 频带扩展）技术和频谱填充技术。

在编码端，首先将输入的时域信号变换到频域，在频域提取子带归一化因子，即频谱的包络信息。然后用量化后的子带归一化因子对频谱进行归一化，得到归一化的频谱信息。然后确定各子带的比特分配，对归一化的频谱进行量化，这样音频信号就被编码为量化的包络信息和归一化的频谱信息，输出比特率流。

解码端是编码端的逆过程。低速率编码时编码端不能编码所有频带，在解码端需要用带宽扩展技术来恢复编码端没有编码的频带。同时编码的子带由于量化器的限制也会出现较多的零频点，需要噪声填充模块来提升性能。最后用解码后的子带归一化因子应用到解码后的归一化频谱系数得到重建频谱系数，然后进行反变换得到输出的时域音频信号。

但是，在编码过程中，高频谐波会分到一些零散的比特进行编码，但在时间轴上分布并不连续，使得解码时重建的高频谐波时断时续，会引入过多噪声，重建音频质量差。发明内容

本发明实施例提供一种音频信号编解码方法和设备，能够提高音频质量。

一方面，提供了一种音频信号编码方法，包括：将音频信号的频带分为多个子带，量化每个子带的子带归一化因子；根据量化后的子带归一化因子，或者根据量化后的子带归一化因子和码率信息，确定比特分配的信号带宽；对所确定的信号带宽内的子带分配比特；根据每个子带分配的比特，对音频信号的频谱系数进行编码。另一方面，提供了一种音频信号解码方法，包括：获取量化后的子带归一化因子；根据量化后的子带归一化因子，或者根据量化后的子带归一化因子和码率信息，确定比特分配的信号带宽；对所确定的信号带宽内的子带分配比特；根据每个子带分配的比特，对归一化频谱进行解码；对解码后的归一化频谱进行噪声填充和带宽扩展，得到归一化的全频带频谱；根据归一化的全频带频谱和子带归一化因子，获得音频信号的频谱系数。

另一方面，提供了一种音频信号编码设备，包括：量化单元，用于将音频信号的频带分为多个子带，量化每个子带的子带归一化因子；第一确定单元，用于根据量化单元量化的子带归一化因子，或者根据量化后的子带归一化因子和码率信息，确定比特分配的信号带宽；第一分配单元，用于对第一确定单元确定的信号带宽内的子带分配比特；编码单元，用于根据分配单元为每个子带分配的比特，对音频信号的频谱系数进行编码。

另一方面，提供了一种音频信号解码设备，包括：获取单元，用于获取量化后的子带归一化因子；第二确定单元，用于根据获取单元获取的量化后的子带归一化因子，或者根据量化后的子带归一化因子和码率信息，确定比特分配的信号带宽；第二分配单元，用于对第二确定单元确定的信号带宽内的子带分配比特；解码单元，用于根据第二分配单元为每个子带分配的比特，对归一化频谱进行解码；扩展单元，用于对解码后的归一化频谱进行噪声填充和带宽扩展，得到归一化的全频带频谱；恢复单元，用于根据归一化的全频带频谱和子带归一化因子，获得音频信号的频谱系数。

本发明实施例在编解码过程中，根据量化后的子带归一化因子或码率信息，确定比特分配的信号带宽，从而能够集中比特数对所确定的信号带宽进行有效编解码，提高音频质量。附图简要说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作筒单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图 1是本发明一个实施例的音频信号编码方法的流程图。图 2是本发明一个实施例的音频信号解码方法的流程图。图 3是本发明一个实施例的音频信号编码设备的框图。

图 4是本发明另一实施例的音频信号编码设备的框图。

图 5是本发明一个实施例的音频信号解码设备的框图。

图 6是本发明另一实施例的音频信号解码设备的框图。实施本发明的方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图 1是本发明一个实施例的音频信号编码方法的流程图。 101 , 将音频信号的频带分为多个子带，量化每个子带的子带归一化因子。

下面以 MDCT变换为例进行描述。首先对输入的音频信号进行 MDCT变换，得到频域系数。这里的 MDCT变换可包括加窗、时域混叠和离散 DCT变换几个过程。

例如对输入时域信号 ^x(ⁿ)加正弦窗 n = 0,..., 2L-l L为信号的帧长

得到加窗后的信号为: ^h(n) o_m (n), n = 0,..., L-l

h(n)x(n- L), n = L,..., 2L-l

( 2 )

然后进行时域混叠操作:

这里的和」 U2分别表示为阶数为 L/ ²的对角矩阵:

对时域混叠信号做离散 DCT变换，最终得到频域的 MDCT系数:

然后从 MDCT系数中提取频域包络并量化。将整个频带分成一些不同频域分辨率的子带，提取每个子带的归一化因子，并量化子带归一化因子。

例如对于 32kHz采样的音频信号，对应 16kHz带宽的频带，如帧长为 20ms ( 640样点），则可以按照如下表 1中的形式分子带。

分组的子带划

子带内系组内子组内总带宽（Hz) 开始频点结束频点数个数带数系数个 (Hz) (Hz) 数 8 16 128 3200 0 3200I 16 8 128 3200 3200 6400I I 24 12 288 7200 6400 13600

首先分成几个组，然后组内再细化子带，每个子带的归

子可定义为：

Norm(p)

这里是子带内的系数个数， ^SP是子带的起始点， ^EP是子带的结束点， P为总共的子带数。

得到归一化因子后，可以在对数域对其进行量化，得到量化后的子带归一化因子 wnorm。

102 , 根据量化后的子带归一化因子，或者根据量化后的子带归一化因子和码率信息，确定比特分配的信号带宽。

可选地，在一个实施例中，可将比特分配的信号带宽 sfm_ 1 imi t 限定为音频信号的部分带宽，例如低频上的部分带宽（Tsfm_ l imi t 或者中间的部分带宽。

在一个例子中，在限定比特分配带宽 sfm_ l imi t时，可根据码率信息确定比率因子 fact ,该比率因子 fact大于 0且小于或等于 1。在一个实施例中，码率越小，则比率因子越小。例如，可按照如下表 1得到不同的码率取对应的 fact值。

表 2 码率和 fact值对应表：

码率 24kpbs 0.8

32kbps 0.9

48kpbs 0.95

>64kbps 1

或者，也可以根据等式得到 fact , 例如 f ac t=qx (0.5+ bitrate-value/128000) , 其中 bi trate—value 为码率的值如 24000, q为修正因子。例如可以设 d=l。本发明实施例不限于这些具体数值示例。

然后根据该比率因子 fact和量化后的子带归一化因子 wnorm, 确定上述部分带宽。可根据量化后的子带归一化因子，获取每个子带内的频谱能量，并从低频向高频累加每个子带内的频谱能量，直至累加的频谱能量大于所有子带的总频谱能量与比率因子 fact的乘积，将当前子带以下的带宽作为部分带宽。

举例来说，可以首先设定一个最低累计频点，求出低于此频点的各子带的频谱能量和 energy_low。可按照以下等式，根据自带归一化因子获得频谱能量：

q

energy― low = ^ wnorm( p) , q≤ P - 1

ρ=⁰ (7) 其中， q为设定的最低累计频点对应的子带。

依次类推，继续增加子带，直至求出所有子带的总频谱能量 energy_sum。

在 energy_low的基础上，从低频向高频逐一增加子带，累加得到频谱能量 energy— limit, 并判断是否满足 energy.1 imi t > factxenergy_sum₀ 如果不满足，则继续累加子带的频谱能量。如果满足，则当前子带作为所限定的部分带宽的最后一个子带，输出当前子带的编号 sfm_limit, 用以表征所限定的部分带宽，即 0 sfm_limit；。

上面的例子中，使用码率信息确定比率因子 fact。在另一个例子中， fact 可以通过子带归一化因子进行确定。例如，首先根据子带归一化因子获取音频信号的谐波等级或噪声水平 noise-leveh 一般而言，音频信号的谐波等级越大，则噪声水平越小。下面以噪声水平为例进行说明。可按照下式获得噪声水平 noise_level。

sftii-1

|wnorm(i + 1) _ wnorm(i)|

noise ― level =― s―nii-l

V wnorm(i)

- (8) 其中 wnorm为解码的子带归一化因子， sfm为整个频带的子带数。

当 noise-level较大时, fact也较大；当 noise-level较小时， fact 也较小。如果以谐波等级作为参数，则当谐波等级较大时， fact较小；当谐波等级越小时， fact较大。

应注意，虽然上面以 0^_sfm_limit的低频部分带宽为例进行了说明，但本发明实施例不限于此。根据需要，上述部分带宽也可以是其他形式的，例如，可以是某一非零低频点到 sfm_limit之间的部分带宽。这些变化均落入本发明实施例的范围内。

103, 对所确定的信号带宽内的子带分配比特。

根据确定的信号带宽内子带的 wnorm值，进行比特分配，可以采用如下的迭代方法： a)找到最大的丽 orm值对应的子带，分配一定比特； b)然后对此子带的 wmorm值做相应的较少； c)重复 a ~ b 步骤，直到比特分配完毕。 104, 根据每个子带分配的比特，对音频信号的频谱系数进行编码。

例如，编码系数可以采用的格形矢量量化方案，或其它量化

MDCT频谱系数的现有方案。

本发明实施例在编解码过程中，根据量化后的子带归一化因子或码率信息，确定比特分配的信号带宽，从而能够集中比特数对所确定的信号带宽进行有效编解码，提高音频质量。

例如，当所确定的信号带宽为低频部分的（Tsfm_limit时，在该信号带宽（Tsfn limit内进行比特分配。通过限制进行比特分配的带宽 sfm_limit,使得在低码率下更能集中比特数对选定的频带进行有效编码，也使得对未被编码的频带进行带宽扩展更有效。这主要是因为如果不做比特分配带宽的限制，高频谐波会分到一些零散的比特进行编码，但在时间轴上分布并不连续，使得重建高频谐波时断时续。如果通过限制比特分配带宽将这些零散比特更集中地分到低频，使得低频信号编码更好，而高频谐波通过低频信号进行带宽扩展，这样就会使高频谐波信号更加连续。

可选地，在一个实施例中，在图 1的 103中，在确定比特分配的信号带宽 sfm_limit后进行比特分配时，还可以先对该带宽内的子带的子带归一化因子做一定的调整,使得在该带宽中高频段能分配更多的比特。调整的强度可自适应码率。这主要考虑的是，如果这个带宽内的较低频带能量较大分得的比特较多，对于量化所需比特已经饱和，则可以通过这个调整来增加这个频带内中高频的量化比特，这样能编出更多谐波，对更高频的带宽扩展也有好处。例如，将部分带宽的中间子带的子带归一化因子作为该中间子带之后的每个子带的子带归一化因子，即可将第 sfm_limit/2个子带的归一化因子作为频带 sfm_ l imi t/2 _ sfm_ l imi t范围内的各个子带的子带归一化因子。如果 sfm_ l imi t/2不是整数，则可以向上或向下取整。此时，在进行比特分配时，可使用调整后的子带归一化因子。

另外，根据本发明的另一个实施例，在应用本发明实施例的编解码方法时，可以进一步考虑音频信号帧分类。这样，本发明实施例能够针对不同的分类采取不同的编解码策略,从而提升不同信号的编解码质量。如音频信号可以分成 No i se (噪声）、 Harmonic (谐波）、 Trans ient (瞬时）等多种类型。一般将类噪声信号分成 Noi se 模式，此时频谱比较平坦；将有时域陡变的信号分成 Trans i ent 模式，此时频谱也比较平坦；将谐波性较强的信号分成 Harmonic 模式，此时频谱变化较大，包含信息较多。

下面以谐波类型和非谐波类型这两类进行描述。本发明实施例可在图 1的 101之前，确定音频信号的帧属于谐波类型或非谐波类型，如果该音频信号的帧属于谐波类型，则继续执行图 1的方法。具体地，对于谐波类型的帧，可按照图 1的实施例限定比特分配的信号带宽，即，将该帧的比特分配的信号带宽限定为该帧的部分带宽。对于非谐波类型的帧，可以按照图 1的实施例限定比特分配的信号带宽为部分带宽，也可以不对比特分配的信号带宽进行限定，例如，将这类帧的比特分配带宽确定为该帧的全部带宽。

可按照峰均比对音频信号帧进行分类。例如，获取该帧的全部或部分子带（例如，高频的部分子带）中每个子带的峰均比。峰均比是指该子带的峰值能量或幅度与该子带的平均能量或幅度的比值。在峰均比大于第一阈值的子带的数目大于或等于第二阈值时，确定该帧属于谐波类型，在峰均比大于第一阈值的子带的数目小于第二阈值时，确定该帧属于非谐波类型。上述第一阈值和第二阈值可根据需要而设定或改变。

但是，本发明实施例不限于根据峰均比参数进行分类的例子，也可以根据其他参数进行分类。

通过限制进行比特分配的带宽 sfm_ l imi t , 使得在低码率下更能集中比特数对选定的频带进行有效编码，也使得对未被编码的频带进行带宽扩展更有效，这主要是因为如果不做比特分配带宽的限制，高频谐波会分到一些零散的比特进行编码，但在时间轴上分布并不连续，使得重建高频谐波时断时续，如果通过限制比特分配带宽将这些零散比特更集中地分到低频，使得低频信号编码更好，而高频谐波通过低频信号进行带宽扩展,这样就会使高频谐波信号更力口连续。

上面描述了编码端的处理过程，解码端是编码端的逆过程。图

2是本发明一个实施例的音频信号解码方法的流程图。

201 , 获取量化后的子带归一化因子。

可通过解码比特流，获取量化后的子带归一化因子。

202 , 根据量化后的子带归一化因子，或者根据量化后的子带归一化因子和码率信息，确定比特分配的信号带宽。 202 类似于图 1中的 102 , 因此不再重复描述。

203 ,对所确定的信号带宽内的子带分配比特。 203类似于图 1 中的 103 , 因此不再重复描述。

204 , 根据每个子带分配的比特，对归一化频谱进行解码。

205 , 对解码后的归一化频谱进行噪声填充和带宽扩展，得到归一化的全频带频谱。

206 , 根据归一化的全频带频谱和子带归一化因子，获得音频信号的频谱系数。例如 ,将每个子带的归一化频谱与该子带的子带归一化因子相乘，恢复得到音频信号的频谱系数。

本发明实施例对于 205 中噪声填充和带宽扩展的执行顺序没有限制。可以先执行噪声填充再执行带宽扩展，也可以先执行带宽扩展再执行噪声填充。另外，本发明实施例可以对一部分频带先执行带宽扩展，对于另一部分频带先执行噪声填充。这些变化均落入本发明实施例的范围内。

在编码子带时由于量化器的限制会出现较多零频点，通常可以填充一些噪声，使得重建音频信号听起来更自然。

如果先执行噪声填充，对于填充噪声后的归一化频谱，可进行带宽扩展，得到归一化的全频带频谱。例如，可根据当前帧及其前

Ν帧的比特分配，确定第一频带，作为要拷贝（copy )的频带。其中 N为正整数。一般希望选择较连续的有比特分配的多个子带作为第一频带的范围。然后，根据第一频带的频谱系数，获得高频频带的频谱系数。

以 N=l为例，可选地，在一个实施例中，可获取当前帧分配的比特和前 N帧分配的比特之间的相关性，并根据所获取的相关性，确定上述第一频带。例如，设当前帧分配的比特为 R-current , 前一帧分配的比特为 R_previous , 将它们相乘得到这些比特之间的相关性 R_correlat ion。

得到相关性之后，从有比特分配的最高频带 las t _ sfm向低频搜索，寻找第一个满足 R_correlat ion≠0 的子带，说明该当前帧和前一帧均有比特分配。假设该子带的编号为 top_band。

在一个实施例中，可将得到的 top_band作为第一频带上限， top.band/2 作为第一频带下限。如果前一帧的第一频带下限和当前帧的第一频带下限的差值小于 1kHz, 则可将前一帧的第一频带下限作为当前帧的第一频带下限。这主要是为了保证进行扩展的第一频带的连续性，从而保证扩展出的高频频谱连续。然后緩存当前中贞的 R-current, 作为下一中贞的 R_previous。如果 top-band/2不是整数，可以向上或向下取整。

在带宽扩展时，向高频频带 last_sfm^_ high_sfm拷贝第一频带 top-band/2 ~ top-band的频谱系数。

上面描述了先执行噪声填充的例子。本发明实施例不限于此，也可以先执行带宽扩展，在扩展后的全频带上填充背景噪声。噪声填充的方法可以与上面的例子相似。

另外，对于高频频带部分，例如上述 last_sfm^_ high_sfm范围，可以用解码端估计出的 noise_level 值，进一步调整频带 last-sfm- high_sfm范围内填充的背景噪声。 noise—level的计算方式可参照上面的等式（ 8 )。 noise-level是通过解码后的子带归一化因子得到的，用来区分填充噪声的强度等级，因此不用传编码比特。

可按照如下方式，利用所获得的噪声水平调整高频频带内的背景噪声。

y(k) = ( (1 - noise _ level ) * y_norm (k) + noise _ level * noise _ CB(k) ) * wnor m (9) 其中， U^k)为解码后的归一化系数， nQise— CBG 为噪声码书。这样，高频谐波通过低频信号进行带宽扩展，能够使得高频谐波信号更加连续，保证了音频质量。

上面给出了直接拷贝第一频带的频谱系数的例子。本发明也可以先调整第一频带的频谱系数，然后使用调整后的频谱系数进行带宽扩展，以进一步提升高频频带的性能。

可根据频谱平坦度信息和高频带信号类型获得归一化长度，使用所获得的归一化长度对第一频带的频谱系数进行归一化处理，并将归一化处理后的第一频带的频谱系数作为高频频带的频谱系数。

上述频谱平坦度信息可包括：第一频带中每个子带的均峰比、第一频带对应的时域信号的相关性、或者第一频带对应的时域信号的过零率。下面以均峰比为例进行说明，但是本发明实施例不限于此，也可以类似地使用其他频谱平坦度信息进行调整。峰均比是指某一子带的峰值能量或幅度与该子带的平均能量或幅度的比值。

首先根据第一频带的频谱系数求出第一频带中每个子带的峰均比，依据峰均比的值及其子带内最大峰值来判断此子带是否为谐波性子带，并累记具有谐波性子带的个数 n_band,然后根据 n_band 及高频带本身的信号类型来自适应确定归一化长度 l ength. norm. harm: n band

length _ norm— harm = a * \ 1 + -

M 其中 M为第一频带的子带数。 a自适应信号类型，如是谐波信号，则《> 1。

然后可使用所获得的归一化长度对第一频带的频谱系数进行归一化处理，并将归一化处理后的第一频带的频谱系数作为高频频带的频谱系数。

上面描述了提升带宽扩展性能的一个例子，其他相应能提升带宽扩展性能的算法也能用在本发明中。

另外，类似于编码端，解码端也可以进一步考虑音频信号帧分类。这样，本发明实施例能够针对不同的分类采取不同的编解码策略，从而提升不同信号的编解码质量。对音频信号帧进行分类的方法可参照编码端所述，因此不再赘述。

可从码流中提取指示帧类型的分类信息。对于谐波类型的帧，可按照图 2的实施例限定比特分配的信号带宽，即，将该帧的比特分配的信号带宽限定为该帧的部分带宽。对于非谐波类型的帧，可以按照图 2的实施例限定比特分配的信号带宽为部分带宽，也可以按照现有技术，不对比特分配的信号带宽进行限定，例如，将这类帧的比特分配带宽确定为该帧的全部带宽。

在获得全带的频谱系数之后，经过频域反变换，可以得到重建的时域音频信号。因此，本发明实施例能够提升谐波性信号的质量，同时没有降低非谐波性信号的质量。

图 3是本发明一个实施例的音频信号编码设备的框图。图 3的音频信号编码设备 30包括量化单元 31、第一确定单元 32、第一分配单元 33和编码单元 34。

量化单元 31将音频信号的频带分为多个子带，量化每个子带的子带归一化因子。第一确定单元 32根据量化单元 31量化的子带归一化因子，或者根据量化后的子带归一化因子和码率信息，确定比特分配的信号带宽。第一分配单元 33对第一确定单元 32确定的信号带宽内的子带分配比特。编码单元 34 根据第一分配单元 33 为每个子带分配的比特，对音频信号的频谱系数进行编码。

图 4是本发明另一实施例的音频信号编码设备的框图。图 4的音频信号编码设备 40中，与图 3相同或相似的部分使用相同的附图标记表示。

在确定比特分配的信号带宽时，第一确定单元 32可将比特分配的信号带宽限定为音频信号的部分带宽。例如，如图 4所示，第一确定单元 32可包括第一比率因子确定模块 321。第一比率因子确定模块 321可根据码率信息确定比率因子 fact , 比率因子 fact 大于 Q且小于或等于 1。可替换地，第一确定单元 32可包括第二比率因子确定模块 322 , 替代第一比率因子确定模块 321。第二比率因子确定模块 322 根据子带归一化因子获取音频信号的谐波等级或噪声水平，根据谐波等级或噪声水平确定比率因子 fact。

另外，第一确定单元 32还包括第一带宽确定模块 323。在得到比率因子 fac t 之后，第一带宽确定模块 323 可根据比率因子 fact和量化后的子带归一化因子，确定上述部分带宽。

可选地，在一个实施例中，第一带宽确定模块 323在确定上述部分带宽时，根据量化后的子带归一化因子，获取每个子带内的频谱能量，并从低频向高频累加每个子带内的频谱能量，直至累加的频谱能量大于所有子带的总频谱能量与比率因子 fact的乘积，将当前子带以下的带宽作为上述部分带宽。

在考虑分类信息的情况下，音频信号编码设备 40还可以包括分类单元 35 , 用于对音频信号的帧进行分类。例如分类单元 35可确定音频信号的帧属于谐波类型或非谐波类型，如果该音频信号的帧属于谐波类型，则触发量化单元 31。在一个实施例中，可根据均峰比确定帧的类型。例如，分类单元 35获取该帧的全部或部分子带中每个子带的峰均比，在峰均比大于第一阈值的子带的数目大于或等于第二阈值时，确定该帧属于谐波类型，在峰均比大于第一阈值的子带的数目小于第二阈值时，确定该帧属于非谐波类型。此时第一确定单元 32对属于谐波类型的帧，可以将比特分配的信号带宽限定为该帧的部分带宽。

可选地，在另一实施例中，第一分配单元 33可包括子带归一化因子调整模块 331和比特分配模块 332。子带归一化因子调整模块 331对所确定的信号带宽内的子带的子带归一化因子进行调整，比特分配模块 332根据调整后的子带归一化因子进行比特分配。例如，第一分配单元 33可将第一确定单元 32所确定的部分带宽的中间子带的子带归一化因子作为该中间子带之后的每个子带的子带归一化因子。

图 5是本发明一个实施例的音频信号解码设备的框图。图 5的音频信号解码设备 50包括获取单元 51、第二确定单元 52、第二分配单元 53、解码单元 54、扩展单元 55和恢复单元 56。

获取单元 51获取量化后的子带归一化因子。第二确定单元 52 根据获取单元 51获取的量化后的子带归一化因子，或者根据量化后的子带归一化因子和码率信息，确定比特分配的信号带宽。第二分配单元 53对第二确定单元 52确定的信号带宽内的子带分配比特。解码单元 54根据第二分配单元 53为每个子带分配的比特，对归一化频谱进行解码。扩展单元 55对解码单元 54解码后的归一化频谱进行噪声填充和带宽扩展，得到归一化的全频带频谱。恢复单元 56根据扩展单元 55得到的归一化的全频带频谱和子带归一化因子，获得音频信号的频谱系数。

图 6是本发明另一实施例的音频信号解码设备的框图。图 6的音频信号解码设备 60中，与图 5相同或相似的部分使用相同的附图标记表示。

类似于图 4的第一确定单元 32 , 在确定比特分配的信号带宽时，音频信号解码设备 60的第二确定单元 52可将比特分配的信号带宽限定为音频信号的部分带宽。例如，第二确定单元 52可包括第三比率因子确定单元 521 , 用于根据码率信息确定比率因子 fact , 比率因子 fac t大于 0且小于或等于 1。可替换地，第二确定单元 52可包括第四比率因子确定单元 522 , 用于根据子带归一化因子获取音频信号的谐波等级或噪声水平，根据谐波等级或噪声水平确定比率因子 fact。

另外，第二确定单元 52还包括第二带宽确定模块 523。在得到比率因子 fac t 之后，第二带宽确定模块 523 可根据比率因子 fact和量化后的子带归一化因子，确定上述部分带宽。

可选地，在一个实施例中，第二带宽确定模块 523在确定上述部分带宽时，根据量化后的子带归一化因子，获取每个子带内的频谱能量，并从低频向高频累加每个子带内的频谱能量，直至累加的频谱能量大于所有子带的总频谱能量与比率因子 fact的乘积，将当前子带以下的带宽作为上述部分带宽。

可选地，在一个实施例中，扩展单元 55可包括第一频带确定模块 551和频谱系数获取模块 552。第一频带确定模块 551根据当前帧及其前 N帧的比特分配，确定第一频带，其中 N为正整数，频谱系数获取模块 552根据第一频带的频谱系数，获得高频频带的频谱系数。例如，在确定第一频带时，第一频带确定模块 551可获取当前帧分配的比特和前 N帧分配的比特之间的相关性，并根据所获取的相关性，确定上述第一频带。

如果需要调整背景噪声，音频信号解码设备 60还可以包括调整单元 57 , 用于根据子带归一化因子，获得噪声水平，并利用所获得的噪声水平，调整高频频带内的背景噪声。

可选地，在另一实施例中，频谱系数获取模块 552可根据频谱平坦度信息和高频带信号类型获得归一化长度,使用所获得的归一化长度对所述第一频带的频谱系数进行归一化处理，并将归一化处理后的第一频带的频谱系数作为高频频带的频谱系数。其中，频谱平坦度信息可包括：第一频带中每个子带的均峰比、第一频带对应的时域信号的相关性、或者第一频带对应的时域信号的过零率等。

根据本发明实施例的编解码系统可包括上述音频信号编码设备或音频信号解码设备。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和筒洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备 (可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括： U盘、移动硬盘、只读存储器（ROM, Read-Only Memory ), 随机存取存储器（RAM, Random Acces s Memory ), 磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

权利要求书

1、一种音频信号编码方法，其特征在于，包括：

将音频信号的频带分为多个子带，量化每个子带的子带归一化因子；

根据量化后的子带归一化因子，或者根据量化后的子带归一化因子和码率信息，确定比特分配的信号带宽；

对所确定的信号带宽内的子带分配比特；

根据每个子带分配的比特，对音频信号的频谱系数进行编码。

2、如权利要求 1所述的方法，其特征在于，所述确定比特分配的信号带宽，包括：

将所述比特分配的信号带宽限定为所述音频信号的部分带宽。

3、如权利要求 2所述的方法，其特征在于，所述将所述比特分配的信号带宽限定为所述音频信号的部分带宽包括：

根据所述码率信息确定比率因子，所述比率因子大于 0且小于或等于 1;

根据所述比率因子和量化后的子带归一化因子，确定所述部分带宽。

4、如权利要求 2所述的方法，其特征在于，所述将所述比特分配的信号带宽限定为所述音频信号的部分带宽包括：

根据所述子带归一化因子获取所述音频信号的谐波等级或噪声水平；

根据所述谐波等级或噪声水平确定比率因子，所述比率因子大于 0且小于或等于 1; 根据所述比率因子和量化后的子带归一化因子，确定所述部分带宽。

5、如权利要求 3或 4所述的方法，其特征在于，根据所述比率因子和量化后的子带归一化因子，确定所述部分带宽包括：根据所述量化后的子带归一化因子，获取每个子带内的频谱能量；

从低频向高频累加每个子带内的频谱能量，直至累加的频谱能量大于所有子带的总频谱能量与所述比率因子的乘积，将当前子带以下的带宽作为所述部分带宽。

6、如权利要求 1-4任一项所述的方法，其特征在于，在将音频信号的频带分为多个子带，量化每个子带的子带归一化因子之前，所述方法还包括：

确定所述音频信号的帧属于谐波类型或非谐波类型；如果所述音频信号的帧属于谐波类型，则继续执行所述方法。

7、如权利要求 6所述的方法，其特征在于，确定所述音频信号的帧属于谐波类型或非谐波类型，包括：

获取所述帧的全部或部分子带中每个子带的峰均比；在峰均比大于第一阈值的子带的数目大于或等于第二阈值时，确定所述帧属于谐波类型，在峰均比大于第一阈值的子带的数目小于第二阈值时，确定所述帧属于非谐波类型。

8、如权利要求 6所述的方法，其特征在于，所述将所述比特分配的信号带宽限定为所述音频信号的部分带宽，包括：

对属于谐波类型的帧，将所述比特分配的信号带宽限定为所述帧的部分带宽。

9、如权利要求 1所述的方法，其特征在于，所述对所确定的信号带宽内的子带分配比特包括：

对所确定的信号带宽内的子带的子带归一化因子进行调整；根据调整后的子带归一化因子进行比特分配。

10、如权利要求 9所述的方法，其特征在于，所述对所确定的信号带宽内的子带的子带归一化因子进行调整，包括：将所述部分带宽的中间子带的子带归一化因子作为该中间子带之后的每个子带的子带归一化因子。

11、一种音频信号解码方法，其特征在于，包括：获取量化后的子带归一化因子；

对所确定的信号带宽内的子带分配比特；

根据每个子带分配的比特，对归一化频谱进行解码；对解码后的归一化频谱进行噪声填充和带宽扩展，得到归一化的全频带频谱；

根据归一化的全频带频谱和子带归一化因子，获得音频信号的频谱系数。

12、如权利要求 11所述的方法，其特征在于，所述确定比特分配的信号带宽，包括：

13、如权利要求 12所述的方法，其特征在于，所述将所述比特分配的信号带宽限定为所述音频信号的部分带宽，包括：

根据所述码率信息确定比率因子，所述比率因子大于 0且小于或等于 1; 根据所述比率因子和量化后的子带归一化因子，确定所述部分带宽。

14、如权利要求 12所述的方法，其特征在于，所述将所述比特分配的信号带宽限定为所述音频信号的部分带宽，包括：

根据所述谐波等级或噪声水平确定比率因子，所述比率因子大于 0且小于或等于 1;

15、如权利要求 13或 14所述的方法，其特征在于，根据所述比率因子和量化后的子带归一化因子，确定所述部分带宽，包括：根据所述量化后的子带归一化因子，获取每个子带内的频谱能量；

16、如权利要求 11所述的方法，其特征在于，所述对解码后的归一化频谱进行噪声填充和带宽扩展，得到归一化的全频带频谱，包括：

艮据当前帧和所述当前帧的前 N帧的比特分配，确定第一频带，其中 N为正整数；

根据第一频带的频谱系数，获得高频频带的频谱系数。

17、如权利要求 16所述的方法，其特征在于，所述根据当前帧和所述当前帧的前 N帧的比特分配，确定第一频带，包括：获取所述当前帧分配的比特和所述前 N帧分配的比特之间的相关性；

根据所获取的相关性，确定所述第一频带。

18、如权利要求 16所述的方法，其特征在于，还包括：根据子带归一化因子，获得噪声水平；

利用所获得的噪声水平，调整所述高频频带内的背景噪声。

19、如权利要求 16所述的方法，其特征在于，所述根据第一频带的频谱系数，获得高频频带的频谱系数，包括：

根据频谱平坦度信息和高频带信号类型获得归一化长度；使用所获得的归一化长度对所述第一频带的频谱系数进行归一化处理；

将归一化处理后的第一频带的频谱系数作为所述高频频带的频谱系数。

20、如权利要求 19所述的方法，其特征在于，所述频谱平坦度信息包括：

所述第一频带中每个子带的均峰比、所述第一频带对应的时域信号的相关性、或者所述第一频带对应的时域信号的过零率。

21、一种音频信号编码设备，其特征在于，包括：量化单元，用于将音频信号的频带分为多个子带，量化每个子带的子带归一化因子；

第一确定单元，用于根据量化后的子带归一化因子，或者根据量化后的子带归一化因子和码率信息，确定比特分配的信号带宽；

第一分配单元，用于对所述第一确定单元确定的信号带宽内的子带分配比特；编码单元，用于根据所述第一分配单元为每个子带分配的比特，对音频信号的频谱系数进行编码。

22、如权利要求 21所述的设备，其特征在于，所述第一确定单元具体用于将所述比特分配的信号带宽限定为所述音频信号的部分带宽。

23、如权利要求 22所述的设备，其特征在于，所述第一确定单元包括：

第一比率因子确定模块，用于根据所述码率信息确定比率因子，所述比率因子大于 0且小于或等于 1 ;

第一带宽确定模块，用于根据所述比率因子和量化后的子带归一化因子，确定所述部分带宽。

24、如权利要求 22所述的设备，其特征在于，所述第一确定单元包括：

第二比率因子确定模块，用于根据所述子带归一化因子获取所述音频信号的谐波等级或噪声水平，根据所述谐波等级或噪声水平确定比率因子，所述比率因子大于 0且小于或等于 1 ;

25、如权利要求 23或 24所述的设备，其特征在于，所述第一带宽确定模块具体用于根据所述量化后的子带归一化因子，获取每个子带内的频谱能量，并从低频向高频累加每个子带内的频谱能量，直至累加的频谱能量大于所有子带的总频谱能量与所述比率因子的乘积，将当前子带以下的带宽作为所述部分带宽。

26、如权利要求 22所述的设备，其特征在于，还包括：分类单元，用于确定所述音频信号的帧属于谐波类型或非谐波类型；如果所述音频信号的帧属于谐波类型，则触发所述量化单元。

27、如权利要求 21所述的设备，其特征在于，所述第一分配单元包括：

子带归一化因子调整模块，用于对所确定的信号带宽内的子带的子带归一化因子进行调整；

比特分配模块，用于根据调整后的子带归一化因子进行比特分配。

28、一种音频信号解码设备，其特征在于，包括：获取单元，用于获取量化后的子带归一化因子；

第二确定单元，用于根据量化后的子带归一化因子，或者根据量化后的子带归一化因子和码率信息，确定比特分配的信号带宽；

第二分配单元，用于对所述第二确定单元确定的信号带宽内的子带分配比特；

解码单元，用于根据所述第二分配单元为每个子带分配的比特，对归一化频谱进行解码；

扩展单元，用于对所述解码单元解码后的归一化频谱进行噪声填充和带宽扩展，得到归一化的全频带频谱；

恢复单元，用于根据所述扩展单元得到的归一化的全频带频谱和子带归一化因子，获得音频信号的频谱系数。

29、如权利要求 28所述的设备，其特征在于，所述第二确定单元具体用于将所述比特分配的信号带宽限定为所述音频信号的部分带宽。

30、如权利要求 29所述的设备，其特征在于，所述第二确定单元包括：

第三比率因子确定模块，用于根据所述码率信息确定比率因子，所述比率因子大于 0且小于或等于 1 ;

第二带宽确定模块，用于根据所述比率因子和量化后的子带归一化因子，确定所述部分带宽。

31、如权利要求 29所述的设备，其特征在于，所述第二确定单元包括：

第四比率因子确定模块，用于根据所述子带归一化因子获取所述音频信号的谐波等级或噪声水平，根据所述谐波等级或噪声水平确定比率因子，所述比率因子大于 0且小于或等于 1 ;

32、如权利要求 30或 31所述的设备，其特征在于，所述第二带宽确定模块具体用于根据所述量化后的子带归一化因子，获取每个子带内的频谱能量，并从低频向高频累加每个子带内的频谱能量，直至累加的频谱能量大于所有子带的总频谱能量与所述比率因子的乘积，将当前子带以下的带宽作为所述部分带宽。

33、如权利要求 28所述的设备，其特征在于，所述扩展单元包括：

第一频带确定模块，用于根据当前帧和所述当前帧的前 N 帧的比特分配，确定第一频带，其中 N为正整数；

频谱系数获耳 ^莫块，用于根据第一频带的频谱系数，获得高频频带的频谱系数。

34、如权利要求 33所述的设备，其特征在于，还包括：调整单元，用于根据子带归一化因子，获得噪声水平，并利用所获得的噪声水平，调整所述高频频带内的背景噪声。

35、如权利要求 33所述的设备，其特征在于，所述频谱系数获取模块具体用于根据频谱平坦度信息和高频带信号类型获得归一化长度 ,使用所获得的归一化长度对所述第一频带的频谱系数进行归一化处理，并将归一化处理后的第一频带的频谱系数作为所述高频频带的频谱系数。