WO2021143692A1

WO2021143692A1 - 一种音频编解码方法和音频编解码设备

Info

Publication number: WO2021143692A1
Application number: PCT/CN2021/071328
Authority: WO
Inventors: 夏丙寅; 李佳蔚; 王喆
Original assignee: 华为技术有限公司
Priority date: 2020-01-13
Filing date: 2021-01-12
Publication date: 2021-07-22
Also published as: EP4084001A4; US20220358941A1; CN113192523A; EP4084001A1; JP7443534B2; KR20220123108A; JP2023510556A

Abstract

本申请实施例公开了一种音频编解码方法和音频编解码设备，用于能够提高解码音频信号的质量。其中，音频编码方法包括：获取音频信号的当前帧，所述当前帧包括高频带信号和低频带信号；根据所述高频带信号和所述低频带信号得到第一编码参数；根据所述高频带信号得到所述当前帧的第二编码参数，所述第二编码参数包括音调成分信息；对所述第一编码参数和所述第二编码参数进行码流复用，以得到编码码流。

Description

一种音频编解码方法和音频编解码设备

本申请要求于2020年1月13日提交中国专利局、申请号为202010033326.X、发明名称为“一种音频编解码方法和音频编解码设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及音频信号编解码技术领域，尤其涉及一种音频编解码方法和音频编解码设备。

背景技术

随着生活质量的提高，人们对高质量音频的需求不断增大。为了利用有限的带宽更好地传输音频信号，通常需要先对音频信号进行编码，然后将编码处理后的码流传输到解码端。解码端对接收到的码流进行解码处理，得到解码后的音频信号，解码后的音频信号用于回放。

其中，如何提高解码音频信号的质量，成为一个亟需解决的技术问题。

发明内容

本申请实施例提供了一种音频编解码方法和音频编解码设备，能够提高解码音频信号的质量。

为解决上述技术问题，本申请实施例提供以下技术方案：

本发明的第一方面提供了一种音频编码方法，所述方法包括：获取音频信号的当前帧，所述当前帧包括高频带信号和低频带信号；根据所述高频带信号和所述低频带信号得到第一编码参数；根据所述高频带信号得到所述当前帧的第二编码参数，所述第二编码参数包括音调成分信息；对所述第一编码参数和所述第二编码参数进行码流复用，以得到编码码流。

结合第一方面，在一种实施方式中，所述根据所述高频带信号得到所述当前帧的第二编码参数，包括：检测所述高频带信号是否包括音调成分；若所述高频带信号包括音调成分，根据所述高频带信号得到所述当前帧的第二编码参数。

结合第一方面以及第一方面的前述实施方式，在一种实施方式中，所述音调成分信息包括如下至少一种：音调成分的数量信息、音调成分位置信息、音调成分的幅度信息、或音调成分的能量信息。

结合第一方面以及第一方面的前述实施方式，在一种实施方式中，所述第二编码参数还包括噪声基底参数。

结合第一方面以及第一方面的前述实施方式，在一种实施方式中，所述噪声基底参数用于指示噪声基底能量。

本发明的第二方面提供了一种音频解码方法，所述方法包括：获取编码码流；对所述编码码流进行码流解复用，以得到音频信号的当前帧的第一编码参数和所述当前帧的第二编码参数，所述当前帧的第二编码参数包括音调成分信息；根据所述第一编码参数得到所述当前帧的第一高频带信号和所述当前帧的第一低频带信号；根据所述第二编码参数得到所述当前帧的第二高频带信号，所述第二高频带信号包括重建音调信号；根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号。

结合第二方面，在一种实施方式中，所述第一高频带信号包括：根据所述第一编码参数直接解码得到的解码高频带信号，以及根据所述第一低频带信号进行频带扩展得到的扩展高频带信号中的至少一种。

结合第二方面以及第二方面的前述实施方式，在一种实施方式中，若所述第一高频带信号包括所述扩展高频带信号，所述根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号包括：若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值满足预设条件，根据所述当前频点上的扩展高频带信号的频谱以及所述当前子带的噪声基底信息得到所述当前频点上的融合高频带信号；或若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值不满足预设条件，根据所述当前频点上的重建音调信号频谱得到所述当前频点上的融合高频带信号。

结合第二方面以及第二方面的前述实施方式，在一种实施方式中，所述噪声基底信息包括噪声基底增益参数。

结合第二方面以及第二方面的前述实施方式，在一种实施方式中，所述当前子带的噪声基底增益参数根据所述当前子带的宽度，所述当前子带的扩展高频带信号的频谱的能量，以及所述当前子带的噪声基底能量获得。

结合第二方面以及第二方面的前述实施方式，在一种实施方式中，若所述第一高频带信号包括所述解码高频带信号以及所述扩展高频带信号，所述根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号包括：若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值不满足预设条件，根据所述当前频点上的重建音调信号频谱得到所述当前频点上的融合高频带信号；或若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值满足预设条件，根据所述当前频点上的扩展高频带信号的频谱，所述当前频点上的解码高频带信号的频谱，以及所述当前子带的噪声基底信息得到所述当前频点上的融合高频带信号。

结合第二方面以及第二方面的前述实施方式，在一种实施方式中，所述当前子带的噪声基底增益参数根据所述当前子带的宽度，所述当前子带的噪声基底能量，所述当前子带的扩展高频带信号的频谱的能量，以及所述当前子带的解码高频带信号的频谱的能量获得。

结合第二方面以及第二方面的前述实施方式，在一种实施方式中，若所述第一高频带信号包括所述解码高频带信号以及所述扩展高频带信号，所述方法还包括：根据预设指示信息或解码得到的指示信息，从所述解码高频带信号，扩展高频带信号以及所述重建音调信号中选择至少一个信号得到所述当前帧的融合高频带信号。

结合第二方面以及第二方面的前述实施方式，在一种实施方式中，所述第二编码参数还包括用于指示所述噪声基底能量的噪声基底参数。

结合第二方面以及第二方面的前述实施方式，在一种实施方式中，所述预设条件包括：重建音调信号频谱的值为0或小于预设阈值。

本发明的第三方面提供了一种音频编码器，包括：信号获取单元，用于获取音频信号的当前帧，所述当前帧包括高频带信号和低频带信号；参数获取单元，根据所述高频带信号和所述低频带信号得到第一编码参数；根据所述高频带信号得到所述当前帧的第二编码参数，所述第二编码参数包括音调成分信息；编码单元，用于对所述第一编码参数和所述第二编码参数进行码流复用，以得到编码码流。

结合第三方面以及第三方面的前述实施方式，在一种实施方式中，参数获取单元具体还用于：检测所述高频带信号是否包括音调成分；若所述高频带信号包括音调成分，根据所述高频带信号得到所述当前帧的第二编码参数。

结合第三方面以及第三方面的前述实施方式，在一种实施方式中，所述音调成分信息包括如下至少一种：音调成分的数量信息、音调成分位置信息、音调成分的幅度信息、或音调成分的能量信息。

结合第三方面以及第三方面的前述实施方式，在一种实施方式中，所述第二编码参数还包括噪声基底参数。

结合第三方面以及第三方面的前述实施方式，在一种实施方式中，所述噪声基底参数用于指示噪声基底能量。

本发明的第四方面提高了一种音频解码器，包括：接收单元，用于获取编码码流；解复用单元，用于对所述编码码流进行码流解复用，以得到音频信号的当前帧的第一编码参数和所述当前帧的第二编码参数，所述当前帧的第二编码参数包括音调成分信息；获取单元，用于根据所述第一编码参数得到所述当前帧的第一高频带信号和所述当前帧的第一低频带信号；根据所述第二编码参数得到所述当前帧的第二高频带信号，所述第二高频带信号包括重建音调信号；融合单元，用于根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号。

结合第四方面，在一种实施方式中，所述第一高频带信号包括：根据所述第一编码参数直接解码得到的解码高频带信号，以及根据所述第一低频带信号进行频带扩展得到的扩展高频带信号中的至少一种。

结合第四方面以及第四方面的前述实施方式，在一种实施方式中，所述第一高频带信号包括所述扩展高频带信号，所述融合单元具体用于：若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值满足预设条件，根据所述当前频点上的扩展高频带信号的频谱以及所述当前子带的噪声基底信息得到所述当前频点上的融合高频带信号；或若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值不满足预设条件，根据所述当前频点上的重建音调信号频谱得到所述当前频点上的融合高频带信号。

结合第四方面以及第四方面的前述实施方式，在一种实施方式中，所述噪声基底信息包括噪声基底增益参数。

结合第四方面以及第四方面的前述实施方式，在一种实施方式中，所述当前子带的噪声基底增益参数根据所述当前子带的宽度，所述当前子带的扩展高频带信号的频谱的能量，以及所述当前子带的噪声基底能量获得。

结合第四方面以及第四方面的前述实施方式，在一种实施方式中，若所述第一高频带信号包括所述解码高频带信号以及所述扩展高频带信号，所述融合单元具体用于：若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值不满足预设条件，根据所述当前频点上的重建音调信号频谱得到所述当前频点上的融合高频带信号；或若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值满足预设条件，根据所述当前频点上的扩展高频带信号的频谱，所述当前频点上的解码高频带信号的频谱，以及所述当前子带的噪声基底信息得到所述当前频点上的融合高频带信号。

结合第四方面以及第四方面的前述实施方式，在一种实施方式中，所述当前子带的噪声基底增益参数根据所述当前子带的宽度，所述当前子带的噪声基底能量，所述当前子带的扩展高频带信号的频谱的能量，以及所述当前子带的解码高频带信号的频谱的能量获得。

结合第四方面以及第四方面的前述实施方式，在一种实施方式中，若所述第一高频带信号包括所述解码高频带信号以及所述扩展高频带信号，所述融合单元还用于：根据预设指示信息或解码得到的指示信息，从所述解码高频带信号，扩展高频带信号以及所述重建音调信号中选择至少一个信号得到所述当前帧的融合高频带信号。

结合第四方面以及第四方面的前述实施方式，在一种实施方式中，所述第二编码参数还包括用于指示所述噪声基底能量的噪声基底参数。

结合第四方面以及第四方面的前述实施方式，在一种实施方式中，所述预设条件包括：重建音调信号频谱的值为0或小于预设阈值。

本发明的第五方面提供了一种音频编码设备，包括至少一个处理器，所述至少一个处理器用于与存储器耦合，读取并执行所述存储器中的指令，以实现如第一方面中任一方法。

本发明的第六方面提供了一种音频解码设备，包括至少一个处理器，所述至少一个处理器用于与存储器耦合，读取并执行所述存储器中的指令，以实现如第二方面的任一方法。

第七方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面或第二方面所述的方法。

第八方面，本申请实施例提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面或第二方面所述的方法。

第九方面，本申请实施例提供一种通信装置，该通信装置可以包括音频编解码设备或者芯片等实体，所述通信装置包括：处理器，可选的，还包括存储器；所述存储器用于存储指令；所述处理器用于执行所述存储器中的所述指令，使得所述通信装置执行如前述第一方面或第二方面中任一项所述的方法。

第十方面，本申请提供了一种芯片系统，该芯片系统包括处理器，用于支持音频编解码设备实现上述方面中所涉及的功能，例如，发送或处理上述方法中所涉及的数据和/或信息。在一种可能的设计中，所述芯片系统还包括存储器，所述存储器，用于保存音频编解码设备必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包括芯片和其他分立器件。

从上可知，本发明实施例中音频编码器会对音调成分信息进行编码，使得音频解码器可以根据接收的音调成分信息进行音频信号的解码，能够更准确地恢复音频信号中的音调成分，从而提高了解码音频信号的质量。

附图说明

图1为本申请实施例提供的一种音频编解码系统的结构示意图；

图2为本申请实施例提供的一种音频编码方法的示意性流程图；

图3为本申请实施例提供的一种音频解码方法的示意性流程图；

图4为本申请实施例的移动终端的示意图；

图5为本申请实施例的网元的示意图；

图6为本申请实施例提供的一种音频编码设备的组成结构示意图；

图7为本申请实施例提供的一种音频解码设备的组成结构示意图；

图8为本申请实施例提供的另一种音频编码设备的组成结构示意图；

图9为本申请实施例提供的另一种音频解码设备的组成结构示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。

本申请实施例中的音频信号是指音频编码设备中的输入信号，该音频信号中可以包括多个帧，例如当前帧可以特指音频信号中的某一个帧，本申请实施例中以当前帧音频信号的编解码进行示例说明，音频信号中当前帧的前一帧或者后一帧都可以根据该当前帧音频信号的编解码方式进行相应的编解码，对于音频信号中当前帧的前一帧或者后一帧的编解码过程不再逐一说明。另外，本申请实施例中的音频信号可以是单声道音频信号，或者，也可以为立体声信号。其中，立体声信号可以是原始的立体声信号，也可以是多声道信号中包括的两路信号(左声道信号和右声道信号)组成的立体声信号，还可以是由多声道信号中包含的至少三路信号产生的两路信号组成的立体声信号，本申请实施例中对此并不限定。

图1为本申请一个示例性实施例的音频编解码系统的结构示意图。该音频编解码系统包括编码组件110和解码组件120。

编码组件110用于对当前帧(音频信号)在频域或时域上进行编码。可选地，编码组件110可以通过软件实现；或者，也可以通过硬件实现；或者，还可以通过软硬件结合的形式实现，本申请实施例中对此不作限定。

编码组件110对当前帧在频域或时域上进行编码时，在一种可能的实现方式中，可以包括如图2所示的步骤。

可选地，编码组件110与解码组件120可以通过有线或无线的方式相连，解码组件120可以通过其与编码组件110之间的连接获取编码组件110生成的编码码流；或者，编码组件110可以将生成的编码码流存储至存储器，解码组件120读取存储器中的编码码流。

可选地，解码组件120可以通过软件实现；或者，也可以通过硬件实现；或者，还可以通过软硬件结合的形式实现，本申请实施例中对此不作限定。

解码组件120对当前帧(音频信号)在频域或时域上进行解码时，在一种可能的实现方式中，可以包括如图3所示的步骤。

可选地，编码组件110和解码组件120可以设置在同一设备中；或者，也可以设置在不同设备中。设备可以为手机、平板电脑、膝上型便携计算机和台式计算机、蓝牙音箱、录音笔、可穿戴式设备等具有音频信号处理功能的终端，也可以是核心网、无线网中具有音频信号处理能力的网元，本实施例对此不作限定。

示意性地，如图4所示，本实施例以编码组件110设置于移动终端130中、解码组件120设置于移动终端140中，移动终端130与移动终端140是相互独立的具有音频信号处理能力的电子设备，例如可以是手机，可穿戴设备，虚拟现实(virtual reality，VR)设备，或增强现实(augmented reality，AR)设备等等，且移动终端130与移动终端140之间通过无线或有线网络连接为例进行说明。

可选地，移动终端130可以包括采集组件131、编码组件110和信道编码组件132，其中，采集组件131与编码组件110相连，编码组件110与编码组件132相连。

可选地，移动终端140可以包括音频播放组件141、解码组件120和信道解码组件142，其中，音频播放组件141与解码组件120相连，解码组件120与信道解码组件142相连。

移动终端130通过采集组件131采集到音频信号后，通过编码组件110对该音频信号进行编码，得到编码码流；然后，通过信道编码组件132对编码码流进行编码，得到传输信号。

移动终端130通过无线或有线网络将该传输信号发送至移动终端140。

移动终端140接收到该传输信号后，通过信道解码组件142对传输信号进行解码得到码码流；通过解码组件110对编码码流进行解码得到音频信号；通过音频播放组件播放该音频信号。可以理解的是，移动终端130也可以包括移动终端140所包括的组件，移动终端140也可以包括移动终端130所包括的组件。

示意性地，如图5所示，以编码组件110和解码组件120设置于同一核心网或无线网中具有音频信号处理能力的网元150中为例进行说明。

可选地，网元150包括信道解码组件151、解码组件120、编码组件110和信道编码组件152。其中，信道解码组件151与解码组件120相连，解码组件120与编码组件110相连，编码组件110与信道编码组件152相连。

信道解码组件151接收到其它设备发送的传输信号后，对该传输信号进行解码得到第一编码码流；通过解码组件120对编码码流进行解码得到音频信号；通过编码组件110对该音频信号进行编码，得到第二编码码流；通过信道编码组件152对该第二编码码流进行编码得到传输信号。

其中，其它设备可以是具有音频信号处理能力的移动终端；或者，也可以是具有音频信号处理能力的其它网元，本实施例对此不作限定。

可选地，网元中的编码组件110和解码组件120可以对移动终端发送的编码码流进行转码。

可选地，本申请实施例中可以将安装有编码组件110的设备称为音频编码设备，在实际实现时，该音频编码设备也可以具有音频解码功能，本申请实施对此不作限定。

可选地，本申请实施例中可以将安装有解码组件120的设备称为音频解码设备，在实际实现时，该音频解码设备也可以具有音频编码功能，本申请实施对此不作限定。

图2描述了本发明一个实施例提供的音频编码方法流程，包括：

201、获取音频信号的当前帧，所述当前帧包括高频带信号和低频带信号。

其中，当前帧可以是音频信号中的任意一个帧，在当前帧中可以包括高频带信号和低频带信号，其中，高频带信号和低频带信号的划分可以通过频带阈值确定，高于该频带阈值的信号为高频带信号，低于该频带阈值的信号为低频带信号，对于频带阈值的确定可以根据传输带宽、编码组件110和解码组件120的数据处理能力来确定，此处不做限定。

其中高频带信号和低频带信号是相对的，例如低于某个频率的信号为低频带信号，但是高于该频率的信号为高频带信号(该频率对应的信号既可以划到低频带信号，也可以划到高频带信号)。该频率根据当前帧的带宽不同会有不同。例如，在当前帧为0-8khz的宽带信号时，该频率可以为4khz；在当前帧为0-16khz的超宽带信号时，该频率可以为8khz。

202、根据所述高频带信号和所述低频带信号得到第一编码参数。

第一编码参数具体可以包括：时域噪声整形参数、频域噪声整形参数、频谱量化参数、频带扩展参数等。

203、根据所述高频带信号得到所述当前帧的第二编码参数，所述第二编码参数包括音调成分信息。

在一个实施方式中，所述音调成分信息包括如下至少一种：音调成分的数量信息、音调成分位置信息、音调成分的幅度信息、或音调成分的能量信息。其中，幅度信息和能量信息可以只包括一个。

在一种实施方式中，步骤203可以在所述高频带信号包括了音调成分时才执行。此时，所述根据所述高频带信号得到所述当前帧的第二编码参数可以包括：检测所述高频带信号是否包括音调成分；若所述高频带信号包括音调成分，根据所述高频带信号得到所述当前帧的第二编码参数。

在一种实施方式中，所述第二编码参数还可以包括噪声基底参数，例如，所述噪声基底参数可以用于指示噪声基底能量。

204、对所述第一编码参数和所述第二编码参数进行码流复用，以得到编码码流。

图3描述了本发明另一个实施例提供的一种音频解码方法的流程，包括：

301、获取编码码流。

302、对所述编码码流进行码流解复用，以得到音频信号的当前帧的第一编码参数和所述当前帧的第二编码参数，所述当前帧的第二编码参数包括音调成分信息。

第一编码参数和第二编码参数可以参考编码方法，此处不再赘述。

303、根据所述第一编码参数得到所述当前帧的第一高频带信号和所述当前帧的第一低频带信号。

其中，所述第一高频带信号包括：根据所述第一编码参数直接解码得到的解码高频带信号，以及根据所述第一低频带信号进行频带扩展得到的扩展高频带信号中的至少一种。

304、根据所述第二编码参数得到所述当前帧的第二高频带信号，所述第二高频带信号包括重建音调信号。

其中，在所述第一高频带信号包括所述扩展高频带信号，所述根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号可以包括：若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值满足预设条件，根据所述当前频点上的扩展高频带信号的频谱以及所述当前子带的噪声基底信息得到所述当前频点上的融合高频带信号；或若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值不满足预设条件，根据所述当前频点上的重建音调信号频谱得到所述当前频点上的融合高频带信号。

其中，所述噪声基底信息可以包括噪声基底增益参数。在一种实施方式中，所述当前子带的噪声基底增益参数根据所述当前子带的宽度，所述当前子带的扩展高频带信号的频谱的能量，以及所述当前子带的噪声基底能量获得。

若所述第一高频带信号包括所述解码高频带信号以及所述扩展高频带信号，所述根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号可以包括：若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值不满足预设条件，根据所述当前频点上的重建音调信号频谱得到所述当前频点上的融合高频带信号；或若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值满足预设条件，根据所述当前频点上的扩展高频带信号的频谱，所述当前频点上的解码高频带信号的频谱，以及所述当前子带的噪声基底信息得到所述当前频点上的融合高频带信号。

其中，所述噪声基底信息包括噪声基底增益参数。在一种实施方式中，所述当前子带的噪声基底增益参数根据所述当前子带的宽度，所述当前子带的噪声基底能量，所述当前子带的扩展高频带信号的频谱的能量，以及所述当前子带的解码高频带信号的频谱的能量获得。

在本发明的一个实施例中，所述预设条件包括：重建音调信号频谱的值为0。在本发明的另一个实施例中，所述预设条件包括：重建音调信号频谱的值小于预设阈值，所述预设阈值为大于0的实数。

305、根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号。

在另一个实施例中，若所述第一高频带信号包括所述解码高频带信号以及所述扩展高频带信号，图3描述的音频解码方法还可以包括：

根据预设指示信息或解码得到的指示信息，从所述解码高频带信号，扩展高频带信号以及所述重建音调信号中选择至少一个信号得到所述当前帧的融合高频带信号。

例如，在本发明的一个实施例中，当前帧的高频带信号的第sfb个子带中，根据所述第一编码参数直接解码得到的解码高频带信号的频谱记为enc_spec[sfb]，根据所述第一低频带信号进行频带扩展得到的扩展高频带信号的频谱记为patch_spec[sfb]，重建音调信号的频谱记为recon_spec[sfb]。噪声基底能量记为E _{noise_floor}[sfb]，噪声基底能量例如可以由频谱区间的噪声基底能量参数E _{noise_floor}[tile]按频谱区间与子带的对应关系获得，即第tile个频谱区间中的各个sfb的噪声基底能量均等于E _{noise_floor}[tile]。

针对第sfb个高频子带，根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号可以分为如下几种情况：

情况1：

若第sfb子带中仅存在patch_spec[sfb]，则第sfb子带的融合信号频谱表示为：

merge_spec[sfb][k]＝patch_spec[sfb][k],k∈[sfb_offset[sfb],sfb_offset[sfb+1])

其中merge_spec[sfb][k]表示第sfb子带第k频点上的融合信号频谱，sfb_offset为子带划分表，sfb_offset[sfb]和sfb_offset[sfb+1]分别为第sfb和第sfb+1个子带的起点。

情况2：

若第sfb子带中仅存在patch_spec[sfb]和enc_spec[sfb]，则第sfb子带的融合信号频谱由以上两者融合得到：

若第sfb子带第k频点上，enc_spec[sfb][k]为零，则：

merge_spec[sfb][k]＝patch_spec[sfb][k],if enc_spec[sfb][k]＝0

若第sfb子带第k频点上，enc_spec[sfb][k]不为零，则：

merge_spec[sfb][k]＝enc_spec[sfb][k],if enc_spec[sfb][k]！＝0

情况3：

若第sfb子带中仅存在patch_spec[sfb]和recon_spec[sfb]，则第sfb子带的融合信号频谱由以上两者融合得到：

若第sfb子带第k频点上，recon_spec[sfb][k]为零，则：

merge_spec[sfb][k]＝g _{noise_floor}[sfb]*patch_spec[sfb][k],if recon_spec[sfb][k]＝0

其中g _{noise_floor}[sfb]为第sfb子带的噪声基底增益参数，由第sfb子带噪声基底能量参数和patch_spec[sfb]的能量计算得到，即：

其中，sfb_width[sfb]为第sfb个子带的宽度，表示为：

sfb_width[sfb]＝sfb_offset[sfb+1]-sfb_offset[sfb]

其中，E _patch[sfb]为patch_spec[sfb]的能量，计算过程如下：

E _patch[sfb]＝∑ _k(patch_spec[sfb][k]) ²

其中k取值范围是k∈[sfb_offset[sfb],sfb_offset[sfb+1])。

若第sfb子带第k频点上，recon_spec[sfb][k]不为零，则：

merge_spec[sfb][k]＝recon_spec[sfb][k],if recon_spec[sfb][k]！＝0

情况4：

若第sfb子带中同时存在enc_spec[sfb]、patch_spec[sfb]，以及recon_spec[sfb]，则可以将以上三者融合得到融合信号。

融合方式可以分为两种，一种是融合以上三者频谱的方式，以recon_spec[sfb]为主要成分，其他两者能量调整到噪声基底能量水平；另一种是融合enc_spec[sfb]和patch_spec[sfb]的方式。

方式一：

将patch_spec[sfb]和enc_spec[sfb]所得高频信号频谱用噪声基底增益进行调整，并与recon_spec[sfb]结合，得到融合信号频谱。

具体方法如下：

若第sfb子带中第k频点上，若recon_spec[sfb][k]不为零，则：

merge_spec[sfb][k]＝recon_spec[sfb][k],if recon_spec[sfb][k]！＝0

若第sfb子带中第k频点上，recon_spec[sfb][k]为零，则：

merge_spec[sfb][k]

＝g _{noise_floor}[sfb]*(patch_spec[sfb][k]+enc_spec[sfb][k]),if recon_spec[sfb][k]＝0

其中g _{noise_floor}[sfb]为第sfb子带的噪声基底增益参数，由第sfb子带噪声基底能量参数、patch_spec[sfb]的能量、enc_spec[sfb]的能量计算得到，即：

其中，E _patch[sfb]为patch_spec[sfb]的能量；

E _enc[sfb]为enc_spec[sfb]的能量，计算过程如下：

E _enc[sfb]＝∑ _k(enc_spec[sfb][k]) ²

其中k取值范围是k∈[sfb_offset[sfb],sfb_offset[sfb+1])。

方式二：

不再保留recon_spec[sfb]，融合信号由patch_spec[sfb]和enc_spec[sfb]构成。

具体实施方式同情况2。

方式一和方式二的选择策略：

上述方式一和方式二两种高频频谱融合方法，可以通过预设方式选择其中一种，或者通过某种方式进行判断，例如在信号满足某种预设条件时选择方式一。本发明实施例对具体的选择方式不做限定。

图6描述了本发明一个实施例提供的音频编码器的结构，包括：

信号获取单元601，用于获取音频信号的当前帧，所述当前帧包括高频带信号和低频带信号。

参数获取单元602，根据所述高频带信号和所述低频带信号得到第一编码参数；根据所述高频带信号得到所述当前帧的第二编码参数，所述第二编码参数包括音调成分信息；

编码单元603，用于对所述第一编码参数和所述第二编码参数进行码流复用，以得到编码码流。

该音频编码器的具体实现可以参考上述的音频编码方法，此处不再赘述。

图7描述了本发明一个实施例提供的音频解码器的结构，包括：

接收单元701，用于获取编码码流；

解复用单元702，用于对所述编码码流进行码流解复用，以得到音频信号的当前帧的第一编码参数和所述当前帧的第二编码参数，所述当前帧的第二编码参数包括音调成分信息；

获取单元703，用于根据所述第一编码参数得到所述当前帧的第一高频带信号和所述当前帧的第一低频带信号；根据所述第二编码参数得到所述当前帧的第二高频带信号，所述第二高频带信号包括重建音调信号；

融合单元704，用于根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号。

该音频解码器的具体实现可以参考上述的音频解码方法，此处不再赘述。

需要说明的是，上述装置各模块/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其带来的技术效果与本申请方法实施例相同，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

本发明实施例还提供了一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行上述的音频编码方法或音频解码方法。

本发明实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述的音频编码方法或音频解码方法。

本申请实施例还提供一种计算机存储介质，其中，该计算机存储介质存储有程序，该程序执行包括上述方法实施例中记载的部分或全部步骤。

接下来介绍本申请实施例提供的另一种音频编码设备，请参阅图8所示，音频编码设备1000包括：

接收器1001、发射器1002、处理器1003和存储器1004(其中音频编码设备1000中的处理器1003的数量可以一个或多个，图8中以一个处理器为例)。在本申请的一些实施例中，接收器1001、发射器1002、处理器1003和存储器1004可通过总线或其它方式连接，其中，图8中以通过总线连接为例。

存储器1004可以包括只读存储器和随机存取存储器，并向处理器1003提供指令和数据。存储器1004的一部分还可以包括非易失性随机存取存储器(non-volatile random access memory，NVRAM)。存储器1004存储有操作系统和操作指令、可执行模块或者数据结构，或者它们的子集，或者它们的扩展集，其中，操作指令可包括各种操作指令，用于实现各种操作。操作系统可包括各种系统程序，用于实现各种基础业务以及处理基于硬件的任务。

处理器1003控制音频编码设备的操作，处理器1003还可以称为中央处理单元(central processing unit，CPU)。具体的应用中，音频编码设备的各个组件通过总线系统耦合在一起，其中总线系统除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都称为总线系统。

上述本申请实施例揭示的方法可以应用于处理器1003中，或者由处理器1003实现。处理器1003可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器1003中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1003可以是通用处理器、数字信号处理器(digital signal processing，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现场可编程门阵列(field-programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1004，处理器1003读取存储器1004中的信息，结合其硬件完成上述方法的步骤。

接收器1001可用于接收输入的数字或字符信息，以及产生与音频编码设备的相关设置以及功能控制有关的信号输入，发射器1002可包括显示屏等显示设备，发射器1002可用于通过外接接口输出数字或字符信息。

本申请实施例中，处理器1003，用于执行前述的音频编码方法。

接下来介绍本申请实施例提供的另一种音频解码设备，请参阅图9所示，音频解码设备1100包括：

接收器1101、发射器1102、处理器1103和存储器1104(其中音频解码设备1100中的处理器1103的数量可以一个或多个，图9中以一个处理器为例)。在本申请的一些实施例中，接收器1101、发射器1102、处理器1103和存储器1104可通过总线或其它方式连接，其中，图9中以通过总线连接为例。

存储器1104可以包括只读存储器和随机存取存储器，并向处理器1103提供指令和数据。存储器1104的一部分还可以包括NVRAM。存储器1104存储有操作系统和操作指令、可执行模块或者数据结构，或者它们的子集，或者它们的扩展集，其中，操作指令可包括各种操作指令，用于实现各种操作。操作系统可包括各种系统程序，用于实现各种基础业务以及处理基于硬件的任务。

处理器1103控制音频解码设备的操作，处理器1103还可以称为CPU。具体的应用中，音频解码设备的各个组件通过总线系统耦合在一起，其中总线系统除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都称为总线系统。

上述本申请实施例揭示的方法可以应用于处理器1103中，或者由处理器1103实现。处理器1103可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器1103中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1103可以是通用处理器、DSP、ASIC、FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1104，处理器1103读取存储器1104中的信息，结合其硬件完成上述方法的步骤。

本申请实施例中，处理器1103，用于执行前述的音频解码方法。

在另一种可能的设计中，当音频编码设备或音频解码设备为终端内的芯片时，芯片包括：处理单元和通信单元，所述处理单元例如可以是处理器，所述通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行存储单元存储的计算机执行指令，以使该终端内的芯片执行上述第一方面任意一项的方法。可选地，所述存储单元为所述芯片内的存储单元，如寄存器、缓存等，所述存储单元还可以是所述终端内的位于所述芯片外部的存储单元，如只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)等。

其中，上述任一处提到的处理器，可以是一个通用中央处理器，微处理器，ASIC，或一个或多个用于控制上述第一方面方法的程序执行的集成电路。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本申请提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

Claims

一种音频编码方法，其特征在于，所述方法包括：

获取音频信号的当前帧，所述当前帧包括高频带信号和低频带信号；

根据所述高频带信号和所述低频带信号得到第一编码参数；

根据所述高频带信号得到所述当前帧的第二编码参数，所述第二编码参数包括音调成分信息；

对所述第一编码参数和所述第二编码参数进行码流复用，以得到编码码流。
根据权利要求1所述的方法，其特征在于，所述根据所述高频带信号得到所述当前帧的第二编码参数，包括：

检测所述高频带信号是否包括音调成分；

若所述高频带信号包括音调成分，根据所述高频带信号得到所述当前帧的第二编码参数。
根据权利要求1或2所述的方法，其特征在于，所述音调成分信息包括如下至少一种：音调成分的数量信息、音调成分位置信息、音调成分的幅度信息、或音调成分的能量信息。
根据权利要求1至3任一所述的方法，其特征在于，所述第二编码参数还包括噪声基底参数。
根据权利要求4所述的方法，其特征在于，所述噪声基底参数包括噪声基底能量。
一种音频解码方法，其特征在于，所述方法包括：

获取编码码流；

对所述编码码流进行码流解复用，以得到音频信号的当前帧的第一编码参数和所述当前帧的第二编码参数，所述当前帧的第二编码参数包括音调成分信息；

根据所述第一编码参数得到所述当前帧的第一高频带信号和所述当前帧的第一低频带信号；

根据所述第二编码参数得到所述当前帧的第二高频带信号，所述第二高频带信号包括重建音调信号；

根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号。
根据权利要求6所述的方法，其特征在于，所述第一高频带信号包括：根据所述第一编码参数直接解码得到的解码高频带信号，以及根据所述第一低频带信号进行频带扩展得到的扩展高频带信号中的至少一种。
根据权利要求7所述的方法，其特征在于，若所述第一高频带信号包括所述扩展高频带信号，所述根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号包括：

若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值满足预设条件，根据所述当前频点上的扩展高频带信号的频谱以及所述当前子带的噪声基底信息得到所述当前频点上的融合高频带信号；或

若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值不满足预设条件，根据所述当前频点上的重建音调信号频谱得到所述当前频点上的融合高频带信号。
根据权利要求8所述的方法，其特征在于，所述噪声基底信息包括噪声基底增益参数。
根据权利要求9所述的方法，其特征在于，所述当前子带的噪声基底增益参数根据所述当前子带的宽度，所述当前子带的扩展高频带信号的频谱的能量，以及所述当前子带的噪声基底能量获得。
根据权利要求7所述的方法，其特征在于，若所述第一高频带信号包括所述解码高频带信号以及所述扩展高频带信号，所述根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号包括：

若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值不满足预设条件，根据所述当前频点上的重建音调信号频谱得到所述当前频点上的融合高频带信号；或

若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值满足预设条件，根据所述当前频点上的扩展高频带信号的频谱，所述当前频点上的解码高频带信号的频谱，以及所述当前子带的噪声基底信息得到所述当前频点上的融合高频带信号。
根据权利要求11所述的方法，其特征在于，所述噪声基底信息包括噪声基底增益参数。
根据权利要求12所述的方法，其特征在于，所述当前子带的噪声基底增益参数根据所述当前子带的宽度，所述当前子带的噪声基底能量，所述当前子带的扩展高频带信号的频谱的能量，以及所述当前子带的解码高频带信号的频谱的能量获得。
根据权利要求7所述的方法，其特征在于，若所述第一高频带信号包括所述解码高频带信号以及所述扩展高频带信号，所述方法还包括：

根据预设指示信息或解码得到的指示信息，从所述解码高频带信号，扩展高频带信号以及所述重建音调信号中选择至少一个信号得到所述当前帧的融合高频带信号。
根据权利要求10或13所述的方法，其特征在于，所述第二编码参数包括用于指示所述噪声基底能量的噪声基底参数。
根据权利要求8或11所述的方法，其特征在于，所述预设条件包括：重建音调信号频谱的值为0或小于预设阈值。
一种音频编码器，其特征在于，包括：

信号获取单元，用于获取音频信号的当前帧，所述当前帧包括高频带信号和低频带信号；

参数获取单元，根据所述高频带信号和所述低频带信号得到第一编码参数；根据所述高频带信号得到所述当前帧的第二编码参数，所述第二编码参数包括音调成分信息；

编码单元，用于对所述第一编码参数和所述第二编码参数进行码流复用，以得到编码码流。
根据权利要求17所述的音频编码器，其特征在于，参数获取单元具体还用于：

检测所述高频带信号是否包括音调成分；

若所述高频带信号包括音调成分，根据所述高频带信号得到所述当前帧的第二编码参数。
根据权利要求17或18所述的音频编码器，其特征在于，所述音调成分信息包括如下至少一种：音调成分的数量信息、音调成分位置信息、音调成分的幅度信息、或音调成分的能量信息。
根据权利要求17至19任一所述的音频编码器，其特征在于，所述第二编码参数还包括噪声基底参数。
根据权利要求20所述的音频编码器，其特征在于，所述噪声基底参数用于指示噪声基底能量。
一种音频解码器，其特征在于，包括：

接收单元，用于获取编码码流；

解复用单元，用于对所述编码码流进行码流解复用，以得到音频信号的当前帧的第一编码参数和所述当前帧的第二编码参数，所述当前帧的第二编码参数包括音调成分信息；

获取单元，用于根据所述第一编码参数得到所述当前帧的第一高频带信号和所述当前帧的第一低频带信号；根据所述第二编码参数得到所述当前帧的第二高频带信号，所述第二高频带信号包括重建音调信号；

融合单元，用于根据所述当前帧的第二高频带信号以及所述当前帧的第一高频带信号得到所述当前帧的融合高频带信号。
根据权利要求22所述的音频解码器，其特征在于，所述第一高频带信号包括：根据所述第一编码参数直接解码得到的解码高频带信号，以及根据所述第一低频带信号进行频带扩展得到的扩展高频带信号中的至少一种。
根据权利要求23所述的音频解码器，其特征在于，所述第一高频带信号包括所述扩展高频带信号，所述融合单元具体用于：

若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值满足预设条件，根据所述当前频点上的扩展高频带信号的频谱以及所述当前子带的噪声基底信息得到所述当前频点上的融合高频带信号；或

若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值不满足预设条件，根据所述当前频点上的重建音调信号频谱得到所述当前频点上的融合高频带信号。
根据权利要求24所述的音频解码器，其特征在于，所述噪声基底信息包括噪声基底增益参数。
根据权利要求25所述的音频解码器，其特征在于，所述当前子带的噪声基底增益参数根据所述当前子带的宽度，所述当前子带的扩展高频带信号的频谱的能量，以及所述当前子带的噪声基底能量获得。
根据权利要求23所述的音频解码器，其特征在于，若所述第一高频带信号包括所述解码高频带信号以及所述扩展高频带信号，所述融合单元具体用于：

若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值不满足预设条件，根据所述当前频点上的重建音调信号频谱得到所述当前频点上的融合高频带信号；或

若所述当前帧的当前子带的当前频点上的重建音调信号频谱的值满足预设条件，根据所述当前频点上的扩展高频带信号的频谱，所述当前频点上的解码高频带信号的频谱，以及所述当前子带的噪声基底信息得到所述当前频点上的融合高频带信号。
根据权利要求27所述的音频解码器，其特征在于，所述噪声基底信息包括噪声基底增益参数。
根据权利要求28所述的音频解码器，其特征在于，所述当前子带的噪声基底增益参数根据所述当前子带的宽度，所述当前子带的噪声基底能量，所述当前子带的扩展高频带信号的频谱的能量，以及所述当前子带的解码高频带信号的频谱的能量获得。
根据权利要求23所述的音频解码器，其特征在于，若所述第一高频带信号包括所述解码高频带信号以及所述扩展高频带信号，所述融合单元还用于：

根据预设指示信息或解码得到的指示信息，从所述解码高频带信号，扩展高频带信号以及所述重建音调信号中选择至少一个信号得到所述当前帧的融合高频带信号。
根据权利要求26或29所述的音频解码器，其特征在于，所述第二编码参数包括用于指示所述噪声基底能量的噪声基底参数。
根据权利要求31或34所述的音频解码器，其特征在于，所述预设条件包括：重建音调信号频谱的值为0或小于预设阈值。
一种音频编码设备，其特征在于，包括至少一个处理器，所述至少一个处理器用于与存储器耦合，读取并执行所述存储器中的指令，以实现如权利要求1至5中任一项所述的方法。
一种音频解码设备，其特征在于，包括至少一个处理器，所述至少一个处理器用于与存储器耦合，读取并执行所述存储器中的指令，以实现如权利要求6至16中任一项所述的方法。
一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行如权利要求1至16任意一项所述的方法。