CN103413553A

CN103413553A - 音频编码方法、音频解码方法、编码端、解码端和系统

Info

Publication number: CN103413553A
Application number: CN201310364530XA
Authority: CN
Inventors: 陈国明; 彭远疆; 欧文军; 刘洪�
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd; Tencent Cloud Computing Beijing Co Ltd
Priority date: 2013-08-20
Filing date: 2013-08-20
Publication date: 2013-11-27
Anticipated expiration: 2033-08-20
Also published as: US20150127356A1; US9812139B2; WO2015024428A1; US9997166B2; CN103413553B; US20180047400A1

Abstract

本发明公开了一种音频编码方法、音频解码方法、编码端、解码端和系统，属于网络技术领域。所述方法包括：根据音频参数确定音频信号是否为指定信号类型；对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记；其中，标记过程可以在编码端或者解码端进行，用于在解码时对指定信号类型的音频信号进行增强处理。本发明通过音频参数确定音频信号是否为指定信号类型，只对指定信号类型进行增强，解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强的同时也被增强而影响音频信号的感知的问题；达到了保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。

Description

音频编码方法、音频解码方法、编码端、解码端和系统

技术领域

本发明涉及网络技术领域，特别涉及一种音频编码方法、音频解码方法、编码端、解码端和系统。

背景技术

音频增强技术是常见的对音频信号进行处理的技术之一。常用的音频增强技术有回声、混响、声像扩展、均衡和3D环绕等。

上述技术一般采用模块的方式将音频信号在时域内处理或者变换到频域内处理。通常来说，如果单纯将音频信号在时域内进行增强处理，往往达不到最优效果；而将音频信号变换到频域内进行增强处理，又会因为时频变换而增加较多额外的运算复杂度，所以一般对音频信号先进行编解码处理，再进行增强处理，从而达到在保证处理效果的前提下节省运算量。

在实现本发明的过程中，发明人发现现有技术至少存在以下缺点：由于在对音频信号进行编解码处理过程中不可避免的会引入量化噪声，而在对音频信号进行增强处理的过程中，可能造成在音频信号被放大的过程中，量化噪声也被放大，从而影响音频信号的感知。

发明内容

为了解决音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题，本发明实施例提供了一种音频编码方法、音频解码方法、编码端、解码端和系统。所述技术方案如下：

第一方面，提供了一种音频编码方法，所述方法包括：

获取连续的若干帧音频信号；

根据每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型；

对属于所述指定信号类型的音频信号和/或不属于所述指定信号类型的音频信号进行标记，得到标记后的音频编码码流；

其中，所述标记用于在解码时对所述指定信号类型的音频信号进行增强处理。

第二方面，提供了一种音频解码方法，所述方法包括：

获取标记后的音频编码码流，所述标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的；

从所述音频编码码流中获取若干帧音频信号，以及全部或者部分帧音频信号的标记；

根据所述标记对属于所述指定信号类型的音频信号进行增强处理，得到增强后的音频信号；

将所述增强后的音频信号加入所述若干帧音频信号的解码码流中，得到音频解码信号。

第三方面，提供了一种音频解码方法，所述方法包括：

获取待解码的音频编码码流；

从所述音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数；

根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型；

对属于所述指定信号类型的音频信号进行增强处理，得到增强后的音频信号；

第四方面，提供了一种音频编码装置，所述装置包括：

信号获取模块，用于获取连续的若干帧音频信号；

第一确定模块，用于根据所述信号获取模块获取到的每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型；

标记模块，用于对属于所述第一确定模块确定的指定信号类型的音频信号和/或不属于所述指定信号类型的音频信号进行标记，得到标记后的音频编码码流；

第五方面，提供了一种音频解码装置，所述装置包括：

第一获取模块，用于获取标记后的音频编码码流，所述标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的；

标记获取模块，用于从所述第一获取模块获取到的音频编码码流中获取若干帧音频信号，以及全部或者部分帧音频信号的标记；

第一增强模块，用于根据所述标记获取模块获取到的所述标记对属于所述指定信号类型的音频信号进行增强处理，得到增强后的音频信号；

第一加入模块，用于将所述第一增强模块增强后的音频信号加入所述若干帧音频信号的解码码流中，得到音频解码信号。

第六方面，提供了一种音频解码装置，所述装置包括：

第二获取模块，用于获取待解码的音频编码码流；

第三获取模块，用于从所述第二获取模块获取到的音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数；

第二确定模块，用于根据所述第三获取模块获取到的每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型；

第二增强模块，用于对所述第二确定模块确定的属于所述指定信号类型的音频信号进行增强处理，得到增强后的音频信号；

第二加入模块，用于将所述第二增强模块增强后的音频信号加入所述若干帧音频信号的解码码流中，得到音频解码信号。

第七方面，提供了一种编码端，所述编码端包括第四方面所述的编码装置。

第八方面，提供了一种解码端，所述编码端包括第五方面所述的编码装置。

第九方面，提供了一种解码端，所述编码端包括第六方面所述的编码装置。

第十方面，提供了一种音频编解码系统，包括第七方面所述的编码端和第八方面所述的解码端。

第十一方面，提供了一种音频编解码系统，包括编码端和第九方面所述的解码端。

本发明实施例提供的技术方案带来的有益效果是：

通过每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型，并对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记，得到标记后的音频编码码流，其中，标记用于解码端在解码时对指定信号类型的音频信号进行增强处理；解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题；达到了只对指定信号类型的音频信号进行增强，不对非指定信号类型的音频信号进行增强，使得在音频信号增强过程中保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的音频编码方法的方法流程图；

图2是本发明实施例二提供的音频解码方法的方法流程图；

图3是本发明实施例三提供的音频解码方法的方法流程图；

图4a是本发明实施例四提供的音频增强方法的编码端逻辑方框示意图；

图4b是本发明实施例四提供的音频增强方法的解码端逻辑方框示意图；

图5a是本发明实施例五提供的音频增强方法的编码端逻辑方框示意图；

图5b是本发明实施例五提供的音频增强方法的解码端逻辑方框示意图；

图6是本发明实施例四提供的音频增强方法的方法流程图；

图7是本发明实施例五提供的音频增强方法的方法流程图；

图8是本发明实施例六提供的音频编码装置的结构方框图；

图9是本发明实施例七提供的音频解码装置的结构方框图；

图10是本发明实施例八提供的音频解码装置的结构方框图；

图11是本发明实施例九提供的音频编解码系统的结构方框图；

图12是本发明实施例十提供的音频编解码系统的结构方框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

实施例一

请参考图1，其示出了本发明实施例一提供的音频编码方法的方法流程图。该音频编码方法，包括：

步骤102，获取连续的若干帧音频信号；

编码端获取连续的若干帧音频信号。

步骤104，根据每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型；

编码端根据每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型。

步骤106，对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记，得到标记后的音频编码码流；

编码端对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记，得到标记后的音频编码码流，其中，标记用于解码端在解码时对指定信号类型的音频信号进行增强处理。

综上所述，本发明实施例提供的音频编码方法，通过每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型，并对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记，得到标记后的音频编码码流，其中，标记用于解码端在解码时对指定信号类型的音频信号进行增强处理；解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题；达到了只对指定信号类型的音频信号进行增强，不对非指定信号类型的音频信号进行增强，使得在音频信号增强过程中保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。

实施例二

请参考图2，其示出了本发明实施例二提供的音频解码方法的方法流程图。该音频解码方法，包括：

步骤202，获取标记后的音频编码码流；

解码端获取标记后的音频编码码流，该标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的。

步骤204，从音频码流中获取若干帧音频信号，以及全部或者部分帧音频信号的标记；

解码端从音频码流中获取若干帧音频信号，以及全部或者部分帧音频信号的标记。

步骤206，根据标记对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号；

解码端根据标记对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号。

步骤208，将增强后的音频信号加入若干帧音频信号的解码码流中，得到音频解码信号；

解码端将增强后的音频信号加入若干帧音频信号的解码码流中，得到音频解码信号。

综上所述，本发明实施例提供的音频解码方法，通过从标记后的音频码流中获取若干帧音频信号，以及全部或者部分帧音频信号的标记，根据标记对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号，然后将增强后的音频信号加入若干帧音频信号的解码码流中，得到音频解码信号；解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题；达到了只对指定信号类型的音频信号进行增强，不对非指定信号类型的音频信号进行增强，使得在音频信号增强过程中保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。

实施例三

请参考图3，其示出了本发明实施例三提供的音频解码方法的方法流程图。该音频解码方法，包括：

步骤302，获取待解码的音频编码码流；

解码端获取待解码的音频编码码流。

步骤304，从音频码流中获取连续的若干帧音频信号和每帧音频信号的音频参数；

解码端从音频码流中获取连续的若干帧音频信号和每帧音频信号的音频参数。

步骤306，根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型；

解码端根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型。

步骤308，对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号；

解码端对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号。

步骤310，将增强后的音频信号加入若干帧音频信号的解码码流中，得到音频解码信号；

综上所述，本发明实施例提供的音频解码方法，通过从待解码的音频码流中获取连续的若干帧音频信号和每帧音频信号的音频参数，根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型，然后对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号，将增强后的音频信号加入若干帧音频信号的解码码流中，得到音频解码信号；解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题；达到了只对指定信号类型的音频信号进行增强，不对非指定信号类型的音频信号进行增强，使得在音频信号增强过程中保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。

为了实现对音频信号的增强处理，本发明实施例提供两种音频编解码系统。第一种音频编解码系统中的编码端和解码端合作来对音频信号进行选择性增强处理，其中编码端包括有内容判决逻辑用以实现根据音频信号的音频参数判断是否需要进行增强处理；第一种音频编解码系统中编码端逻辑框图和解码端逻辑框图分别如图4a和图4b所示。第二种音频编解码系统中只需要解码端即可完成对音频信号进行选择性增强处理，该解码端包含有内容判决逻辑用以实现根据音频信号的音频参数判断是否需要进行增强处理；第二种音频编解码系统中编码端逻辑框图和解码端逻辑框图分别如图5a和图5b所示。

首先对应用于第一种音频编解码系统中的音频增强方法进行详细介绍。

实施例四

请参考图6，其示出了本发明实施例四提供的音频增强方法的方法流程图。该音频解码方法，包括：

步骤601，编码端获取连续的若干帧音频信号；

要实现对音频信号的增强处理，首先编码端需要对时域内的音频信号进行编码，本发明实施例以960点作为一帧音频信号的长度。编码端获取连续的若干帧时域内的音频信号。如图4a中的输入信号即为音频信号的960个采样点的样点值x(n)。

步骤602，编码端获取每帧音频信号的音频参数；

每帧音频信号的音频参数包括对数能量、高过零率比和谱通量，由图4a中的内容判决模块提取每帧音频信号的对数能量、高过零率比和谱通量。

其中，编码端直接根据每帧信号的960个采样点的样点值x(n)得到该帧音频信号的对数能量和高过零率比，根据经过MDCT（Modified Discrete CosineTransform，离散余弦变换）变换后得到的频域信号X(n)得到该帧音频信号的谱通量；

具体的，第i帧音频信号的时域能量定义为：

E (i) = Σ_{n = (i - 1) * L}^{i * L - 1} x^{2} (n)

第i帧音频信号的对数能量为：

E_log(i)=log₂(E(i))

其中，x(n)表示第i帧音频信号的采样点n的样点值，L表示帧长，此处L=960，n取0到959。

第i帧音频信号的过零率ZCR(i)定义为：

ZCR (i) = Σ_{n = (i - 1) * L}^{i * L - 1} \frac{[sign (x (n)) - sign (x (n - 1))]}{2}

其中，sign(x)为符号函数，定义为：

sign (x) = \{\begin{matrix} 1, x &GreaterEqual; 0 \\ - 1, x < 0 \end{matrix}

第i帧音频信号的高过零率比为：

HZCRR = \frac{1}{2 N} Σ_{n = 0}^{N - 1} [sign (ZCR (n) - 1.5 avZCR) + 1]

其中，avZCR(i)是N帧音频信号的平均过零率，此处N=25。

avZCR (i) = \frac{1}{N} Σ_{n = 0}^{N - 1} ZCR (n) .

谱通量定义为相邻两帧音频信号的频谱的平均方差：

SF (i) = \frac{1}{N} Σ_{k = 0}^{N - 1} {[\log (| X (i, k) | + delta) - \log (| X (i - 1, k) | + delta)]}^{2}

其中，X(i,k)为第i帧信号的频谱系数，k为频谱系数下标，delta为一个小量，本实施例中delta=0.0001。

步骤603、编码端根据对数能量、高过零率比和谱通量确定每帧音频信号是否为指定信号类型；

其中，指定信号类型为类音频信号，不属于类音频信号的音频信号包括静音信号和语音信号；

若一帧音频信号的对数能量不小于第一阈值、高过零率比不大于第二阈值、谱通量大于第三阈值，则确定一帧音频信号为类音频信号。

比如，若第i帧音频信号的对数能量不小于特定门限Thr（即小于0）、第i帧音频信号的高过零率比不大于0.2，且第i帧音频信号和第i-1帧信号的频谱的平均方差即第i帧音频信号的谱通量大于20，则确定第i帧音频信号为类音频信号。

对于每帧音频信号的具体确定过程如下：

首先判断该帧音频信号的对数能量是否小于第一阈值，若该帧音频信号的对数能量小于第一阈值，第一阈值可以是0，则确定该帧音频信号为静音信号；若该帧音频信号的对数能量不小于第一阈值，则继续判断该帧音频信号的高过零率比是否大于第二阈值，第二阈值可以是0.2；

若该帧音频信号的高过零率比大于第二阈值，则确定该帧音频信号为语音信号；若该帧音频信号的高过零率比不大于第二阈值，，则继续判断该帧音频信号的谱通量是否大于第三阈值，第三阈值可以是20；

若该帧音频信号的谱通量大于第三阈值，则确定该帧音频信号为类音频信号；若该帧音频信号的谱通量不大于第三阈值，则确定该帧音频信号为语音信号。

步骤604，编码端对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记，得到标记后的音频编码码流，该标记用于在解码时对指定信号类型的音频信号进行增强处理。

具体的，本步骤可以包括如下两个子步骤：

第一，编码端对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记。

第二，编码端对标记后的音频信号进行编码。

其中，第一子步骤可以包括以下几种方式对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记：

对属于类音频信号的音频信号进行第一标记，对不属于类音频信号的音频信号不进行标记；比如，用1个比特位来标记音频信号，对属于类音频信号的音频信号标记为1或者0，对不属于类音频信号的音频信号不添加比特位，以便解码端在解码的时候根据是否含有比特位来判断是否需要对该帧音频信号进行增强处理。

或者，

对属于类音频信号的音频信号进行第一标记，对不属于类音频信号的音频信号进行其它标记；其中，对不属于类音频信号的音频信号进行其它标记包括：对属于静音信号的音频信号进行第二标记，对属于语音信号的音频信号进行第三标记；比如，用1个比特位来标记音频信号，对属于类音频信号的音频信号标记为1，对不属于类音频信号的音频信号标记为0；也可以用2个比特位来标记音频信号，对属于类音频信号的音频信号标记为10，对属于静音信号的音频信号标记为00，对属于语音信号的音频信号标记为01；以便解码端根据标记来判断是否需要对该帧音频信号进行增强处理。

或者，

对属于类音频信号的音频信号不进行标记，对不属于类音频信号的音频信号进行其它标记；其中，对不属于类音频信号的音频信号进行其它标记包括：对属于静音信号的音频信号进行第二标记，对属于语音信号的音频信号进行第三标记；比如，用1个比特位来标记音频信号，对属于类音频信号的音频信号不进行标记，对不属于类音频信号的音频信号标记为1或者0，以便解码端在解码的时候根据是否含有比特位来判断是否需要对该帧音频信号进行增强处理。

需要说明的是，本发明实施例以用两个比特位来标记类音频信号、静音信号和语音信号为例进行说明，即将类音频信号标记为10，将静音信号标记为00，将语音信号标记为01，以便解码端根据标记来判断是否需要对该帧音频信号进行增强处理。

其中，第二子步骤又可以包括以下六个子步骤，结合参考图4a：

1，编码端将音频信号作为输入信号进行正交镜像变换，得到正交镜像变换后的音频信号。

2，编码端对正交镜像变换后的音频信号进行下混，得到下混后的音频信号。

3，编码端将下混后的音频信号进行2倍下采样，得到2倍下采样后的音频信号。

4，编码端将2倍下采样后的音频信号再进行核心编码，得到音频信号的量化编码信号；具体的，核心编码包括MDCT变换和量化编码的过程。将量化编码后得到的量化编码信号加入到音频信号的编码码流中。

5，编码端将正交镜像变换后的音频信号进行立体声编码得到立体声编码参数，将立体声编码参数也加入到音频信号的编码码流中。

6，编码端将下混后的音频信号经过频带复制编码得到频带复制编码参数，将频带复制编码参数也加入到音频信号的编码码流中。

最终得到包含有标记、量化编码信号，立体声编码啊参数和频带复制编码参数的音频编码码流。

需要说明的是，上述步骤601至步骤604可以单独实现成为编码端的音频编码方法。

步骤605，解码端获取标记后的音频编码码流；

该标记为编码端在一帧音频信号属于指定信号类型和/或不属于指定信号类型时进行标记的。

比如，图4b中的解码码流即为解码端获取到的标记后的音频编码码流，该音频编码码流中含有解码端在一帧音频信号属于指定信号类型和/或不属于指定信号类型时进行的标记。

步骤606，解码端从音频码流中获取若干帧音频信号，以及全部或者部分帧音频信号的标记；

若编码端对属于类音频信号的音频信号进行第一标记，对不属于类音频信号的音频信号进行其它标记，则解码端从音频码流中获取若干帧音频信号，以及全部帧音频信号的标记。

比如，本发明实施例中编码端将类音频信号标记为10，将静音信号标记为00，将语音信号标记为01，则解码端从音频码流中获取若干帧音频信号，以及所有帧音频信号的标记。

若编码端对属于类音频信号的音频信号进行第一标记，对不属于类音频信号的音频信号进行其它标记，或者解码端对属于类音频信号的音频信号不进行标记，对不属于类音频信号的音频信号进行其它标记，则解码端从音频码流中获取若干帧音频信号，以及部分帧音频信号的所包含的标记。

比如，若编码端将属于类音频信号的音频信号标记为1或0，则解码端从音频码流中获取若干帧音频信号，以及部分帧音频信号的所包含的标记1或者0；若编码端将不属于类音频信号的音频信号标记为1或0，则解码端从音频码流中获取若干帧音频信号，以及部分帧音频信号的所包含的标记1或者0。

步骤607，解码端根据标记对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号；

对音频信号进行增强处理包括频谱增强和声像扩展。

请参考图4b，音频解码码流经过核心码流解码后得到解码后的音频信号，对解码后的音频信号根据标记进行内容判决，判断是否需要对该帧音频信号进行增强处理。

比如，经过图4b中的内容判决后，解码端将本发明实施例中标记为10的音频信号进行频谱增强后再进行高频恢复，而对本发明实施例中标记为00和01的音频信号直接进行高频恢复；对于进行高频恢复后的音频信号再次进行判断，根据标记判断是否需要对该帧音频信号进行声像扩展，将标记为10的音频信号进行声像扩展后再进行立体声恢复得到音频解码信号，而对本发明实施例中标记为00和01的音频信号直接进行立体声恢复得到音频解码信号。

另外，在对该帧音频信号进行高频恢复的时候，将音频解码码流经过频带复制解码后得到的频带复制解码参数加入到进行高频恢复前的音频信号中，实现对音频信号的高频恢复；还将音频解码码流经过立体声解码得到的立体声解码参数加入到高频恢复后的音频信号中，对加入立体声解码参数的高频恢复后的音频信号再次跟进标记判断是否需要对该帧音频信号进行声像扩展。

具体的，对类音频信号进行频谱增强，包括如下几个子步骤：

1）、获取每帧音频信号的频率；

2）、根据每帧音频信号的频率确定每帧音频信号的频谱增强系数；

比如，对于频率处于60hz～170hz频段的输入信号，频谱增强系数：

X'(n)=gain_const*X(n)，5≤n≤31

其中gain_const为增益常数；

对于频率处于2khz～4khz频段的输入信号，频谱增强系数：

X^{'} (n) = (\frac{n - 341}{341 - 170} * (gain_high - gain_low) + gain_high) * X (n),

170≤n≤341

其中，gain_high为增益上限值，gain_low为增益下限值；

对于频率处于4khz～8khz频段的输入信号，频谱增强系数：

X^{'} (n) = (\frac{n - 682}{682 - 341} * (gain_low - gain_high) + gain_low) * X (n),

341<n≤682。

3）、按照每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。

对类音频信号进行声像扩展时，使用延时参数对类音频信号进行声像扩展，具体的，先根据输入信号X(n)在z域的变换形式S_k(z)通过公式

d_k(z)=G(k,z)*H_k(z)*S_k(z)

得到解相关信号d_k(z)，其中，0≤k≤71，G(k,z)是与瞬间判决相关的函数；

其中，0≤k≤2，

Q(k,m)=exp(-iπq(m)f_center(k))

a(m)、q(m)、q_φ和f_center均为常数，b为常数，通常取1。

步骤608，解码端将增强后的音频信号加入若干帧音频信号的解码码流中，得到音频解码信号；

解码端将增强后的音频信号加入若干帧音频信号的解码码流中，得到音频解码信号，再对音频解码信号进行立体声恢复，得到恢复后的立体声左右声道信号；

比如，设第i帧音频信号经过高频恢复后的单声道信号S_k(z)和解相关信号d_k(z)的频域形式分别为S[K,i]和D[K,i]，则恢复后的立体声左右声道信号L[K,i]和R[K,i]可以表示为：

[\begin{matrix} L [K, i] \\ R [K, i] \end{matrix}] = H [K, i] [\begin{matrix} S [K, i] \\ D [K, i] \end{matrix}]

其中上混矩阵H为：

H = [\begin{matrix} c_{l} \cos (α + β) & c_{l} \sin (α + β) \\ c_{r} \cos (β - α) & c_{r} \sin (β - α) \end{matrix}]

其中，

c=10^IID/20，

c_{l} = c * \sqrt{2} / \sqrt{1 + c^{2}},

c_{r} = \sqrt{2} / \sqrt{1 + c^{2}},

α=arccos(ICC)/2，

β = α \frac{c_{r} - c_{l}}{\sqrt{2}} .

上述步骤605至步骤608可以单独实施成为解码端的音频解码方法。

综上所述，本发明实施例提供的音频增强方法，通过编码端根据对数能量、高过零率比和谱通量确定每帧音频信号是否为指定信号类型，对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记，得到标记后的音频编码码流，解码端在获取到编码端标记后的音频编码码流后，根据标记对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号；解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题；达到了只对指定信号类型的音频信号进行增强，不对非指定信号类型的音频信号进行增强，使得在音频信号增强过程中保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。还通过在对音频信号进行频谱增强的过程中，根据音频信号的频率来确定每帧音频信号的频谱增强系数，在对音频信号进行声像扩展时采用延时参数对音频信号进行声像扩展，达到了更好的保证音频信号的感知的效果。

其次，对应于于第二种音频编解码系统中的音频增强方法进行介绍。

实施例五

请参考图7，其示出了本发明实施例五提供的音频增强方法的方法流程图。该音频解码方法，包括：

步骤701，编码端对若干帧音频信号进行编码，得到音频编码码流；

编码端按照图5a所示的编码逻辑框图对若干帧音频信号进行编码，先将若干帧音频信号进行正交镜像变换，得到正交镜像变换后的音频信号，再经过下混得到下混后的音频信号，将下混后的音频信号经过2倍下采样得到2倍下采样后的音频信号，将2倍下采样后的音频信号经过MDCT变换后得到的音频信号，再将经过MDCT变换后的音频信号进行量化编码得到编码后的音频信号，将量化编码后的音频信号加入到编码码流中；经过正交镜像变换后的音频信号还通过立体声编码得到该音频信号的立体声编码参数，将立体声编码参数也加入到该音频信号的编码码流中；经过下混后的信号还经过频带复制编码得到频带复制编码参数，将频带复制编码参数也加入到该音频信号的编码码流中，最后得到包含有量化编码、立体声编码参数和频带复制编码参数的音频编码码流。

步骤702，解码端获取待解码的音频编码码流；

解码端获取经过步骤701得到的音频编码码流。比如，图5b中的解码码流即为获取到的音频编码码流。

步骤703，解码端从音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数；

解码端从获取到的音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数，每帧音频信号的音频参数，包括频谱能量总和、修正谱平坦度和谱通量。

比如，图5b中的内容判决模块获取每帧音频信号的频谱能量总和、修正谱平坦度和谱通量。

具体的，第i帧音频信号的频谱能量总和为：

E (i) = Σ_{n = (i - 1) * L}^{i * L - 1} X^{2} (n)

其中，X(n)为输入信号的频谱系数，L表示帧长，此处L=960，n取0到959；

第i帧信号的修正谱平坦度为：

SFM (i) = \frac{G_{N} (i)}{A_{n} (i)}

其中，

{N为X_k的个数，X_k≠0，1≤k≤n≤L}表示第i帧的几何平均；

{N为X_k的个数，X_k≠0，1≤k≤n≤L}表示第i帧的算数平均；

谱通量定义为相邻两帧信号的频谱的平均方差：

SF (i) = \frac{1}{N} Σ_{k = 0}^{N - 1} {[\log (| X (i, k) | + delta) - \log (| X (i - 1, k) | + delta)]}^{2}

其中，X(i,k)为第i帧信号的频谱系数，k为频谱系数下标，0≤k≤959，delta为一个小量，本实施例中delta=0.0001。

步骤704，解码端根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型；

其中，指定信号类型为类音频信号，解码端根据每帧音频信号的音频参数确定每帧音频信号是否属于类音频信号；

若一帧音频信号的频谱能量总和大于第四阈值、修正谱平坦度小于第五阈值、谱通量大于第三阈值，则确定所述一帧音频信号为类音频信号。

比如，第i帧频谱信号的频谱能量总和大于10⁵、第i帧信号的修正谱平坦度小于0.8、第i帧信号和第i-1帧信号的频谱的平均方差即第i帧音频信号的谱通量大于20，则确定第i帧音频信号为类音频信号。

对于每帧音频信号的具体确定过程如下：

首先判断该帧音频信号的频谱能量总和是否大于第四阈值，第四阈值可以为10⁵，若该帧音频信号的频谱能量总和不大于第四阈值，则确定该帧音频信号不是类音频信号；若该帧音频信号的频谱能量总和大于第四阈值，则继续判断该帧信号的修正谱平坦度是否小于第五阈值，第五阈值可以为0.8；

若该帧音频信号的修正谱平坦度不小于第五阈值，则确定该帧音频信号不是类音频信号；若该帧音频信号的修正谱平坦度小于第五阈值，则继续判断该帧音频信号的谱通量是否大于第三阈值，第三阈值可以为20；

若该帧音频信号的谱通量大于第三阈值，则确定该帧音频信号为类音频信号；若该帧音频信号的谱通量不大于第三阈值，则确定该帧音频信号不是类音频信号。

需要说明的是，解码端也可以根据判断结果为音频信号进行标记，用以区分类音频信号和非类音频信号，以便在后续判断是否需要进行增强处理时直接根据音频信号的标记来判断是否需要对音频信号进行增强处理。

具体的，对类音频信号的音频信号进行第一标记，对非类音频信号不进行标记；或者，

对类音频信号的音频信号进行第一标记，对非类音频信号进行其它标记；或者，

对类音频信号的音频信号不进行标记，对非类音频信号进行其它标记。

比如，用1个比特位来标记音频信号，编码端可以将类音频信号标记为1或者0，同时不对非类音频信号进行标记；或者，编码可以将类音频信号标记为1，同时对非类音频信号标记为0；或者，编码可以不对类音频信号进行标记，同时对非类音频信号标记为1或者0。

本发明实施例以不对音频信号进行标记，直接根据判断结果对音频信号进行增强处理或不进行增强处理为例进行说明。

步骤703和步骤704包含于图5b中的内容判决过程中。

步骤705，编码端对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号；

对音频信号进行增强处理包括频谱增强和声像扩展。

请参考图5b，音频解码码流经过核心码流解码后得到解码后的音频信号，对解码后的音频信号根据标记进行内容判决，判断是否需要对该帧音频信号进行增强处理。

比如，经过图5b中的内容判决后，解码端将类音频信号进行频谱增强后再进行高频恢复，而将不是类音频信号的音频信号直接进行高频恢复；对于进行高频恢复后的音频信号再次进行判断，将类音频信号进行声像扩展后再进行立体声恢复，而将不是类音频信号的音频信号直接进行立体声恢复得到音频解码信号。

1）、获取每帧音频信号的频率；

X'(n)=gain_const*X(n)，5≤n≤31

其中gain_const为增益常数；

对于频率处于2khz～4khz频段的输入信号，频谱增强系数：

X^{'} (n) = (\frac{n - 341}{341 - 170} * (gain_high - gain_low) + gain_high) * X (n),

170≤n≤341

其中，gain_high为增益上限值，gain_low为增益下限值；

对于频率处于4khz～8khz频段的输入信号，频谱增强系数：

X^{'} (n) = (\frac{n - 682}{682 - 341} * (gain_low - gain_high) + gain_low) * X (n),

341<n≤682。

3）、解码端按照每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。

d_k(z)=G(k,z)*H_k(z)*S_k(z)

其中，0≤k≤2，

Q(k,m)=exp(-iπq(m)f_center(k))

a(m)、q(m)、q_φ和f_center均为常数，b为常数，通常取1。

步骤706，解码端将增强后的音频信号加入若干帧音频信号的解码码流中，得到音频解码信号；

[\begin{matrix} L [K, i] \\ R [K, i] \end{matrix}] = H [K, i] [\begin{matrix} S [K, i] \\ D [K, i] \end{matrix}]

其中上混矩阵H为：

H = [\begin{matrix} c_{l} \cos (α + β) & c_{l} \sin (α + β) \\ c_{r} \cos (β - α) & c_{r} \sin (β - α) \end{matrix}]

其中，

c=10^IID/20，

c_{l} = c * \sqrt{2} / \sqrt{1 + c^{2}},

c_{r} = \sqrt{2} / \sqrt{1 + c^{2}},

α=arccos(ICC)/2，

β = α \frac{c_{r} - c_{l}}{\sqrt{2}} .

上述步骤702至步骤706可以单独实施成为解码端的音频解码方法。

综上所述，本发明实施例提供的音频增强方法，通过解码端根据频谱能量总和、修正谱平坦度和谱通量确定每帧音频信号是否为指定信号类型，对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号；解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题；达到了只对指定信号类型的音频信号进行增强，不对非指定信号类型的音频信号进行增强，使得在音频信号增强过程中保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。还通过在对音频信号进行频谱增强的过程中，根据音频信号的频率来确定每帧音频信号的频谱增强系数，在对音频信号进行声像扩展时采用延时参数对音频信号进行声像扩展，达到了更好的保证音频信号的感知的效果。

实施例六

请参考图8，其示出了本发明实施例六提供的音频编码装置的结构方框图。该音频编码装置可以通过软件、硬件或者两者的结合实现成为编码端的全部或者一部分，该音频编码装置，包括：

信号获取模块810，用于获取连续的若干帧音频信号.

第一确定模块820，用于根据所述信号获取模块810获取到的每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型。

标记模块830，用于对属于所述第一确定模块820确定的指定信号类型的音频信号和/或不属于所述指定信号类型的音频信号进行标记，得到标记后的音频编码码流。

综上所述，本发明实施例提供的音频编码装置，通过每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型，并对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记，得到标记后的音频编码码流，其中，标记用于解码端在解码时对指定信号类型的音频信号进行增强处理；解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题；达到了只对指定信号类型的音频信号进行增强，不对非指定信号类型的音频信号进行增强，使得在音频信号增强过程中保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。

实施例七

请参考图9，其示出了本发明实施例七提供的音频解码装置的结构方框图。该音频编码装置可以通过软件、硬件或者两者的结合实现成为解码端的全部或者一部分，该音频解码装置，包括：

第一获取模块910，用于获取标记后的音频编码码流，所述标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的；

标记获取模块920，用于从所述第一获取模块910获取到的音频编码码流中获取若干帧音频信号，以及全部或者部分帧音频信号的标记；

第一增强模块930，用于根据所述标记获取模块920获取到的所述标记对属于所述指定信号类型的音频信号进行增强处理，得到增强后的音频信号；

第一加入模块940，用于将所述第一增强模块930增强后的音频信号加入所述若干帧音频信号的解码码流中，得到音频解码信号。

综上所述，本发明实施例提供的音频解码装置，通过从标记后的音频码流中获取若干帧音频信号，以及全部或者部分帧音频信号的标记，根据标记对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号，然后将增强后的音频信号加入若干帧音频信号的解码码流中，得到音频解码信号；解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题；达到了只对指定信号类型的音频信号进行增强，不对非指定信号类型的音频信号进行增强，使得在音频信号增强过程中保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。

实施例八

请参考图10，其示出了本发明实施例八提供的音频解码装置的结构方框图。该音频编码装置可以通过软件、硬件或者两者的结合实现成为解码端的全部或者一部分，该音频解码装置，包括：

第二获取模块1010，用于获取待解码的音频编码码流；

第三获取模块1020，用于从所述第二获取模块1010获取到的音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数；

第二确定模块1030，用于根据所述第三获取模块1020获取到的每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型；

第二增强模块1040，用于对所述第二确定模块1030确定的属于所述指定信号类型的音频信号进行增强处理，得到增强后的音频信号；

第二加入模块1050，用于将所述第二增强模块1040增强后的音频信号加入所述若干帧音频信号的解码码流中，得到音频解码信号。

综上所述，本发明实施例提供的音频解码装置，通过从待解码的音频码流中获取连续的若干帧音频信号和每帧音频信号的音频参数，根据每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型，然后对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号，将增强后的音频信号加入若干帧音频信号的解码码流中，得到音频解码信号；解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题；达到了只对指定信号类型的音频信号进行增强，不对非指定信号类型的音频信号进行增强，使得在音频信号增强过程中保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。

需要说明的是：上述实施例提供的音频编码装置和音频解码装置在对音频进行编解码时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将专职的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的音频编码装置和音频解码装置与音频编码方法和音频解码方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

实施例九

请参考图11，其示出了本发明实施例九提供的音频编解码系统的结构方框图。该音频编解码系统，包括：编码端1110和解码端1150；

所述编码端1110，包括：

信号获取模块1120，用于获取连续的若干帧音频信号。

第一确定模块1130，用于根据所述信号获取模块1120获取到的每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型。

所述指定信号类型为类音频信号，所述第一确定模块1130，包括：

参数获取单元1131，用于获取每帧音频信号的音频参数，所述音频参数包括对数能量、高过零率比和谱通量；

类型确定单元1132，用于根据所述参数获取单元1131获取到的对数能量、高过零率比和谱通量确定每帧音频信号是否为类音频信号。

所述类型确定单元1132具体用于当一帧音频信号的对数能量不小于第一阈值、高过零率比不大于第二阈值、谱通量大于第三阈值时，确定所述一帧音频信号为类音频信号。

标记模块1140，用于对属于所述第一确定模块1130确定的指定信号类型的音频信号和/或不属于所述指定信号类型的音频信号进行标记，得到标记后的音频编码码流。

所述标记模块1140，包括：

标记单元1141，用于对指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记；

加入单元1142，用于将标记加入到音频信号的编码码流中，得到包含有标记的音频编码码流；

所述加入单元1142，包括：

正交子单元1142a，用于将音频信号作为输入信号进行正交镜像变换，得到正交镜像变换后的音频信号。

下混子单元1142b，用于对正交镜像变换后的音频信号进行下混，得到下混后的音频信号。

采样子单元1142c，用于将下混后的音频信号进行2倍下采样，得到2倍下采样后的音频信号。

编码子单元1142d，用于将2倍下采样后的音频信号再进行核心编码，得到音频信号的量化编码信号。

立体子单元1142e，用于将正交镜像变换后的音频信号进行立体声编码得到立体声编码参数，将立体声编码参数也加入到音频信号的编码码流中。

频带子单元1142f，用于将下混后的音频信号经过频带复制编码得到频带复制编码参数，将频带复制编码参数也加入到音频信号的编码码流中。

所述解码端1150，包括：

第一获取模块1160，用于获取标记后的音频编码码流，所述标记为编码端在一帧音频信号属于指定信号类型和/或不属于所述指定信号类型时进行标记的；

标记获取模块1170，用于从所述第一获取模块1160获取到的音频编码码流中获取若干帧音频信号，以及全部或者部分帧音频信号的标记；

第一增强模块1180，用于根据所述标记获取模块1170获取到的所述标记对属于所述指定信号类型的音频信号进行增强处理，得到增强后的音频信号；

所述属于所述指定信号类型的音频信号为类音频信号，所述第一增强模块1180，具体用于对所述类音频信号进行频谱增强和声像扩展。

具体的，所述第一增强模块1180，包括：

频率获取单元1181，用于获取每帧音频信号的频率；

系数确定单元1182，用于根据所述频率获取单元1181获取到的每帧音频信号的频率确定每帧音频信号的频谱增强系数；

增强单元1183，用于按照所述系数确定单元1182确定的每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。

所述第一增强模块1180，还包括：

扩展单元1184，用于使用延时参数对所述类音频信号进行声像扩展。

第一加入模块1190，用于将所述第一增强模块1180增强后的音频信号加入所述若干帧音频信号的解码码流中，得到音频解码信号。

综上所述，本发明实施例提供的音频增强系统，通过编码端根据对数能量、高过零率比和谱通量确定每帧音频信号是否为指定信号类型，对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记，得到标记后的音频编码码流，解码端在获取到编码端标记后的音频编码码流后，根据标记对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号；解决了不属于指定信号类型的音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题；达到了在音频信号增强过程中保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。还通过在对音频信号进行频谱增强的过程中，根据音频信号的频率来确定每帧音频信号的频谱增强系数，在对音频信号进行声像扩展时采用延时参数对音频信号进行声像扩展，达到了更好的保证音频信号的感知的效果。

实施例十

请参考图12，其示出了本发明实施例十提供的音频编解码系统的结构方框图。该音频编解码系统，包括：编码端1210和解码端1240；

所述编码端1210，包括：

编码模块1220，用于按照图5a所示的编码算法框图对若干帧音频信号进行编码。

码流输出模块1230，用于将所述编码模块1220进行编码后得到的编码码流输出至解码端。

所述解码端1240，包括：

第二获取模块1250，用于获取待解码的音频编码码流。

第三获取模块1260，用于从所述第二获取模块1250获取到的音频编码码流中获取连续的若干帧音频信号和每帧音频信号的音频参数。

第二确定模块1270，用于根据所述第三获取模块1260获取到的每帧音频信号的音频参数确定每帧音频信号是否属于指定信号类型。

所述指定信号类型为类音频信号，所述每帧音频信号的音频参数，包括频谱能量总和、修正谱平坦度和谱通量，所述第二确定模块1270，具体用于当一帧音频信号的频谱能量总和大于第四阈值、修正谱平坦度小于第五阈值、谱通量大于第三阈值时，确定所述一帧音频信号为类音频信号。

第二增强模块1280，用于对所述第二确定模块1270确定的属于所述指定信号类型的音频信号进行增强处理，得到增强后的音频信号。

所述第二增强模块1280，具体用于对所述类音频信号进行频谱增强和声像扩展。

具体的，所述第二增强模块1280，包括：

频率获取单元1281，用于获取每帧音频信号的频率；

系数确定单元1282，用于根据所述频率获取单元1281获取到的每帧音频信号的频率确定每帧音频信号的频谱增强系数；

增强单元1283，用于按照所述系数确定单元1282确定的每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。

所述第二增强模块1280，还包括：

扩展单元1284，用于使用延时参数对所述类音频信号进行声像扩展。

第二加入模块1290，用于将所述第二增强模块1280增强后的音频信号加入所述若干帧音频信号的解码码流中，得到音频解码信号。

综上所述，本发明实施例提供的音频增强系统，通过解码端根据频谱能量总和、修正谱平坦度和谱通量确定每帧音频信号是否为指定信号类型，对属于指定信号类型的音频信号进行增强处理，得到增强后的音频信号；解决了不属于指定信号类型的音频信号由于编解码而引入的量化噪声在对音频信号进行增强处理的同时也被增强而影响音频信号的感知的问题；达到了在音频信号增强过程中保证音频信号的感知的效果，并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。还通过在对音频信号进行频谱增强的过程中，根据音频信号的频率来确定每帧音频信号的频谱增强系数，在对音频信号进行声像扩展时采用延时参数对音频信号进行声像扩展，达到了更好的保证音频信号的感知的效果。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种音频编码方法，其特征在于，所述方法包括：

获取连续的若干帧音频信号；

2.根据权利要求1所述的方法，其特征在于，所述指定信号类型为类音频信号，所述根据每帧音频信号的音频参数确定每帧音频信号是否为指定信号类型，包括：

获取每帧音频信号的音频参数，所述音频参数包括对数能量、高过零率比和谱通量；

根据所述对数能量、高过零率比和谱通量确定每帧音频信号是否为类音频信号。

3.根据权利要求2所述的方法，其特征在于，所述根据所述对数能量、高过零率比和谱通量确定每帧音频信号是否为类音频信号，包括：

若一帧音频信号的对数能量不小于第一阈值、高过零率比不大于第二阈值、谱通量大于第三阈值，则确定所述一帧音频信号为类音频信号。

4.一种音频解码方法，其特征在于，所述方法包括：

5.根据权利要求4所述的方法，其特征在于，所述属于所述指定信号类型的音频信号为类音频信号，所述根据所述标记对属于所述指定信号类型的音频信号进行增强处理，包括：

对所述类音频信号进行频谱增强和声像扩展。

6.根据权利要求5所述的方法，其特征在于，所述对所述类音频信号进行频谱增强，包括：

获取每帧音频信号的频率；

根据每帧音频信号的频率确定每帧音频信号的频谱增强系数；

按照每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。

7.根据权利要求5所述的方法，其特征在于，所述对所述类音频信号进行声像扩展，包括：

使用延时参数对所述类音频信号进行声像扩展。

8.一种音频解码方法，其特征在于，所述方法包括：

获取待解码的音频编码码流；

9.根据权利要求8所述的方法，其特征在于，所述指定信号类型为类音频信号，所述每帧音频信号的音频参数，包括频谱能量总和、修正谱平坦度和谱通量，所述根据每帧音频信号的音频参数确定每帧信号是否为指定信号类型的音频信号，包括：

10.根据权利要求9所述的方法，其特征在于，所述对属于所述指定信号类型的音频信号进行增强处理，包括：

对所述类音频信号进行频谱增强和声像扩展。

11.根据权利要求10所述的方法，其特征在于，所述对所述类音频信号进行频谱增强，包括：

获取每帧音频信号的频率；

12.根据权利要求10所述的方法，其特征在于，所述对所述类音频信号进行声像扩展，包括：

使用延时参数对所述类音频信号进行声像扩展。

13.一种音频编码装置，其特征在于，所述装置包括：

信号获取模块，用于获取连续的若干帧音频信号；

14.根据权利要求13所述的装置，其特征在于，所述指定信号类型为类音频信号，所述第一确定模块，包括：

参数获取单元，用于获取每帧音频信号的音频参数，所述音频参数包括对数能量、高过零率比和谱通量；

类型确定单元，用于根据所述参数获取单元获取到的对数能量、高过零率比和谱通量确定每帧音频信号是否为类音频信号。

15.根据权利要求14所述的装置，其特征在于，所述类型确定单元具体用于当一帧音频信号的对数能量不小于第一阈值、高过零率比不大于第二阈值、谱通量大于第三阈值时，确定所述一帧音频信号为类音频信号。

16.一种音频解码装置，其特征在于，所述装置包括：

17.根据权利要求16所述的装置，其特征在于，所述属于所述指定信号类型的音频信号为类音频信号，所述第一增强模块，具体用于对所述类音频信号进行频谱增强和声像扩展。

18.根据权利要求17所述的装置，其特征在于，所述第一增强模块，包括：

频率获取单元，用于获取每帧音频信号的频率；

系数确定单元，用于根据所述频率获取单元获取到的每帧音频信号的频率确定每帧音频信号的频谱增强系数；

增强单元，用于按照所述系数确定单元确定的每帧音频信号的频谱增强系数对每帧音频信号进行频谱增强。

19.根据权利要求17所述的装置，其特征在于，所述第一增强模块，还包括：

扩展单元，用于使用延时参数对所述类音频信号进行声像扩展。

20.一种音频解码装置，其特征在于，所述装置包括：

第二获取模块，用于获取待解码的音频编码码流；

21.根据权利要求20所述的装置，其特征在于，所述指定信号类型为类音频信号，所述每帧音频信号的音频参数，包括频谱能量总和、修正谱平坦度和谱通量，所述第二确定模块，具体用于当一帧音频信号的频谱能量总和大于第四阈值、修正谱平坦度小于第五阈值、谱通量大于第三阈值时，确定所述一帧音频信号为类音频信号。

22.根据权利要求21所述的装置，其特征在于，所述第二增强模块，具体用于对所述类音频信号进行频谱增强和声像扩展。

23.根据权利要求22所述的装置，其特征在于，所述第二增强模块，包括：

频率获取单元，用于获取每帧音频信号的频率；

24.根据权利要求22所述的装置，其特征在于，所述第二增强模块，还包括：

25.一种编码端，其特征在于，所述编码端包括如权利要求13至15所述的音频编码装置。

26.一种解码端，其特征在于，所述解码端包括如权利要求16至19所述的音频解码装置。

27.一种解码端，其特征在于，所述解码端包括如权利要求20至24所述的音频解码装置。

28.一种音频编解码系统，其特征在于，所述系统包括权利要求25所述的编码端和权利要求26所述的解码端。

29.一种音频编解码系统，其特征在于，所述系统包括编码端和权利要求27所述的解码端。