WO2015184813A1

WO2015184813A1 - 一种语音频信号的处理方法和装置

Info

Publication number: WO2015184813A1
Application number: PCT/CN2015/071017
Authority: WO
Inventors: 刘泽新; 苗磊
Original assignee: 华为技术有限公司
Priority date: 2014-06-03
Filing date: 2015-01-19
Publication date: 2015-12-10
Also published as: ES2964221T3; BR112016028375A2; US11462225B2; EP3147900A1; US20170084282A1; EP3147900A4; RU2651184C1; AU2015271580A1; EP3712890B1; KR20170008837A; IL249337A0; JP2021060609A; MX2016015950A; AU2015271580B2; MX2019001193A; KR102201791B1; JP6817283B2; JP2019061282A; EP4283614A2; KR20200043548A

Abstract

一种恢复语音频信号噪声成分的方法及装置，方法包括：接收码流，解码所述码流得到语音频信号（101）；根据所述语音频信号确定第一语音频信号（102）；确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值（103）；确定自适应归一化长度（104）；根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值（105）；根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号（106）。

Description

一种语音频信号的处理方法和装置

本申请要求于2014年6月3日提交中国专利局、申请号为201410242233.2、发明名称为“一种语音频信号的处理方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及通信领域，尤其涉及一种语音频信号的处理方法和装置。

背景技术

为了达到更好的听觉质量，目前电子设备在进行语音频信号的编码信息解码时，会对解码得到的语音频信号进行噪声成分的恢复。

目前电子设备在恢复语音频信号的噪声成分时，一般都是通过在语音频信号中添加随机噪声信号来实现的。具体的，将语音频信号和随机噪声信号相加权，得到语音频信号恢复噪声成分后的信号；其中，语音频信号可以是时域信号、频域信号或激励信号，也可以是低频信号或高频信号等。

但是，发明人发现如果语音频信号是具有上升沿或下降沿的信号时，这种恢复语音频信号噪声成分的方法会造成语音频信号恢复噪声成分后得到的信号具有回声，影响恢复噪声成分后的信号的听觉质量。

发明内容

本发明实施例中提供了一种语音频信号的处理方法和装置，对于具有上升沿或下降沿的语音频信号，在恢复其噪声成分时不会造成语音频信号恢复噪声成分后的信号具有回声，提高恢复噪声成分后的信号的听觉质量。

第一方面，本发明实施例提供一种语音频信号的处理方法，所述方法包括：

接收码流，解码所述码流得到语音频信号；

根据所述语音频信号确定第一语音频信号，所述第一语音频信号是所述语音频信号中需要恢复噪声成分的信号；

确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值；

确定自适应归一化长度；

根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值；

根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号，所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。

结合第一方面，在第一方面第一种可能的实现方式中，所述根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值，包括：

根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值，根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值；

根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值。

结合第一方面第一种可能的实现方式，在第一方面第二种可能的实现方式中，所述根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值，包括：

对于每个所述采样值，根据所述自适应归一化长度确定所述采样值所属的子带；

计算所述采样值所属子带内所有采样值的幅度值的平均值，将计算得到的平均值作为所述采样值对应的幅度平均值。

结合第一方面第二种可能的实现方式，在第一方面第三种可能的实现方式中，对于每个所述采样值，根据所述自适应归一化长度确定所述采样值所属的子带，包括：

将所有采样值按照预设顺序根据所述自适应归一化长度划分子带；对于每个所述采样值，将包括所述采样值的子带确定为所述采样值所属的子带；或者，

对于每个所述采样值，将所述采样值之前m个采样值、所述采样值、所述采样值之后n个采样值构成的子带确定为所述采样值所属的子带，m、n由所述自适应归一化长度确定，m是不小于0的整数，n是不小于0的整数。

结合第一方面第一种可能的实现方式，和/或第一方面第二种可能的实现方式，和/或第一方面第三种可能的实现方式，在第一方面第四种可能的实现方式中，所述根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值，包括：

将每个所述采样值的幅度值与其对应的幅度扰动值相减得到两者的差值，将得到的差值作为每个所述采样值的调整幅度值。

结合第一方面，和/或第一方面第一种可能的实现方式，和/或第一方面第二种可能的实现方式，和/或第一方面第三种可能的实现方式，和/或第一方面第四种可能的实现方式中，在第一方面第五种可能的实现方式中，所述确定自适应归一化长度，包括：

将所述语音频信号中的低频带信号划分为N个子带；N为自然数；

计算每个所述子带的峰均比，并确定所述峰均比大于预设峰均比阈值的子带个数；

根据所述语音频信号中高频带信号的信号类型和所述子带个数，计算所述自适应归一化长度。

结合第一方面第五种可能的实现方式，在第一方面第六种可能的实现方式中，所述根据所述语音频信号中高频带信号的信号类型和所述子带个数，计算所述自适应归一化长度，包括：

根据公式L＝K+α×M计算所述自适应归一化长度；

其中，L为所述自适应归一化长度；K为所述语音频信号中的高频带信号的信号类型对应的数值，不同高频带信号的信号类型对应的K的数值不同；M为峰均比大于预设峰均比阈值的子带个数；α为小于1的常数。

结合第一方面，和/或第一方面第一种可能的实现方式，和/或第一方面第二种可能的实现方式，和/或第一方面第三种可能的实现方式，和/或第一方面第四种可能的实现方式，在第一方面第七种可能的实现方式中，所述确定自适应归一化长度，包括：

计算所述语音频信号中低频带信号的峰均比，和所述语音频信号中高频带信号的峰均比；当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值小于预设差值阈值时，将所述自适应归一化长度确定为预设第一长度值，当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值不小于预设差值阈值时，将所述自适应归一化长度确定为预设第二长度值；所述第一长度值大于所述第二长度值；或者，

计算所述语音频信号中低频带信号的峰均比，和所述语音频信号中高频带信号的峰均比；当所述低频带信号的峰均比小于所述高频带信号的峰均比时，将所述自适应归一化长度确定为预设第一长度值，当所述低频带信号的峰均比不小于所述高频带信号的峰均比时，将所述自适应归一化长度确定为预设第二长度值；或者，

根据所述语音频信号中高频带信号的信号类型确定所述自适应归一化长度，不同高频带信号的信号类型对应的自适应归一化长度不同。

结合第一方面，和/或第一方面第一种可能的实现方式，和/或第一方面第二种可能的实现方式，和/或第一方面第三种可能的实现方式，和/或第一方面第四种可能的实现方式，和/或第一方面第五种可能的实现方式，和/或第一方面第六种可能的实现方式，和/或第一方面第七种可能的实现方式，在第一方面第八种可能的实现方式中，所述根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号，包括：

根据每个所述采样值的符号和调整幅度值确定每个所述采样值的新取值，得到所述第二语音频信号；或者，

计算修正因子；根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理；根据每个所述采样值的符号和修正处理后的调整幅度值确定每个所述采样值的新取值，得到第二语音频信号。

结合第一方面第八种可能的实现方式，在第一方面第九种可能的实现方式中，所述计算修正因子，包括：

使用公式β＝a/L计算所述修正因子；其中，β为所述修正因子，L为所述自适应归一化长度，a为大于1的常数。

结合第一方面第八种可能的实现方式，和/或第一方面第九种可能的实现方式，在第一方面第十种可能的实现方式中，所述根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理，包括：

使用以下公式对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理：

Y＝y×(b-β)；

其中，Y为修正处理后的调整幅度值，y为所述采样值的调整幅度值中大于0的调整幅度值，b为常数，0＜b＜2。

第二方面，本发明实施例提供一种恢复语音频信号噪声成分的装置，包括：

码流处理单元，用于接收码流，解码所述码流得到语音频信号；

信号确定单元，用于根据所述码流处理单元得到的所述语音频信号确定第一语音频信号，所述第一语音频信号是解码得到的所述语音频信号中需要恢复噪声成分的信号；

第一确定单元，用于确定所述信号确定单元确定的所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值；

第二确定单元，用于确定自适应归一化长度；

第三确定单元，用于根据所述第二确定单元确定的所述自适应归一化长度和所述第一确定单元确定的每个所述采样值的幅度值确定每个所述采样值的调整幅度值；

第四确定单元，用于根据所述第一确定单元确定的每个所述采样值的符号和所述第三确定单元确定的每个所述采样值的调整幅度值确定第二语音频信号，所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。

结合第二方面，在第二方面第一种可能的实现方式中，所述第三确定单元包括：

确定子单元，用于根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值，根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值；

调整幅度值计算子单元，用于根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值。

结合第二方面第一种可能的实现方式，在第二方面第二种可能的实现方式中，所述确定子单元包括：

确定模块，用于对于每个所述采样值，根据所述自适应归一化长度确定所述采样值所属的子带；

计算模块，用于计算所述采样值所属子带内所有采样值的幅度值的平均值，将计算得到的平均值作为所述采样值对应的幅度平均值。

结合第二方面第二种可能的实现方式，在第二方面第三种可能的实现方式中，所述确定模块具体用于：

结合第二方面第一种可能的实现方式，和/或第二方面第二种可能的实现方式，和 /或第二方面第三种可能的实现方式，在第二方面第四种可能的实现方式中，所述调整幅度值计算子单元具体用于：

结合第二方面，和/或第二方面第一种可能的实现方式，和/或第二方面第二种可能的实现方式，和/或第二方面第三种可能的实现方式，和/或第二方面第四种可能的实现方式中，在第二方面第五种可能的实现方式中，所述第二确定单元包括：

划分子单元，用于将所述语音频信号中的低频带信号划分为N个子带；N为自然数；

个数确定子单元，用于计算每个所述子带的峰均比，并确定所述峰均比大于预设峰均比阈值的子带个数；

长度计算子单元，用于根据所述语音频信号中高频带信号的信号类型和所述子带个数，计算所述自适应归一化长度。

结合第二方面第五种可能的实现方式，在第二方面第六种可能的实现方式中，所述长度计算子单元具体用于：

根据公式L＝K+α×M计算所述自适应归一化长度；

结合第二方面，和/或第二方面第一种可能的实现方式，和/或第二方面第二种可能的实现方式，和/或第二方面第三种可能的实现方式，和/或第二方面第四种可能的实现方式，在第二方面第七种可能的实现方式中，所述第二确定单元具体用于：

结合第二方面，和/或第二方面第一种可能的实现方式，和/或第二方面第二种可能的实现方式，和/或第二方面第三种可能的实现方式，和/或第二方面第四种可能的实现方式，和/或第二方面第五种可能的实现方式，和/或第二方面第六种可能的实现方式，和/或第二方面第七种可能的实现方式，在第二方面第八种可能的实现方式中，所述第四确定单元具体用于：

结合第二方面第八种可能的实现方式，在第二方面第九种可能的实现方式中，所述第四确定单元具体用于：使用公式β＝a/L计算所述修正因子；其中，β为所述修正因子，L为所述自适应归一化长度，a为大于1的常数。

结合第二方面第八种可能的实现方式，和/或第二方面第九种可能的实现方式，在第二方面第十种可能的实现方式中，所述第四确定单元具体用于：

Y＝y×(b-β)；

其中，Y为修正处理后的调整幅度值，y为将所述采样值的调整幅度值中大于0的调整幅度值，b为常数，0＜b＜2。

本实施例中，接收码流，解码所述码流得到语音频信号，根据所述语音频信号确定第一语音频信号，确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值，确定自适应归一化长度，根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值，根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。这一过程中，只是对第一语音频信号这一原有信号进行处理，并未在第一语音频信号中增加新的信号，从而恢复噪声成分后的第二语音频信号中并未增加新的能量，从而如果第一语音频信号具有上升沿或下降沿，不会增加第二语音频信号中的回声，从而提高了第二语音频信号的听觉质量。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本发明的保护范围。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例恢复语音频信号噪声成分的一种方法流程示意图；

图1A为本发明实施例采样值分组举例示意图；

图1B为本发明实施例采样值分组举例另一示意图；

图2为本发明实施例恢复语音频信号噪声成分的另一种方法流程示意图；

图3为本发明实施例恢复语音频信号噪声成分的另一种方法流程示意图；

图4为本发明实施例恢复语音频信号噪声成分的装置结构示意图；

图5为本发明实施例电子设备结构示意图。

通过上述附图，已示出本发明明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围，而是通过参考特定实施例为本领域技术人员说明本发明的概念。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了全面理解本发明，在以下详细描述中提到了众多具体的细节，但是本领域技术人员应该理解，本发明可以无需这些具体细节而实现。在其他实施例中，不详细描述公知的方法、过程、组件和电路，以免不必要地导致实施例模糊。

参见图1，为本发明实施例恢复语音频信号噪声成分的方法流程图，该方法包括：

步骤101：接收码流，解码所述码流得到语音频信号；

其中，具体如何解码码流得到语音频信号，这里不再赘述。

步骤102：根据所述语音频信号确定第一语音频信号；所述第一语音频信号是解码得到的所述语音频信号中需要恢复噪声成分的信号；

其中，所述第一语音频信号可以是解码得到的语音频信号中的低频带信号、高频带信号、或者全频带信号等。

所述解码得到的语音频信号可以包括一路低频带信号和一路高频带信号，或者也可以包括一路全频带信号。

步骤103：确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值；

其中，所述第一语音频信号具有不同实现时，所述采样值的实现方式也可能不同，例如如果所述第一语音频信号是频域信号，所述采样值可以为频谱系数；如果所述语音频信号是时域信号，所述采样值可以为样点值。

步骤104：确定自适应归一化长度；

其中，在确定自适应归一化长度时，可以根据所述解码得到的语音频信号的低频带信号和/或高频带信号的相关参数来确定。具体的，所述相关参数可以包括信号类型、峰均比等。例如，在一种可能的实现方式中，所述确定自适应归一化长度，可以包括：

可选地，所述根据所述语音频信号中高频带信号的信号类型和所述子带个数，计算所述自适应归一化长度，可以包括：

根据公式L＝K+α×M计算所述自适应归一化长度；

在另一种可能的实现方式中，也可以根据所述语音频信号中低频带信号的信号类型和所述子带个数，计算所述自适应归一化长度。具体的计算公式可以参见公式L＝K+α×M，区别仅在于此时的K为所述语音频信号中的低频带信号的信号类型对应的数值，不同低频带信号的信号类型对应的K的数值不同。

在第三种可能的实现方式中，确定自适应归一化长度可以包括：

计算所述语音频信号中低频带信号的峰均比，和所述语音频信号中高频带信号的峰均比；当低频带信号的峰均比和高频带信号的峰均比差值的绝对值小于预设差值阈值时，将自适应归一化长度确定为预设第一长度值，当低频带信号的峰均比和高频带信号的峰均比差值的绝对值不小于预设差值阈值时，将自适应归一化长度确定为预设第二长度值。第一长度值大于第二长度值，第一长度值和第二长度值也可以通过低频带信号的峰均比和高频带信号的峰均比的比值或差值计算得到，具体计算方法不限定。

在第四种可能的实现方式中，确定自适应归一化长度可以包括：

计算所述语音频信号中低频带信号的峰均比，和所述语音频信号中高频带信号的峰均比；当低频带信号的峰均比小于高频带信号的峰均比时，将自适应归一化长度确定为预设第一长度值，当低频带信号的峰均比不小于高频带信号的峰均比时，将自适应归一化长度确定为预设第二长度值。第一长度值大于第二长度值，第一长度值和第二长度值也可以通过低频带信号的峰均比和高频带信号的峰均比的比值或差值计算得到，具体计算方法不限定。

在第五种可能的实现方式中，确定自适应归一化长度可以包括：根据语音频信号中高频带信号的信号类型确定自适应归一化长度，不同的信号类型对应不同的自适应归一化长度，如信号类型为谐波信号时，对应的自适应归一化长度为32，信号类型为普通信号时，对应的自适应归一化长度为16，信号类型为瞬态信号时，对应的自适应归一化长度为8等。

步骤105：根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值；

其中，所述根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值，可以包括：

其中，所述根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值，可以包括：

其中，对于每个所述采样值，根据所述自适应归一化长度确定所述采样值所属的子带，可以包括：

将所有采样值按照预设顺序根据所述自适应归一化长度划分子带；对于每个所述采样值，将包括所述采样值的子带确定为所述采样值所属的子带。

其中，所述预设顺序例如可以为从低频到高频的顺序或者从高频到低频的顺序等，这里不限制。

例如，参见图1A所示，假设采样值从低到高分别为x1、x2、x3…xn，所述自适应归一化长度假设为5，则可以将x1～x5划分为一个子带，x6～x10划分为一个子带…以此类推，得到若干个子带，则对于x1～x5中的每个采样值而言，子带x1～x5就是每个采样值所属的子带，对于x6～x10中的每个采样值而言，子带x6～x10就是每个采样值所属的子带。

或者，对于每个所述采样值，根据所述自适应归一化长度确定所述采样值所属的子带，可以包括：

例如，参见图1B所示，假设采样值从低到高分别为x1、x2、x3…xn，所述自适应归一化长度假设为5，m取值为2，n取值为2，则，对于采样值x3而言，x1～x5构成的子带就是采样值x3所属子带，对于采样值x4而言，x2～x6构成的子带就是采样值x4所述子带，以此类推。其中，对于采样值x1、x2而言，由于其之前没有足够的采样值构成其所属子带，对于采样值x(n-1)、xn而言，由于其之后没有足够的采样值构成其所属子带，因此，可以在实际应用中自主设定x1、x2、x(n-1)、xn所属子带，例如添加采样值自身补充子带中缺少的采样值等，举例来说，对于采样值x1，其之前不存在采样值，则可以将x1、x1、x1、x2、x3作为其所属子带等。

其中，根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值时，可以将每个所述采样值对应的幅度平均值直接作为每个所述采样值对应的幅度扰动值，也可以对每个所述采样值对应的幅度平均值做某一预设运算得到每个所述采样值对应的幅度扰动值，所述预设运算例如可以为为所述幅度平均值乘以一个数值，该数值一般大于0。

其中，所述根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值，可以包括：

步骤106：根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号；所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。

其中，在一种可能的实现方式中，可以根据每个采样值的符号和调整幅度值确定每个采样值的新取值，得到所述第二语音频信号；

在另一种可能的实现方式中，所述根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号，可以包括：

计算修正因子；

根据所述修正因子对采样值的调整幅度值中大于0的调整幅度值进行修正处理；

根据每个采样值的符号和修正处理后的调整幅度值确定每个采样值的新取值，得到第二语音频信号。

在一种可能的实现方式中，得到的所述第二语音频信号可以包括所有采样值的新取值。

其中，所述修正因子可以根据所述自适应归一化长度计算，具体的，所述修正因子β可以等于a/L；其中，a为大于1的常数。

其中，所述根据所述修正因子对采样值的调整幅度值中大于0的调整幅度值进行修正处理，可以包括：

使用以下公式对采样值的调整幅度值中大于0的调整幅度值进行修正处理：

Y＝y×(b-β)；

其中，Y为修正处理后的调整幅度值，y为采样值的调整幅度值中大于0的调整幅度值，b为常数，0＜b＜2。

其中，步骤103中提取所述第一语音频信号中每个采样值的符号的步骤可以在步骤106之前的任意时刻处理，与步骤104、105之间没有必然的执行顺序。

其中，步骤103与步骤104之间的执行顺序不限制。

在现有技术中，当语音频信号是具有上升沿或下降沿的信号时，语音频信号的时域信号可能在一帧内，此时语音频信号中部分信号的样点值特别大，能量特别大，而语音频信号的其他部分信号的样点值特别小，能量特别小，此时，在频域对语音频信号添加随机噪声信号得到恢复噪声成分后的信号，由于随机噪声信号在一帧内时域上看能量是相当的，从而在将恢复噪声成分后的信号的频域信号转换为时域信号时，新添加的随机噪声信号往往会使得转换得到的时域信号中原来样点值特别小的部分信号的能量增加，这一部分信号的样点值也都相应变的比较大，这样就会造成恢复噪声成分后的信号具有一些回声，影响恢复噪声成分后的信号的听觉质量。

而本实施例中，根据语音频信号确定第一语音频信号，确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值，确定自适应归一化长度，根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值，根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。这一过程中，只是对第一语音频信号这一原有信号进行处理，并未在第一语音频信号中增加新的信号，从而恢复噪声成分后的第二语音频信号中并未增加新的能量，从而如果第一语音频信号具有上升沿或下降沿，不会增加第二语音频信号中的回声，从而提高了第二语音频信号的听觉质量。

参见图2，为本发明实施例恢复语音频信号噪声成分的方法另一种流程示意图，该方法包括：

步骤201：接收码流，解码所述码流得到语音频信号，解码得到的语音频信号包括低频带信号和高频带信号，将高频带信号确定为第一语音频信号。

其中，如何对码流进行解码，本发明并不限制。

步骤202：确定所述高频带信号中每个采样值的符号以及每个采样值的幅度值。

例如，高频带信号中某一采样值的系数为-4，则该采样值的符号为“-”，幅度值为4。

步骤203：确定自适应归一化长度；

其中，具体如何确定所述自适应归一化长度可以参考步骤104中的相关描述，这里不赘述。

步骤204：根据每个采样值的幅度值以及所述自适应归一化长度确定每个采样值对应的幅度平均值，根据每个采样值对应的幅度平均值确定每个采样值对应的幅度扰动值。

其中，如何确定每个采样值对应的幅度平均值请参考步骤105中的相关描述，这里不赘述。

步骤205：根据每个采样值的幅度值及其对应的幅度扰动值计算每个采样值的调整幅度值；

其中，如何计算每个采样值的调整幅度值可以参考步骤105中的相关描述，这里不赘述。

步骤206：根据每个采样值的符号和调整幅度值确定第二语音频信号。

所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。

其中，本步骤的具体实现请参考步骤106中的相关描述，这里不赘述。

其中，步骤202中确定第一语音频信号中每个采样值的符号的步骤可以在步骤206之前的任意时刻执行，与步骤203、204、205之间没有必然的执行顺序。

其中，步骤202与步骤203之间的执行顺序不限制。

步骤207：将所述第二语音频信号和解码得到的语音频信号的低频带信号合并，得到输出信号。

其中，如果所述第一语音频信号为解码得到的语音频信号的低频带信号，则可以将所述第二语音频信号和所述解码得到的语音频信号的高频带信号合并，得到输出信号；

如果所述第一语音频信号为解码得到的语音频信号的高频带信号，则可以将所述第二语音频信号和所述解码得到的语音频信号的低频带信号合并，得到输出信号；

如果所述第一语音频信号为解码得到的语音频信号的全频带信号，则可以将所述第二语音频信号直接确定为所述输出信号。

本实施例中，通过对解码得到的语音频信号的高频带信号恢复噪声成分，从而最终恢复高频带信号中的噪声成分，得到第二语音频信号。从而如果高频带信号具有上升沿或下降沿，不会增加第二语音频信号中的回声，提高了第二语音频信号的听觉质量，进而提高了最终输出的所述输出信号的听觉质量。

参见图3，为本发明实施例恢复语音频信号噪声成分的方法另一种流程示意图，该方法包括：

步骤301～步骤305与步骤201～步骤205相同，这里不赘述。

步骤306：计算修正因子，根据所述修正因子对每个采样值的调整幅度值中大于0的调整幅度值进行修正处理；

步骤307：根据每个采样值的符号和修正处理后的调整幅度值确定第二语音频信号。

其中，步骤302中确定第一语音频信号中每个采样值的符号的步骤可以在步骤307之前的任意时刻执行，与步骤303、304、305、306之间没有必然的执行顺序。

其中，步骤302与步骤303之间的执行顺序不限制。

步骤308：将所述第二语音频信号和解码得到的语音频信号的低频带信号合并，得到输出信号。

本实施例相对于图2所示的实施例，在得到每个采样值的调整幅度值后，对调整幅度值中大于0的调整幅度值进一步进行修正，从而进一步提高了第二语音频信号的听觉质量，进而也进一步提高了最终输出的所述输出信号的听觉质量。

在图2和图3给出的本发明实施例恢复语音频信号噪声成分的方法示例中，都是将解码得到的语音频信号中的高频带信号确定为第一语音频信号，在其中恢复噪音成分，从而最终得到第二语音频信号，在实际应用中，还可以按照本发明实施例恢复语音频信号噪声成分的方法对解码得到的语音频信号的全频带信号恢复噪声成分，或者对解码得到的语音频信号的低频带信号恢复噪声成分，最终得到第二语音频信号，其实现过程可以参见图2 和图3所示的方法示例，区别仅在于在确定第一语音频信号时将全频带信号或者低频带信号确定为所述第一语音频信号，这里不一一举例说明。

参见图4，为本发明实施例一种恢复语音频信号噪声成分的装置结构示意图，该装置可以设置于电子设备中，该装置400可以包括：

码流处理单元410，用于接收码流，解码所述码流得到语音频信号，所述第一语音频信号是解码得到的所述语音频信号中需要恢复噪声成分的信号；

信号确定单元420，用于根据所述码流处理单元410得到的所述语音频信号确定第一语音频信号；

第一确定单元430，用于确定所述信号确定单元420确定的所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值；

第二确定单元440，用于确定自适应归一化长度；

第三确定单元450，用于根据所述第二确定单元440确定的所述自适应归一化长度和所述第一确定单元430确定的每个所述采样值的幅度值确定每个所述采样值的调整幅度值；

第四确定单元460，用于根据所述第一确定单元430确定的每个所述采样值的符号和所述第三确定单元450确定的每个所述采样值的调整幅度值确定第二语音频信号，所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。

可选地，所述第三确定单元450可以包括：

可选地，所述确定子单元可以包括：

可选地，所述确定模块具体可以用于：

可选地，所述调整幅度值计算子单元具体用于：

可选地，所述第二确定单元440可以包括：

可选地，所述长度计算子单元具体可以用于：

根据公式L＝K+α×M计算所述自适应归一化长度；

可选地，所述第二确定单元440具体可以用于：

可选地，所述第四确定单元460具体可以用于：

可选地，所述第四确定单元460具体可以用于：使用公式β＝a/L计算所述修正因子；其中，β为所述修正因子，L为所述自适应归一化长度，a为大于1的常数。

可选地，所述第四确定单元460具体可以用于：

Y＝y×(b-β)；

本实施例中，根据语音频信号确定第一语音频信号，确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值，确定自适应归一化长度，根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值，根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。这一过程中，只是对第一语音频信号这一原有信号进行处理，并未在第一语音频信号中增加新的信号，从而恢复噪声成分后的第二语音频信号中并未增加新的能量，从而如果第一语音频信号具有上升沿或下降沿，不会增加第二语音频信号中的回声，从而提高了第二语音频信号的听觉质量。

参见图5，为本发明实施例电子设备结构图，该电子设备500包括：处理器510、存储器520、收发器530和总线540；

处理器510、存储器520、收发器530通过总线540相互连接；总线540可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器520，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器520可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

收发器530用于连接其他设备，并与其他设备进行通信。具体的所述收发器530可以用于：接收码流；

所述处理器510执行存储器520中存储的所述程序代码，用于解码所述码流得到语音频信号；根据所述语音频信号确定第一语音频信号；确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值；确定自适应归一化长度；根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值；根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。

可选地，所述处理器510具体可以用于：

根据公式L＝K+α×M计算所述自适应归一化长度；

可选地，所述处理器510具体可以用于：

Y＝y×(b-β)；

本实施例中，电子设备根据语音频信号确定第一语音频信号，确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值，确定自适应归一化长度，根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值，根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。这一过程中，只是对第一语音频信号这一原有信号进行处理，并未在第一语音频信号中增加新的信号，从而恢复噪声成分后的第二语音频信号中并未增加新的能量，从而如果第一语音频信号具有上升沿或下降沿，不会增加第二语音频信号中的回声，从而提高了第二语音频信号的听觉质量。

对于系统实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于计算机可读取存储介质中，这里所称得的存储介质，如：ROM、RAM、磁碟、光盘等。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。本文中应用了具体个例对本发明的原理及实施方式进行了闸述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

一种语音频信号的处理方法，其特征在于，所述方法包括：

接收码流，解码所述码流得到语音频信号；

根据所述语音频信号确定第一语音频信号，所述第一语音频信号是所述语音频信号中需要恢复噪声成分的信号；

确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值；

确定自适应归一化长度；

根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值；

根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号，所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。
根据权利要求1所述的方法，其特征在于，所述根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值，包括：

根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值，根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值；

根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值。
根据权利要求2所述的方法，其特征在于，所述根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值，包括：

对于每个所述采样值，根据所述自适应归一化长度确定所述采样值所属的子带；

计算所述采样值所属子带内所有采样值的幅度值的平均值，将计算得到的平均值作为所述采样值对应的幅度平均值。
根据权利要求3所述的方法，其特征在于，对于每个所述采样值，根据所述自适应归一化长度确定所述采样值所属的子带，包括：

将所有采样值按照预设顺序根据所述自适应归一化长度划分子带；对于每个所述采样值，将包括所述采样值的子带确定为所述采样值所属的子带；或者，

对于每个所述采样值，将所述采样值之前m个采样值、所述采样值、所述采样值之后n个采样值构成的子带确定为所述采样值所属的子带，m、n由所述自适应归一化长度确定， m是不小于0的整数，n是不小于0的整数。
根据权利要求2至4任一项所述的方法，其特征在于，所述根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值，包括：

将每个所述采样值的幅度值与其对应的幅度扰动值相减得到两者的差值，将得到的差值作为每个所述采样值的调整幅度值。
根据权利要求1至5任一项所述的方法，其特征在于，所述确定自适应归一化长度，包括：

将所述语音频信号中的低频带信号划分为N个子带；N为自然数；

计算每个所述子带的峰均比，并确定所述峰均比大于预设峰均比阈值的子带个数；

根据所述语音频信号中高频带信号的信号类型和所述子带个数，计算所述自适应归一化长度。
根据权利要求6所述的方法，其特征在于，所述根据所述语音频信号中高频带信号的信号类型和所述子带个数，计算所述自适应归一化长度，包括：

根据公式L＝K+α×M计算所述自适应归一化长度；

其中，L为所述自适应归一化长度；K为所述语音频信号中的高频带信号的信号类型对应的数值，不同高频带信号的信号类型对应的K的数值不同；M为峰均比大于预设峰均比阈值的子带个数；α为小于1的常数。
根据权利要求1至5任一项所述的方法，其特征在于，所述确定自适应归一化长度，包括：

计算所述语音频信号中低频带信号的峰均比，和所述语音频信号中高频带信号的峰均比；当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值小于预设差值阈值时，将所述自适应归一化长度确定为预设第一长度值，当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值不小于预设差值阈值时，将所述自适应归一化长度确定为预设第二长度值；所述第一长度值大于所述第二长度值；或者，

计算所述语音频信号中低频带信号的峰均比，和所述语音频信号中高频带信号的峰均比；当所述低频带信号的峰均比小于所述高频带信号的峰均比时，将所述自适应归一化长度确定为预设第一长度值，当所述低频带信号的峰均比不小于所述高频带信号的峰均比时，将所述自适应归一化长度确定为预设第二长度值；或者，

根据所述语音频信号中高频带信号的信号类型确定所述自适应归一化长度，不同高频带信号的信号类型对应的自适应归一化长度不同。
根据权利要求1至8任一项所述的方法，其特征在于，所述根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号，包括：

根据每个所述采样值的符号和调整幅度值确定每个所述采样值的新取值，得到所述第二语音频信号；或者，

计算修正因子；根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理；根据每个所述采样值的符号和修正处理后的调整幅度值确定每个所述采样值的新取值，得到第二语音频信号。
根据权利要求9所述的方法，其特征在于，所述计算修正因子，包括：

使用公式β＝a/L计算所述修正因子；其中，β为所述修正因子，L为所述自适应归一化长度，a为大于1的常数。
根据权利要求9或10所述的方法，其特征在于，所述根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理，包括：

使用以下公式对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理：

Y＝y×(b-β)；

其中，Y为修正处理后的调整幅度值，y为所述采样值的调整幅度值中大于0的调整幅度值，b为常数，0＜b＜2。
一种恢复语音频信号噪声成分的装置，其特征在于，包括：

码流处理单元，用于接收码流，解码所述码流得到语音频信号；

信号确定单元，用于根据所述码流处理单元得到的所述语音频信号确定第一语音频信号，所述第一语音频信号是解码得到的所述语音频信号中需要恢复噪声成分的信号；

第一确定单元，用于确定所述信号确定单元确定的所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值；

第二确定单元，用于确定自适应归一化长度；

第三确定单元，用于根据所述第二确定单元确定的所述自适应归一化长度和所述第一确定单元确定的每个所述采样值的幅度值确定每个所述采样值的调整幅度值；

第四确定单元，用于根据所述第一确定单元确定的每个所述采样值的符号和所述第三确定单元确定的每个所述采样值的调整幅度值确定第二语音频信号，所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。
根据权利要求12所述的装置，其特征在于，所述第三确定单元包括：

确定子单元，用于根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值，根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值；

调整幅度值计算子单元，用于根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值。
根据权利要求13所述的装置，其特征在于，所述确定子单元包括：

确定模块，用于对于每个所述采样值，根据所述自适应归一化长度确定所述采样值所属的子带；

计算模块，用于计算所述采样值所属子带内所有采样值的幅度值的平均值，将计算得到的平均值作为所述采样值对应的幅度平均值。
根据权利要求14所述的装置，其特征在于，所述确定模块具体用于：

将所有采样值按照预设顺序根据所述自适应归一化长度划分子带；对于每个所述采样值，将包括所述采样值的子带确定为所述采样值所属的子带；或者，

对于每个所述采样值，将所述采样值之前m个采样值、所述采样值、所述采样值之后n个采样值构成的子带确定为所述采样值所属的子带，m、n由所述自适应归一化长度确定，m是不小于0的整数，n是不小于0的整数。
根据权利要求13至15任一项所述的装置，其特征在于，所述调整幅度值计算子单元具体用于：

将每个所述采样值的幅度值与其对应的幅度扰动值相减得到两者的差值，将得到的差值作为每个所述采样值的调整幅度值。
根据权利要求12至16任一项所述的装置，其特征在于，所述第二确定单元包括：

划分子单元，用于将所述语音频信号中的低频带信号划分为N个子带；N为自然数；

个数确定子单元，用于计算每个所述子带的峰均比，并确定所述峰均比大于预设峰均比阈值的子带个数；

长度计算子单元，用于根据所述语音频信号中高频带信号的信号类型和所述子带个数，计算所述自适应归一化长度。
根据权利要求17所述的装置，其特征在于，所述长度计算子单元具体用于：

根据公式L＝K+α×M计算所述自适应归一化长度；

其中，L为所述自适应归一化长度；K为所述语音频信号中的高频带信号的信号类型对应的数值，不同高频带信号的信号类型对应的K的数值不同；M为峰均比大于预设峰均比阈值的子带个数；α为小于1的常数。
根据权利要求12至16任一项所述的装置，其特征在于，所述第二确定单元具体用于：

计算所述语音频信号中低频带信号的峰均比，和所述语音频信号中高频带信号的峰均比；当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值小于预设差值阈值时，将所述自适应归一化长度确定为预设第一长度值，当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值不小于预设差值阈值时，将所述自适应归一化长度确定为预设第二长度值；所述第一长度值大于所述第二长度值；或者，

计算所述语音频信号中低频带信号的峰均比，和所述语音频信号中高频带信号的峰均比；当所述低频带信号的峰均比小于所述高频带信号的峰均比时，将所述自适应归一化长度确定为预设第一长度值，当所述低频带信号的峰均比不小于所述高频带信号的峰均比时，将所述自适应归一化长度确定为预设第二长度值；或者，

根据所述语音频信号中高频带信号的信号类型确定所述自适应归一化长度，不同高频带信号的信号类型对应的自适应归一化长度不同。
根据权利要求12至19任一项所述的装置，其特征在于，所述第四确定单元具体用于：

根据每个所述采样值的符号和调整幅度值确定每个所述采样值的新取值，得到所述第二语音频信号；或者，

计算修正因子；根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理；根据每个所述采样值的符号和修正处理后的调整幅度值确定每个所述采样值的新取值，得到第二语音频信号。
根据权利要求20所述的装置，其特征在于，所述第四确定单元具体用于：使用公式β＝a/L计算所述修正因子；其中，β为所述修正因子，L为所述自适应归一化长度，a为大于1的常数。
根据权利要求20或21所述的装置，其特征在于，所述第四确定单元具体用于：

使用以下公式对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理：

Y＝y×(b-β)；

其中，Y为修正处理后的调整幅度值，y为将所述采样值的调整幅度值中大于0的调整幅度值，b为常数，0＜b＜2。