CN105513601A

CN105513601A - 一种音频编码带宽扩展中频带复制的方法及装置

Info

Publication number: CN105513601A
Application number: CN201610054436.8A
Authority: CN
Inventors: 胡瑞敏; 姜林; 文彬; 胡霞; 杨玉红; 王晓晨; 涂卫平
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2016-01-27
Filing date: 2016-01-27
Publication date: 2016-04-20

Abstract

本发明公开了一种音频编码带宽扩展中频带复制的方法及装置，本发明通过计算高频子带与各低频子带之间的皮尔逊相关系数选取最强相关子带，并通过判断最高相关系数数值是否低于阈值，找到频带间更合适、更具关联性的匹配组合，指导原始高频重建。同时对最大相关性相关程度不大的情况，引入高斯白噪声代替低频子带来复制高频子带，避免了由于信号的谐波特性不明显，频谱相关性比较弱，很容易出现最大相关的子带之间的相关性也很弱，如果此时仍然使用最大相关子带重建，反而会引入误差。因此本发明实施例技术方案能够更准确的进行高频重建。

Description

一种音频编码带宽扩展中频带复制的方法及装置

技术领域

本发明属于音频编码技术领域，具体涉及一种音频编码带宽扩展中频带复制的方法及装置。

背景技术

心理声学研究表明人们对于音频不同频率下的敏感性具有差异，对低频更敏感而对高频不敏感，因此在音频编码中常常不对高频进行编码以节省码率。而高频部分的完全缺失又会带来听感上的不适，因此往往采用带宽扩展的方式恢复高频。以利用高低频信号之间的相关性为代表的频带复制技术是目前为止效果比较好的一种高频重建方法，它在频域把低频信号整块复制到高频频段，再利用能量参数等边信息对复制的高频段进行修复，从而达到高频重建的目的。

现有方法在利用低频信号进行高频重建时，简单的按子带顺序选取低频频带对高频频带进行重建，没有选择性。难以根据信号自身特性，做出自适应的调整，影响高频重建的准确性。虽然高频频带与低频频带具有一定的相关性，但固定的匹配方式，不足以保证相关性最好的高频频带与低频子带能准确的对应，相反可能导致相关性较弱甚至不相关的子带匹配，导致高频重建效果不佳。

发明内容

为了解决上述技术问题，本发明提供了一种音频编码带宽扩展频带复制的方法及装置。

本发明的方法所采用的技术方案是：一种音频编码带宽扩展中频带复制的方法，其特征在于，包括以下步骤：

步骤1：计算音频信号各低频子带与高频子带之间的相关系数每个原始高频的最大相关系数max(P_n[k])用最大相关矩阵P_max[n][k]记录，P_n[k]代表第n个高频子带与第k个低频子带之间的相关系数；

步骤2：为高频子带选择值最大的相关系数，并判断相关系数值是否大于阈值；

若是，则为高频子带选择相关系数最大的低频子带为最优复制子带；

若否，则用同长度的高斯白噪声作为高频子带的复制子带；

步骤3：提取频带复制所需能量信息，输出边信息。

作为优选，步骤1的具体实现过程是针对每一个原始高频子带，计算它与各个低频信号子带之间的皮尔逊相关系数，从而得到原始子带与各个待选子带之间的相关性；计算公式为：

P_{n} (k) = \frac{Σ_{i = 0}^{N - 1} (x [n, i] - \frac{Σ_{i = 0}^{N - 1} x [n, i]}{N}) (y [k, i] - \frac{Σ_{i = 0}^{N - 1} y [k, i]}{N})}{\sqrt{Σ_{i = 0}^{N - 1} {(x [n, i] - \frac{Σ_{i = 0}^{N - 1} x [n, i]}{N})}^{2}} \sqrt{Σ_{i = 0}^{N - 1} {(y [k, i] - \frac{Σ_{i = 0}^{N - 1} y [k, i]}{N})}^{2}}};

式中P_n[k]代表第n个高频子带与第k个低频子带之间的相关系数，x[n,i]表示高频子带样点，其中n表示高频子带序号，i表示子带样点序号,y[k,i]表示低频子带样点，k表示低频子带序号，N表示子带长度。

作为优选，步骤2中所述判断相关系数值是否大于阈值，判断条件为：

|P_max[n][k]|>γ；

式中P_n[k]代表第n个高频子带与第k个低频子带之间的相关系数，阈值γ取值为0.2。

作为优选，步骤3中所述边信息包括频带对应信息和能量信息；

所述频带对应信息包括高频子带与相关性最大的低频子带或高斯白噪声之间的对应关系；

所述能量信息包括相关性最大的低频子带和高频子带之间的增益值r[i]和高频子带能量均值e[i]；

r [i] = \frac{\sqrt{Σ_{i = 0}^{N - 1} x^{2} [n, i]}}{\sqrt{Σ_{i = 0}^{N - 1} y^{2} [k, i]}};

e [i] = \frac{\sqrt{Σ_{i = 0}^{N - 1} x^{2} [n, i]}}{N};

式中,r[i]表示第n个高频子带与第k个低频子带间的增益，e[i]表示第n个高频子带能量均值，x[n,i]表示高频子带样点，其中n表示高频子带序号，i表示子带样点序号，y[k,i]表示低频子带样点，k表示低频子带序号，N表示子带长度；

若最大相关性值大于阈值，则用相关性最大的低频子带复制高频子带，输出相关性最大的低频子带和高频子带之间的增益值r[i]；若最大相关性值小于等于阈值，则用高斯白噪声复制高频子带，输出高频子带能量均值e[i]。

本发明的装置所采用的技术方案是：一种音频编码带宽扩展中频带复制的装置，其特征在于：包括相关性计算模块、子带选取模块、能量信息提取模块；

所述相关性计算模块，用于计算音频信号各高频子带与各低频子带之间的相关系数；

所述子带选取模块，用于确定频带对应关系，为高频子带选择值最大的相关系数，并判断相关系数值是否大于阈值；若最大相关系数的值大于阈值，则为高频子带选择相关系数最大的的低频子带为最优复制子带，若最大相关系数的值小于阈值，则用同长度的高斯白噪声作为高频子带的复制子带；

所述能量信息提取模块，用于提取频带复制所需能量信息，输出边信息。

本发明与现有技术相比的有益效果是，本发明实施例方案充分考虑到了低频子带和高频子带的相关性，通过计算高频子带与各低频子带之间的皮尔逊相关系数选取最强相关子带，并通过判断最高相关系数数值是否低于阈值，找到频带间更合适、更具关联性的匹配组合，指导原始高频重建。同时对最大相关性相关程度不大的情况，引入高斯白噪声代替低频子带来复制高频子带，避免了由于信号的谐波特性不明显，频谱相关性比较弱，很容易出现最大相关的子带之间的相关性也很弱，如果此时仍然使用最大相关子带重建，反而会引入误差。因此本发明实施例技术方案能够更准确的进行高频重建。

附图说明

图1是本发明实施例频带复制的方法流程图。

图2是本发明实施例的频带复制的装置模块图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

请见图1，本发明提供的一种音频编码带宽扩展中频带复制的方法，包括以下步骤：

步骤1,针对每一个原始高频子带，通过下式计算它与各个低频信号子带之间的皮尔逊相关系数，从而得到原始子带与各个待选子带之间的相关性；

P_{n} (k) = \frac{Σ_{i = 0}^{N - 1} (x [n, i] - \frac{Σ_{i = 0}^{N - 1} x [n, i]}{N}) (y [k, i] - \frac{Σ_{i = 0}^{N - 1} y [k, i]}{N})}{\sqrt{Σ_{i = 0}^{N - 1} {(x [n, i] - \frac{Σ_{i = 0}^{N - 1} x [n, i]}{N})}^{2}} \sqrt{Σ_{i = 0}^{N - 1} {(y [k, i] - \frac{Σ_{i = 0}^{N - 1} y [k, i]}{N})}^{2}}};

以上计算对所有的原始高频子带n进行，对每个原始高频子带选择出使得P_n(k)最大的k，即为原始高频子带相关度最高的低频子带。

记录每个原始高频的最大相关系数max(P_n[k])用最大相关矩阵P_max[n][k]记录。

步骤2,对步骤S1的到的一组最大相关系数max(P_n[k])，判断最大相关系数值是否小于阈值γ。具体条件为：

|P_max[n][k]|>γ；

阈值γ取值为0.2。

步骤3,根据步骤2的判决结果，确定高频重建频带的对应关系，若最大相关性值大于阈值，则用相关性最大的低频子带复制高频子带；若最大相关性值小于等于阈值，则用高斯白噪声复制高频子带。

步骤4,提取高频重建所需能量参数，能量信息具体为相关性最大的低频子带和高频子带之间的增益值r[i]和高频子带能量均值e[i]；若最大相关性值大于阈值，则用相关性最大的低频子带复制高频子带，输出相关性最大的低频子带和高频子带之间的增益值r[i]；若最大相关性值小于等于阈值，则用高斯白噪声复制高频子带，输出高频子带能量均值e[i]。

r [i] = \frac{\sqrt{Σ_{i = 0}^{N - 1} x^{2} [n, i]}}{\sqrt{Σ_{i = 0}^{N - 1} y^{2} [k, i]}}

e [i] = \frac{\sqrt{Σ_{i = 0}^{N - 1} x^{2} [n, i]}}{N}

式中,r[i]表示第n个高频子带与第k个低频子带间的增益，e[i]表示第n个高频子带能量均值，x[n,i]表示高频子带样点，其中n表示高频子带序号，i表示子带样点序号，y[k,i]表示低频子带样点，k表示低频子带序号，N表示子带长度。

请见图2，本发明提供的一种音频编码带宽扩展中频带复制的装置，包括：相关性计算模块、子带选取模块、能量信息提取模块。相关性计算模块，用于计算音频信号各高频子带与各低频子带之间的相关系数；子带选取模块，用于确定频带对应关系，为高频子带选择值最大的相关系数，并判断相关系数值是否大于阈值；若最大相关系数的值大于阈值，则为高频子带选择相关系数最大的的低频子带为最优复制子带，若最大相关系数的值小于阈值，则用同长度的高斯白噪声作为高频子带的复制子带；能量信息提取模块，用于提取频带复制所需能量信息，输出边信息。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

Claims

1.一种音频编码带宽扩展中频带复制的方法，其特征在于，包括以下步骤：

步骤1：计算音频信号各低频子带与高频子带之间的相关系数，每个原始高频的最大相关系数max(P_n[k])用最大相关矩阵P_max[n][k]记录，P_n[k]代表第n个高频子带与第k个低频子带之间的相关系数；

若否，则用同长度的高斯白噪声作为高频子带的复制子带；

步骤3：提取频带复制所需能量信息，输出边信息。

2.根据权利要求1所述音频编码带宽扩展中频带复制的方法，其特征在于：步骤1的具体实现过程是针对每一个原始高频子带，计算它与各个低频信号子带之间的皮尔逊相关系数，从而得到原始子带与各个待选子带之间的相关性；计算公式为：

P_{n} (k) = \frac{Σ_{i = 0}^{N - 1} (x [n, i] - \frac{Σ_{i = 0}^{N - 1} x [n, i]}{N}) (y [k, i] - \frac{Σ_{i = 0}^{N - 1} y [k, i]}{N})}{\sqrt{Σ_{i = 0}^{N - 1} {(x [n, i] - \frac{Σ_{i = 0}^{N - 1} x [n, i]}{N})}^{2}} \sqrt{Σ_{i = 0}^{N - 1} {(y [k, i] - \frac{Σ_{i = 0}^{N - 1} y [k, i]}{N})}^{2}}};

3.根据权利要求1所述音频编码带宽扩展中频带复制的方法，其特征在于：步骤2中所述判断相关系数值是否大于阈值，判断条件为：

|P_max[n][k]|>γ；

阈值γ取值为0.2。

4.根据权利要求1所述音频编码带宽扩展中频带复制的方法，其特征在于：步骤3中所述边信息包括频带对应信息和能量信息；

r [i] = \frac{\sqrt{Σ_{i = 0}^{N - 1} x^{2} [n, i]}}{\sqrt{Σ_{i = 0}^{N - 1} y^{2} [k, i]}};

e [i] = \frac{\sqrt{Σ_{i = 0}^{N - 1} x^{2} [n, i]}}{N};

5.一种音频编码带宽扩展中频带复制的装置，其特征在于：包括相关性计算模块、子带选取模块、能量信息提取模块；