CN101609678B

CN101609678B - 信号压缩方法及其压缩装置

Info

Publication number: CN101609678B
Application number: CN200910149823XA
Authority: CN
Inventors: 齐峰岩; 苗磊; 许剑峰; 张德军; 哈维·米希尔·塔迪; 张清
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2008-12-30
Filing date: 2009-06-25
Publication date: 2011-07-27
Anticipated expiration: 2029-06-25
Also published as: CN101609678A; US8396716B2; US20130117030A1; EP2204797B1; EP2204797A1; US8560329B2; ATE537537T1; KR101095425B1; US20100169086A1; KR20100080435A; JP5275212B2; JP2013109381A; JP2010170124A

Abstract

本发明涉及音频压缩领域，为了解决现有技术中音频压缩效率低、重建语音质量差的问题，提供了一种信号压缩方法及其压缩装置，该方法包括对输入信号加窗；求加窗后的输入信号的第一自相关系数；根据所述第一自相关系数和输入信号的特征参数计算白噪声修正因子或Lag-window系数，并根据所述第一自相关系数、白噪声修正因子和Lag-window系数计算出第二自相关系数；根据所述第二自相关系数计算出LP系数；根据所述LP系数计算出压缩编码流。本发明的有益效果在于，避免了一些特殊输入信号的病态求解条件，使得自相关系数更适合后续压缩处理，提高了无损编码器压缩效率和有损编码器的重建语音质量，并且复杂度很低。

Description

信号压缩方法及其压缩装置

技术领域

本发明涉及音频压缩领域，具体是一种信号压缩方法及其压缩装置。

背景技术

为节省语音与音频信号传输和存储的带宽，语音与音频编码技术得到了广泛的应用，目前主要分为有损编码和无损编码。

线性预测(LP：linear prediction)分析在无损压缩编码中被广泛应用，主要是为了降低输入信号的动态范围，去除信号近样点的冗余度，但在无损编码中大多都没有考虑做带宽扩展。

在有损编码G.729中应用了一种对自相关加滞后窗(lag-window)的带宽扩展技术，在用Levinson-Durbin算法求解LP系数时，需要进行一个60Hz的带宽扩展。主要是为了使LP分析更加稳定。以下是现有技术中计算LP系数的步骤：

1.对输入信号加窗，然后计算出自相关系数：r(0)，r(1)…r(p)，p为LP的阶数。

2.求自相关系数的加权因子win_lag：

{win}_{lag} (k) = \exp [- \frac{1}{2} {(\frac{2 π f_{0} k}{f_{s}})}^{2}]

k＝1，...，p

这里的f₀为常数，例如f₀＝60Hz，f_s为信号采样频率8000Hz，p为LP分析的阶数10。

3.确定白噪声修正因子为：win_lag(0)＝1.0001

4.计算调整后的自相关系数：

r(0)′＝win_lag(0)r(0)

r(k)′＝win_lag(k)r (k)k＝1，...，p

5.用调整后的自相关系数经过Levinson-Durbin算法求出新的LP系数。

在现有技术中，对所有信号都做同样的处理。

LP分析在无损压缩编码中被广泛应用，主要是为了降低输入信号的动态范围，去除信号近样点的冗余度。

本发明的发明人在实施本发明方案时发现，上述现有技术中至少存在以下问题，由于对所有信号都做同样的处理，这样对于一些特殊的输入信号会产生病态的求解条件，使得自相关矩阵求解不稳定，从而导致无损编码器压缩效率比较低，有损编码器的重建语音质量比较差。

发明内容

本发明提供一种信号压缩方法及其压缩装置，能够根据信号特点对不同信号做不同的处理，避免了一些特殊的输入信号产生病态的求解条件，提高了音频压缩效率和重建语音质量。

本发明实施例提供了一种信号压缩方法，包括：对输入信号加窗；求加窗后的输入信号的第一自相关系数；根据所述第一自相关系数调整自相关系数修正因子；根据所述第一自相关系数和调整后的自相关系数修正因子，计算第二自相关系数；根据所述第二自相关系数计算出线性预测系数；根据所述线性预测系数对输入信号进行压缩编码，输出压缩编码数据流。

本发明实施例还提供一种信号压缩方法，包括：对输入信号加窗；求加窗后的输入信号的第一自相关系数；根据所述第一自相关系数的第一个系数计算出能量参数，根据所述能量参数对白噪声修正因子进行相应的调整；根据扩展带宽计算滞后窗系数；根据所述第一自相关系数、调整后的白噪声修正因子和滞后窗系数，计算第二自相关系数；根据所述第二自相关系数计算出线性预测系数；根据所述线性预测系数对输入信号进行线性预测，计算出残差信号，对所述残差信号进行压缩编码，输出压缩编码数据流。

本发明实施例还提供了一种信号压缩装置，包括：加窗单元，用于对输入信号加窗；第一自相关系数计算单元，用于求所述加窗单元处理后的输入信号的第一自相关系数；带宽扩展单元，根据所述第一自相关系数调整自相关系数修正因子，并根据所述第一自相关系数和调整后的自相关系数修正因子，计算第二自相关系数；线性预测系数求解单元，用于根据所述带宽扩展单元计算的第二自相关系数计算出线性预测系数；压缩单元，根据所述线性预测系数求解单元计算的线性预测系数对输入信号进行压缩编码，输出压缩编码数据流。

本发明实施例提供的技术方案，由于根据第一自相关系数调整自相关系数修正因子，使得调整后的自相关系数修正因子可以表达出输入信号的不同，因此避免了一些特殊输入信号的病态求解条件，使得自相关系数更适合后续压缩处理，提高了无损编码器压缩效率和有损编码器的重建语音质量，并且复杂度很低。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。在附图中：

图1所示为本发明音频压缩带宽扩展方法第一实施例流程图；

图2所示为本发明音频压缩带宽扩展方法第二实施例流程图；

图3所示为本发明音频压缩带宽扩展方法第三实施例流程图；

图4所示为本发明音频压缩带宽扩展方法第四实施例流程图；

图5所示为本发明音频压缩装置的第一实施例结构图；

图6所示为本发明音频压缩装置的第二实施例结构图；

图7所示为本发明音频压缩装置第二实施例的带宽扩展单元的实施例结构示意图；

图8所示为本发明音频压缩装置的第三实施例结构图；

图9所示为本发明音频压缩装置第三实施例的带宽扩展单元的实施例结构示意图；

图10所示为本发明带宽扩展单元的另一个实施例结构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施方式和附图，对本发明做进一步详细说明。在此，本发明的示意性实施方式及其说明用于解释本发明，但并不作为对本发明的限定。

本发明实施例提供一种音频压缩带宽扩展方法及其压缩装置。以下结合附图对本发明进行详细说明。

实施例一

如图1所示为本发明音频压缩带宽扩展方法第一实施例流程图，该方法包括以下步骤：

步骤101，对输入信号加窗。

步骤102，计算加窗后的输入信号的第一自相关系数。

步骤103，根据第一自相关系数调整自相关系数修正因子。

步骤104，根据第一自相关系数和调整后的自相关系数修正因子，计算第二自相关系数。

其中，所述自相关系数修正因子包括白噪声修正因子和滞后窗系数，所述滞后窗系数即Lag-window系数；所述调整自相关系数修正因子可以是，调整白噪声修正因子和Lag-window系数，或者仅调整白噪声修正因子，或者仅调整Lag-window系数。

根据第一自相关系数调整自相关系数修正因子可以是：根据所述第一自相关系数确定输入信号的特征参数，根据特征参数调整自相关系数修正因子。其中，特征参数可以选取能量、周期性参数、过零率和反射系数等参数或它们的某种组合，并且可以从原始输入信号或任何一个步骤中的信号中提取。

步骤105，根据所述第二自相关系数计算出LP系数。

步骤106，根据所述LP系数对输入信号进行压缩编码，输出压缩编码数据流。

其中，根据所述LP系数对输入信号进行压缩编码可以是：根据LP系数对原始输入信号进行LP预测，计算出残差信号，再做LTP(Long Term Prediction，长时预测)和熵编码，最后输出残差信号的无损压缩编码码流；或者，将LP系数和原始信号输入到码激励线性预测(CELP，Code Excited LinearPrediction)模型，得到编码码流。

作为本发明的一个实施例，还可以包括预处理步骤，在所述步骤101之前，对输入信号进行预处理。对于有损压缩该预处理可以是高通滤波步骤，用于提高输入信号的高频成份或用于滤除不必要的低频干扰成分，然后将该滤波后的信号进行步骤101加窗处理；对于无损压缩该预处理可以是映射处理，将输入信号从A率或者μ率映射到脉冲编码调制(PCM)域，在PCM域的信号更适合LP短时预测。

通过上述实施例的技术方案，通过自相关系数反映了各个信号的自身特点，根据这种特点对自相关系数修正因子进行调整，使得调整后的自相关系数修正因子根据各个信号的特点确定，从而针对不同的信号计算出不同的LP系数，这样能够使LP系数更加准确的符合信号自身的特征，可以很好地避免一些病态的求解条件，使得求解的系数更加鲁棒，而且复杂度低。

实施例二

如图2所示为本发明音频压缩带宽扩展方法第二实施例流程图，该方法包括以下步骤：

步骤201，对输入信号加窗。可以采用现有技术中有损编码中采用的加窗，首先输入的语音频信号s(n)与窗函数win(n)相乘得到加窗信号s′(n)：

s′(n)＝win(n)s(n) n＝0，...N-1，N为帧长。

步骤202，根据加窗后的输入信号s′(n)，求第一自相关系数r(k)，例如可以采用下述计算公式得到：

r (k) = Σ_{n = k}^{N - 1} s^{'} (n) s^{'} (n - k)

k＝0，...，p p为LP分析的阶数。

步骤203，根据第一自相关系数求出能量参数。

某些实施方式中，可以根据第一自相关系数的第一个系数r(0)求出帧平均能量：

Ener_avg＝r(0)/N，其中N为帧长；

另外一些实施方式中，可以根据第一自相关系数的第一个系数r(0)求出帧能量参数：

这里

表示下取整，即

步骤204，根据能量参数对白噪声修正因子进行调整。

本发明实施例中，可以设置能量门限E_thr，根据能量参数E与E_thr的关系区分输入信号，针对不同的输入信号采用不同的调整函数对白噪声因子进行相应的调整，具体的可以根据能量参数所处的不同门限值区间采用不同的调整函数对白噪声因子进行相应的调整，

{win}_{lag} (0) = \{\begin{matrix} function_1 (r (0)); & E &Element; [0, E_{thr 1}) \\ function_2 (r (0)); & E &Element; [E_{thr 1}, E_{thr 2}) \\ . \\ . \\ . \\ function_n (r (0)); & E &Element; [E_{thr (n - 1)}, E_{thrn}] \end{matrix}

某些实施方式中，可以根据帧平均能量Ener_avg和能量门限E_thr，将帧分为高能量帧和低能量帧，然后对白噪声修正因子win_lag(0)做不同的调整处理：

if(Ener_avg＞＝E_thr)

win_lag(0)＝H+α*Ener_avg；

else

win_lag(0)＝L+β*Ener_avg；

能量门限E_thr确定可以通过大量的语音语料找到能够区分清/浊音的一个常值，例如E_thr＝1638，约为32dB。这里的H，L，α，β是经验值常数，可以利用具有代表性的训练数据以最终编码器性能为标准训练得出，例如H＝1.001，L＝1.002，α＝β＝-6×10^-7。

另外一些实施方式中，可以根据帧能量参数Ener和能量门限E_thr，将帧分为高能量帧和低能量帧，然后对白噪声修正因子win_lag(0)做不同的调整处理：

if(Ener＜E_thr)

win_lag(0)＝L+β*(Ener+E_thr)；

else

win_lag(0)＝H+α*(Ener+E_thr)；

能量门限E_thr确定可以通过大量的语音语料找到能够区分清/浊音的一个常值，考虑到帧长的影响，可以对不同的帧长设置不同的能量门限，例如

E_{thr} = \{\begin{matrix} 13 & N = 160 \\ 12 & N = 240,320 \end{matrix} .

这里的H，L，α，β是经验值常数，可以利用具有代表性的训练数据以最终编码器性能为标准训练得出，例如H＝1.0028，L＝1.0018，α＝β＝-2^-14。

步骤205，根据扩展带宽f₀，计算带宽扩展的lag-window系数win_lag(k)：

{win}_{lag} (k) = \exp [- \frac{1}{2} {(\frac{2 π f_{0} k}{f_{s}})}^{2}]

k＝1，...，p

f₀为扩展带宽，例如为34Hz，f_s为信号的采样频率，例如为8000Hz，p为LP分析的阶数。

步骤206，根据第一自相关系数r(k)、调整后的白噪声修正因子win_lag(0)和lag-window系数win_lag(k)，计算自相关系数修正因子调整后的第二自相关系数r(0)′…r(k)′：

r(0)′＝win_lag(0)r(0)

r(k)′＝win_lag(k)r(k) k＝1，...，p

步骤207，用调整后的第二自相关系数r(0)′…r(k)′经过Levinson-Durbin算法求出新的LP系数。

步骤208，根据所述LP系数对输入信号进行压缩编码，输出压缩编码数据流。其中，根据所述LP系数对输入信号进行压缩编码可以是：对原始输入信号经过LP预测计算出残差信号，再做LTP和熵编码，最后输出残差信号的无损压缩输出；或者，将LP系数和原始信号输入到码激励线性预测(CELP)模型，最后得到编码码流。

通过本实施例的技术方案，通过自相关系数计算出反映信号的自身特点的能量参数，根据能量参数对白噪声修正因子进行调整，使得调整后的自相关系数修正因子根据各个信号的特点确定，从而针对不同的信号计算出不同的LP系数，这样能够使LP系数更加准确的符合信号自身的特征，可以很好地避免一些病态的求解条件，使得求解的系数更加鲁棒，而且复杂度低。

实施例三

如图3所示为本发明音频压缩带宽扩展方法第三实施例流程图，该方法包括以下步骤：

步骤301，对输入信号加窗。可以采用现有技术中有损编码中采用的加窗，首先输入的语音频信号s(n)与窗函数win(n)相乘得到加窗信号s′(n)：

s′(n)＝win(n)s(n) n＝0，...N-1，N为帧长。

步骤302，根据加窗后的输入信号s′(n)，求第一自相关系数r(k)，例如可以采用下述计算公式得到：

r (k) = Σ_{n = k}^{N - 1} s^{'} (n) s^{'} (n - k)

k＝0，...，p p为LP分析的阶数。

步骤303，确定白噪声修正因子为：win_lag(0)＝1.0001。

步骤304，根据第一自相关系数，计算出帧的反射系数；在本例中考虑到计算复杂度的影响，只计算出第一个反射系数，但是本发明并不限于只计算第一个反射系数，反射系数可以通过Levinson-Durbin递归算法求得：

E^[0]＝r(0)

for i＝1 to p

a_{0}^{[i - 1]} = 1

k_{i}^{'} = - [Σ_{j = 0}^{i - 1} a_{j}^{[i - 1]} r (i - j)] / E^{[i - 1]}

a_{i}^{[i]} = k_{i}^{'}

for j＝1 to i-1

a_{j}^{[i]} = a_{j}^{[i - 1]} + k_{i}^{'} a_{i - j}^{[i - 1]}

end

E^{[i]} = (1 - k_{i}^{' 2}) E^{[i - 1]}

end

通过此递归算法最终得出k_i＝-k′_i＝1，...，p，其中，

k₁＝r(1)/r(0)。

步骤305，根据反射系数k₁自适应求出要扩展的带宽f₀，调整扩展带宽f₀：

f₀＝F+αk₁，其中F可以为一常值，例如为60Hz，α为调节扩展因子，可以利用具有代表性的训练数据以最终的编码器性能为标准训练得出，例如α＝10。

步骤306，根据扩展带宽f₀，计算带宽扩展的lag-window系数：

{win}_{lag} (k) = \exp [- \frac{1}{2} {(\frac{2 π f_{0} k}{f_{s}})}^{2}]

k＝1，...，p

其中，f₀为步骤305中计算得出的扩展带宽，f_s为信号采样频率，例如为8000Hz，p为LP分析的阶数。

步骤307，根据第一自相关系数r(k)、白噪声修正因子win_lag(0)和lag-window系数win_lag(k)，计算自相关系数修正因子调整后的第二自相关系数r(0)′…r(k)′：

r(0)′＝win_lag(0)r(0)

r(k)′＝win_lag(k)r(k) k＝1，...，p

步骤308，用调整后的第二自相关系数r(0)′…r(k)′经过Levinson-Durbin算法求出新的LP系数。

步骤309，根据所述LP系数对输入信号进行压缩编码，输出压缩编码数据流。其中，根据所述LP系数对输入信号进行压缩编码可以是：将LP系数和原始信号输入到码激励线性预测(CELP)模型，最后得到编码码流；或者，对原始输入信号经过LP预测计算出残差信号，再做LTP和熵编码，最后输出残差信号的无损压缩输出。

通过本实施例的技术方案，通过自相关系数计算出反映信号的自身特点的反射系数，根据反射系数确定扩展带宽，并进一步对lag-window进行调整，使得调整后的自相关系数修正因子根据各个信号的特点确定，从而针对不同的信号计算出不同的LP系数，这样能够使LP系数更加准确的符合信号自身的特征，可以很好地避免一些病态的求解条件，使得求解的系数更加鲁棒，而且复杂度低。

实施例四

如图4所示为本发明音频压缩带宽扩展方法第四实施例流程图，该方法包括以下步骤：

步骤401，对输入信号加窗。可以采用现有技术中有损编码中采用的加窗，首先输入的语音频信号s(n)与窗函数win(n)相乘得到加窗信号s′(n)：

s′(n)＝win(n)s(n) n＝0，...N-1，N为帧长。

步骤402，根据加窗后的输入信号s′(n)，求第一自相关系数，例如可以采用下述计算公式得到：

r (k) = Σ_{n = k}^{N - 1} s^{'} (n) s^{'} (n - k)

k＝0，...，p p为LP分析的阶数。

步骤403，根据第一自相关系数求出能量参数。

Ener_avg＝r(0)/N，其中N为帧长；

这里表示下取整，即

步骤404，根据能量参数对白噪声修正因子进行调整。

{win}_{lag} (0) = \{\begin{matrix} function_1 (r (0)); & E &Element; [0, E_{thr 1}) \\ function_2 (r (0)); & E &Element; [E_{thr 1}, E_{thr 2}) \\ . \\ . \\ . \\ function_n (r (0)); & E &Element; [E_{thr (n - 1)}, E_{thrn}] \end{matrix}

if(Ener_avg＞＝E_thr)

win_lag(0)＝H+α*Ener_avg；

else

win_lag(0)＝L+β*Ener_avg；

这里的E_thr，H，L，α，β是经验值常数，可以根据具体情况得出。

if(Ener＜E_thr)

win_lag(0)＝L+β*(Ener+E_thr)；

else

win_lag(0)＝H+α*(Ener+E_thr)；

步骤405，根据第一自相关系数，计算出帧的反射系数；在本例中考虑到计算复杂度的影响，只计算出第一个反射系数，但是本发明并不限于只计算第一个反射系数：

k₁＝r(1)/r(0)。

步骤406，根据反射系数k₁自适应求出要扩展的带宽f₀，调整扩展带宽f₀：

步骤407，根据扩展带宽f₀，计算带宽扩展的lag-window系数：

{win}_{lag} (k) = \exp [- \frac{1}{2} {(\frac{2 π f_{0} k}{f_{s}})}^{2}]

k＝1，...，p

其中，f₀为步骤405中计算得出的扩展带宽，f_s为信号采样频率，例如为8000Hz，p为LP分析的阶数。

步骤408，根据第一自相关系数r(k)、白噪声修正因子win_lag(0)和lag-window系数win_lag(k)，计算自相关系数修正因子调整后的第二自相关系数：

r(0)′＝win_lag(0)r(0)

r(k)′＝win_lag(k)r(k) k＝1，...，p

步骤409，用调整后的第二自相关系数r(0)′…r(k)′经过Levinson-Durbin算法求出新的LP系数。

步骤410，根据所述LP系数对输入信号进行压缩编码，输出压缩编码数据流。其中，根据所述LP系数对输入信号进行压缩编码可以是：对原始输入信号经过LP预测计算出残差信号，再做LTP和熵编码，最后输出残差信号的无损压缩输出；或者，将LP系数和原始信号输入到码激励线性预测(CELP)模型，最后得到编码码流。

通过本实施例的技术方案，通过自相关系数计算出反映信号的自身特点的能量参数和反射系数，根据能量参数对白噪声修正因子进行调整，根据反射系数确定扩展带宽，并进一步对lag-window进行调整，使得调整后的自相关系数修正因子根据各个信号的特点确定，从而针对不同的信号计算出不同的LP系数，这样能够使LP系数更加准确的符合信号自身的特征，可以很好地避免一些病态的求解条件，使得求解的系数更加鲁棒，而且复杂度低。

实施例五

如图5所示为本发明信号压缩装置的第一实施例结构图，该装置包括：加窗单元501，第一自相关系数计算单元502，带宽扩展单元503，LP系数求解单元504，压缩单元505。

所述加窗单元501，用于对输入信号进行加窗处理。

所述第一自相关系数计算单元502，用于根据所述加窗单元501加窗后的输入信号，计算第一自相关系数。

所述带宽扩展单元503，用于根据所述第一自相关系数计算单元502计算的第一自相关系数调整自相关系数修正因子，并根据该第一自相关系数和调整后的自相关系数修正因子，计算第二自相关系数。

所述LP系数求解单元504，用于根据所述带宽扩展单元503计算的第二自相关系数计算出LP系数。

所述压缩单元505，用于根据所述LP系数求解单元504计算的LP系数对输入信号进行压缩编码，输出压缩编码数据流。

作为本发明的一个实施例，还可以包括预处理单元500，用于针对不同的压缩，对输入信号进行相应的预处理，将处理后的信号发送给所述加窗单元，使输入信号更适合后续模块处理。对于有损压缩该预处理单元可以是高通滤波器，用于提高输入信号的高频成份或用于滤除不必要的低频干扰成分，然后将该滤波后的信号输入到加窗单元501中；对于无损压缩该预处理单元可以是起到映射功能的模块，将输入信号从A率或者μ率映射到脉冲编码调制(PCM)域，在PCM域的信号更适合LP短时预测。

通过上述实施例，通过自相关系数反映了各个信号的自身特点，根据这种特点对自相关系数修正因子进行调整，使得调整后的自相关系数修正因子根据各个信号的特点确定，从而针对不同的信号计算出不同的LP系数，这样能够使LP系数更加准确的符合信号自身的特征，可以很好地避免一些病态的求解条件，使得求解的系数更加鲁棒，而且复杂度低。

实施例六

如图6所示为本发明信号压缩装置的第二实施例结构图，该装置包括：加窗单元601，第一自相关系数计算单元602，带宽扩展单元603，LP系数求解单元604，LP预测单元605，LTP处理单元606，熵编码单元607。

所述加窗单元601，用于对输入信号加窗，可以采用现有技术中有损编码中采用的加窗单元，首先输入的语音频信号s(n)与窗函数win(n)相乘得到加窗信号s′(n)：

s′(n)＝win(n)s(n) n＝0，...N-1，N为帧长。

所述第一自相关系数计算单元602，用于根据所述加窗单元601加窗后的输入信号，计算第一自相关系数，例如可以采用下述计算公式得到：

r (k) = Σ_{n = k}^{N - 1} s^{'} (n) s^{'} (n - k)

k＝0，...，p p为LP分析的阶数。

所述带宽扩展单元603，如图7所示，可以包括能量模块701，白噪声修正因子模块702，lag-window系数模块703，第二自相关系数计算模块704。

所述能量模块701，用于根据第一自相关系数求出能量参数。

某些实施方式中，能量模块701可以根据第一自相关系数的第一个系数r(0)求出帧平均能量：

Ener_avg＝r(0)/N，其中N为帧长；

另外一些实施方式中，能量模块701可以根据第一自相关系数的第一个系数r(0)求出帧能量参数Ener：

这里

表示下取整，即

所述白噪声修正因子模块702，用于根据能量模块701求出的能量参数对白噪声修正因子进行调整。

{win}_{lag} (0) = \{\begin{matrix} function_1 (r (0)); & E &Element; [0, E_{thr 1}) \\ function_2 (r (0)); & E &Element; [E_{thr 1}, E_{thr 2}) \\ . \\ . \\ . \\ function_n (r (0)); & E &Element; [E_{thr (n - 1)}, E_{thrn}] \end{matrix}

某些实施方式中，白噪声修正因子模块702可以根据帧平均能量Ener_avg和能量门限E_thr，将帧分为高能量帧和低能量帧，然后对白噪声修正因子win_lag(0)做不同的调整处理：

if(Ener_avg＞＝E_thr)

win_lag(0)＝H+α*Ener_avg；

else

win_lag(0)＝L+β*Ener_avg；

另外一些实施方式中，白噪声修正因子模块702可以根据帧能量参数Ener和能量门限E_thr，将帧分为高能量帧和低能量帧，然后对白噪声修正因子win_lag(0)做不同的调整处理：

if(Ener＜E_thr)

win_lag(0)＝L+β*(Ener+E_thr)；

else

win_lag(0)＝H+α*(Ener+E_thr)；

这里的H，L，α，β是经验值常数，可以根据具体情况得出。

所述lag-window系数模块703，用于根据扩展带宽f₀，计算带宽扩展的lag-window系数win_lag(k)：

{win}_{lag} (k) = \exp [- \frac{1}{2} {(\frac{2 π f_{0} k}{f_{s}})}^{2}]

k＝1，...，p

f₀为扩展带宽，例如为34Hz，f_s为信号采样频率，例如为8000Hz，p为LP分析的阶数。

所述第二自相关系数计算模块704，用于根据第一自相关系数r(k)、调整后的白噪声修正因子win_lag(0)和lag-window系数win_lag(k)，计算自相关系数修正因子调整后的第二自相关系数：

r(0)′＝win_lag(0)r(0)

r(k)′＝win_lag(k)r(k) k＝1，...，p

所述LP系数求解单元604，用于根据所述带宽扩展单元603调整后的第二自相关系数r(0)′…r(k)′经过Levinson-Durbin算法求出新的LP系数。

所述LP预测单元605，用于根据所述LP系数求解单元604计算的LP系数对原始输入信号进行LP预测，计算出残差信号；

所述LTP处理单元606，用于对所述LP预测单元605输出的残差信号做LTP；

所述熵编码单元607，用于对所述LTP处理单元606输出的长时预测后的信号进行熵编码，输出残差信号的无损压缩编码码流。

所述LP预测单元605、LTP处理单元606和熵编码单元607分别可以采用现有技术中的功能单元实现。

实施例七

如图8所示为本发明音频压缩装置的第三实施例结构图，该装置包括：加窗单元801，第一自相关系数计算单元802，带宽扩展单元803，LP系数求解单元804，CELP编码单元805。

所述加窗单元801，用于对输入信号加窗，可以采用现有技术中有损编码中采用的加窗单元，首先输入的语音频信号s(n)与窗函数win(n)相乘得到加窗信号s′(n)：

s′(n)＝win(n)s(n) n＝0，...N-1，N为帧长。

所述第一自相关系数计算单元802，用于根据所述加窗单元601加窗后的输入信号，计算第一自相关系数，例如可以采用下述计算公式得到：

r (k) = Σ_{n = k}^{N - 1} s^{'} (n) s^{'} (n - k)

k＝0，...，p p为LP分析的阶数。

所述带宽扩展单元803，如图9所示，可以包括白噪声修正因子模块901，反射系数计算模块902，带宽计算模块903，lag-window系数模块904，第二自相关系数计算模块905。

所述白噪声修正因子模块901，用于确定白噪声修正因子win_lag(0)＝1.0001。

所述反射系数计算模块902，用于根据第一自相关系数，计算出帧的反射系数；在本例中考虑到计算复杂度的影响，只计算出第一个反射系数，但是本发明并不限于只计算第一个反射系数：

k₁＝r(1)/r(0)。

所述带宽计算模块903，用于根据所述反射系数计算模块902计算的反射系数k₁自适应求出要扩展的带宽：

f₀＝F+αk₁，其中F可以为60Hz，α为经验因子，可以根据实验来确定。

所述lag-window系数模块904，用于根据所述带宽计算模块903输出的扩展带宽f₀，计算带宽扩展的lag-window系数：

{win}_{lag} (k) = \exp [- \frac{1}{2} {(\frac{2 π f_{0} k}{f_{s}})}^{2}]

k＝1，...，p

f₀为所述带宽计算模块903计算得出的扩展带宽，f_s为信号采样频率，例如为8000Hz，p为LP分析的阶数。

所述第二自相关系数计算模块905，用于根据第一自相关系数r(k)、白噪声修正因子win_lag(0)和lag-window系数win_lag(k)，计算自相关系数修正因子调整后的第二自相关系数：

r(0)′＝win_lag(0)r(0)

r(k)′＝win_lag(k)r(k) k＝1，...，p

所述LP系数求解单元804，用于根据所述带宽扩展单元803调整后的第二自相关系数r(0)′…r(k)′，采用Levinson-Durbin算法求出新的LP系数。

所述CELP编码单元805，用于将所述LP系数求解单元804求得的LP系数和原始输入信号，输入到码激励线性预测(CELP)模型，得到编码码流。

另外，作为本发明带宽扩展单元的另一个实施例，如图10所示，包括能量模块1001，白噪声修正因子模块1002，反射系数计算模块1003，带宽计算模块1004，lag-window系数模块1005，第二自相关系数计算模块1006。图10所示的带宽扩展单元，可以是实施例六中带宽扩展单元603和实施例七中带宽扩展单元803的替代方案；带宽扩展单元603也可以用于实施例七中替代带宽扩展单元803，带宽扩展单元803也可以用于实施例六中替代带宽扩展单元603。

所述能量模块1001，用于根据第一自相关系数求出能量参数。

某些实施方式中，能量模块1001可以根据第一自相关系数的第一个系数r(0)求出帧平均能量：

Ener_avg＝r(0)/N，其中N为帧长；

另外一些实施方式中，能量模块1001可以根据第一自相关系数的第一个系数r(0)求出帧能量参数Ener：

这里表示下取整，即

所述白噪声修正因子模块1002，用于根据能量模块1001求出的能量参数对白噪声修正因子进行调整。

{win}_{lag} (0) = \{\begin{matrix} function_1 (r (0)); & E &Element; [0, E_{thr 1}) \\ function_2 (r (0)); & E &Element; [E_{thr 1}, E_{thr 2}) \\ . \\ . \\ . \\ function_n (r (0)); & E &Element; [E_{thr (n - 1)}, E_{thrn}] \end{matrix}

某些实施方式中，白噪声修正因子模块1002可以根据帧平均能量Ener_avg和能量门限E_thr，将帧分为高能量帧和低能量帧，然后对白噪声修正因子win_lag(0)做不同的调整处理：

if(Ener_avg＞＝E_thr)

win_lag(0)＝H+α*Ener_avg；

else

win_lag(0)＝L+β*Ener_avg；

另外一些实施方式中，白噪声修正因子模块1002可以根据帧能量参数Ener和能量门限E_thr，将帧分为高能量帧和低能量帧，然后对白噪声修正因子win_lag(0)做不同的调整处理：

if(Ener＜E_thr)

win_lag(0)＝L+β*(Ener+E_thr)；

else

win_lag(0)＝H+α*(Ener+E_thr)；

这里的H，L，α，β是经验值常数，可以根据具体情况得出。

所述反射系数计算模块1003，用于根据第一自相关系数，计算出帧的反射系数；在本例中考虑到计算复杂度的影响，只计算出第一个反射系数，但是本发明并不限于只计算第一个反射系数：

k₁＝r(1)/r(0)。

所述带宽计算模块1004，用于根据所述反射系数计算模块1003计算的反射系数k₁自适应求出要扩展的带宽：

所述lag-window系数模块1005，用于根据所述带宽计算模块1004输出的扩展带宽f₀，计算带宽扩展的lag-window系数：

{win}_{lag} (k) = \exp [- \frac{1}{2} {(\frac{2 π f_{0} k}{f_{s}})}^{2}]

k＝1，...，p

f₀为所述带宽计算模块1004计算得出的扩展带宽，f_s为信号采样频率，例如为8000Hz，p为LP分析的阶数。

所述第二自相关系数计算模块1006，用于根据第一自相关系数r(k)、白噪声修正因子win_lag(0)和lag-window系数win_lag(k)，计算自相关系数修正因子调整后的第二自相关系数：

r(0)′＝win_lag(0)r(0)

r(k)′＝win_lag(k)r(k) k＝1，...，p

通过上述实施例，通过自相关系数计算出反映信号的自身特点的能量参数和反射系数，根据能量参数对白噪声修正因子进行调整，根据反射系数确定扩展带宽，并进一步对lag-window进行调整，使得调整后的自相关系数修正因子根据各个信号的特点确定，从而针对不同的信号计算出不同的LP系数，这样能够使LP系数更加准确的符合信号自身的特征，可以很好地避免一些病态的求解条件，使得求解的系数更加鲁棒，而且复杂度低。

其中，在本发明各实施例中，根据第二自相关系数计算出LP系数，可以采用多种算法实现，例如，Levinson-Durbin算法、协方差法、协格法(格型法)等，上述实施例中为了陈述方便以Levinson-Durbin算法为例进行了描述，在本发明实施例中并不限定实现算法的具体形式。

在本发明的各个实施例中，根据第一自相关系数计算出帧的反射系数时，可以计算多个反射系数k_i，之后，可以使用一个或多个反射系数计算扩展带宽。此时，扩展带宽的计算方式可以相应变化，采用多个反射系数结合多个调节扩展因子，形成新的反射系数和扩展带宽的关系式。本发明的各个实施例中，列举了一种反射系数和扩展带宽的关系式，仅仅是为了举例说明，本领域普通技术人员，根据本发明实施例可以得到各种反射系数和扩展带宽的关系式。本发明实施例中对反射系数和扩展带宽的关系式不作限定，具体可以利用具有代表性的训练数据以最终的编码器性能为标准训练得出各个反射系数对应的调节扩展因子，从而构建各种反射系数和扩展带宽的关系式。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种信号压缩方法，其特征在于该方法包括：

对输入信号加窗；

求加窗后的输入信号的第一自相关系数；

根据所述第一自相关系数调整自相关系数修正因子；

根据所述第一自相关系数和调整后的自相关系数修正因子，计算第二自相关系数；

根据所述第二自相关系数计算出线性预测系数；

根据所述线性预测系数对输入信号进行压缩编码，输出压缩编码数据流。

2.根据权利要求1所述的信号压缩方法，其特征在于，所述根据所述第一自相关系数调整自相关系数修正因子包括：

根据所述第一自相关系数计算出能量参数，根据所述能量参数对白噪声修正因子进行相应的调整；

根据所述第一自相关系数计算出帧的反射系数；根据所述反射系数调整扩展带宽；根据调整的扩展带宽计算滞后窗系数。

3.根据权利要求1所述的信号压缩方法，其特征在于，所述根据所述第一自相关系数调整自相关系数修正因子包括：

根据扩展带宽计算滞后窗系数。

4.根据权利要求2或3所述的信号压缩方法，其特征在于，所述根据所述第一自相关系数计算出能量参数，根据所述能量参数对白噪声修正因子win_lag(0)进行相应的调整包括：

根据所述第一自相关系数的第一个系数r(0)计算出帧能量参数

将帧能量参数Ener大于或者等于一门限值E_thr的白噪声修正因子调整为win_lag(0)＝H+α*(Ener+E_thr)；将帧能量参数小于该门限值的白噪声修正因子调整为win_lag(0)＝L+β*(Ener+E_thr)；其中H，L，α，β是经验值常数。

5.根据权利要求2或3所述的信号压缩方法，其特征在于，所述根据所述第一自相关系数计算出能量参数，根据所述能量参数对白噪声修正因子win_lag(0)进行相应的调整包括：

根据所述第一自相关系数的第一个系数r(0)和帧长计算出帧平均能量Ener_avg＝r(0)/N，其中N为帧长；

将帧平均能量大于或者等于一门限值的白噪声修正因子调整为win_lag(0)＝H+α*Ener_avg；将帧平均能量小于该门限值的白噪声修正因子调整为win_lag(0)＝L+β*Ener_avg；其中H，L，α，β是经验值常数。

6.根据权利要求1所述的信号压缩方法，其特征在于，所述根据所述第一自相关系数调整自相关系数修正因子包括：

根据所述第一自相关系数计算出帧的反射系数，根据所述反射系数调整扩展带宽；根据调整的扩展带宽计算滞后窗系数。

7.根据权利要求2或6所述的信号压缩方法，其特征在于，所述根据所述第一自相关系数计算出帧的反射系数，根据所述反射系数调整扩展带宽包括：

计算出第一反射系数k₁＝r(1)/r(0)，其中r(0)为输入信号的第一自相关系数中的第一个，r(1)为输入信号的第一自相关系数中的第二个；

计算出扩展带宽f₀＝F+αk₁，其中F和α是经验值常数。

8.一种信号压缩方法，其特征在于，该方法包括：

对输入信号加窗；

求加窗后的输入信号的第一自相关系数；

根据所述第一自相关系数的第一个系数计算出能量参数，根据所述能量参数对白噪声修正因子进行相应的调整；

根据扩展带宽计算滞后窗系数；

根据所述第一自相关系数、调整后的白噪声修正因子和滞后窗系数，计算第二自相关系数；

根据所述第二自相关系数计算出线性预测系数；

根据所述线性预测系数对输入信号进行线性预测，计算出残差信号，对所述残差信号进行压缩编码，输出压缩编码数据流。

9.一种信号压缩装置，其特征在于，该装置包括：

加窗单元，用于对输入信号加窗；

第一自相关系数计算单元，用于求所述加窗单元处理后的输入信号的第一自相关系数；

带宽扩展单元，根据所述第一自相关系数计算单元求得的第一自相关系数调整自相关系数修正因子，并根据所述第一自相关系数和调整后的自相关系数修正因子，计算第二自相关系数；

线性预测系数求解单元，用于根据所述带宽扩展单元计算的第二自相关系数计算出线性预测系数；

压缩单元，根据所述线性预测系数求解单元计算的线性预测系数对输入信号进行压缩编码，输出压缩编码数据流。

10.根据权利要求9所述的信号压缩装置，其特征在于，所述带宽扩展单元包括：

能量模块，用于根据所述第一自相关系数计算出能量参数；

白噪声修正因子模块，用于根据所述能量参数对白噪声修正因子进行相应的调整；

反射系数计算模块，用于根据所述第一自相关系数计算出帧的反射系数；

带宽计算模块，用于根据所述反射系数调整扩展带宽；

滞后窗系数模块，用于根据调整的扩展带宽计算滞后窗系数；

第二自相关系数计算模块，用于根据所述第一自相关系数、调整后的白噪声修正因子和所述滞后窗系数计算第二自相关系数。

11.根据权利要求9所述的信号压缩装置，其特征在于，所述带宽扩展单元包括：

能量模块，用于根据所述第一自相关系数计算出能量参数；

滞后窗系数模块，用于根据扩展带宽计算滞后窗系数；

12.根据权利要求9所述的信号压缩装置，其特征在于，所述带宽扩展单元包括：

白噪声修正因子模块，用于确定白噪声修正因子；

带宽计算模块，用于根据所述反射系数调整扩展带宽；

滞后窗系数模块，用于根据所述调整的扩展带宽计算滞后窗系数；

第二自相关系数计算模块，用于根据所述第一自相关系数、白噪声修正因子和所述滞后窗系数计算第二自相关系数。

13.根据权利要求9至12任一项所述的信号压缩装置，其特征在于，还包括预处理单元，用于针对不同的压缩，对输入信号进行相应的预处理，将处理后的信号发送给所述加窗单元，使输入信号更适合后续模块处理。