CN101609678B - 信号压缩方法及其压缩装置 - Google Patents
信号压缩方法及其压缩装置 Download PDFInfo
- Publication number
- CN101609678B CN101609678B CN200910149823XA CN200910149823A CN101609678B CN 101609678 B CN101609678 B CN 101609678B CN 200910149823X A CN200910149823X A CN 200910149823XA CN 200910149823 A CN200910149823 A CN 200910149823A CN 101609678 B CN101609678 B CN 101609678B
- Authority
- CN
- China
- Prior art keywords
- coefficient
- autocorrelation
- lag
- calculate
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Abstract
本发明涉及音频压缩领域,为了解决现有技术中音频压缩效率低、重建语音质量差的问题,提供了一种信号压缩方法及其压缩装置,该方法包括对输入信号加窗;求加窗后的输入信号的第一自相关系数;根据所述第一自相关系数和输入信号的特征参数计算白噪声修正因子或Lag-window系数,并根据所述第一自相关系数、白噪声修正因子和Lag-window系数计算出第二自相关系数;根据所述第二自相关系数计算出LP系数;根据所述LP系数计算出压缩编码流。本发明的有益效果在于,避免了一些特殊输入信号的病态求解条件,使得自相关系数更适合后续压缩处理,提高了无损编码器压缩效率和有损编码器的重建语音质量,并且复杂度很低。
Description
技术领域
本发明涉及音频压缩领域,具体是一种信号压缩方法及其压缩装置。
背景技术
为节省语音与音频信号传输和存储的带宽,语音与音频编码技术得到了广泛的应用,目前主要分为有损编码和无损编码。
线性预测(LP:linear prediction)分析在无损压缩编码中被广泛应用,主要是为了降低输入信号的动态范围,去除信号近样点的冗余度,但在无损编码中大多都没有考虑做带宽扩展。
在有损编码G.729中应用了一种对自相关加滞后窗(lag-window)的带宽扩展技术,在用Levinson-Durbin算法求解LP系数时,需要进行一个60Hz的带宽扩展。主要是为了使LP分析更加稳定。以下是现有技术中计算LP系数的步骤:
1.对输入信号加窗,然后计算出自相关系数:r(0),r(1)…r(p),p为LP的阶数。
2.求自相关系数的加权因子winlag:
这里的f0为常数,例如f0=60Hz,fs为信号采样频率8000Hz,p为LP分析的阶数10。
3.确定白噪声修正因子为:winlag(0)=1.0001
4.计算调整后的自相关系数:
r(0)′=winlag(0)r(0)
r(k)′=winlag(k)r (k)k=1,...,p
5.用调整后的自相关系数经过Levinson-Durbin算法求出新的LP系数。
在现有技术中,对所有信号都做同样的处理。
LP分析在无损压缩编码中被广泛应用,主要是为了降低输入信号的动态范围,去除信号近样点的冗余度。
本发明的发明人在实施本发明方案时发现,上述现有技术中至少存在以下问题,由于对所有信号都做同样的处理,这样对于一些特殊的输入信号会产生病态的求解条件,使得自相关矩阵求解不稳定,从而导致无损编码器压缩效率比较低,有损编码器的重建语音质量比较差。
发明内容
本发明提供一种信号压缩方法及其压缩装置,能够根据信号特点对不同信号做不同的处理,避免了一些特殊的输入信号产生病态的求解条件,提高了音频压缩效率和重建语音质量。
本发明实施例提供了一种信号压缩方法,包括:对输入信号加窗;求加窗后的输入信号的第一自相关系数;根据所述第一自相关系数调整自相关系数修正因子;根据所述第一自相关系数和调整后的自相关系数修正因子,计算第二自相关系数;根据所述第二自相关系数计算出线性预测系数;根据所述线性预测系数对输入信号进行压缩编码,输出压缩编码数据流。
本发明实施例还提供一种信号压缩方法,包括:对输入信号加窗;求加窗后的输入信号的第一自相关系数;根据所述第一自相关系数的第一个系数计算出能量参数,根据所述能量参数对白噪声修正因子进行相应的调整;根据扩展带宽计算滞后窗系数;根据所述第一自相关系数、调整后的白噪声修正因子和滞后窗系数,计算第二自相关系数;根据所述第二自相关系数计算出线性预测系数;根据所述线性预测系数对输入信号进行线性预测,计算出残差信号,对所述残差信号进行压缩编码,输出压缩编码数据流。
本发明实施例还提供了一种信号压缩装置,包括:加窗单元,用于对输入信号加窗;第一自相关系数计算单元,用于求所述加窗单元处理后的输入信号的第一自相关系数;带宽扩展单元,根据所述第一自相关系数调整自相关系数修正因子,并根据所述第一自相关系数和调整后的自相关系数修正因子,计算第二自相关系数;线性预测系数求解单元,用于根据所述带宽扩展单元计算的第二自相关系数计算出线性预测系数;压缩单元,根据所述线性预测系数求解单元计算的线性预测系数对输入信号进行压缩编码,输出压缩编码数据流。
本发明实施例提供的技术方案,由于根据第一自相关系数调整自相关系数修正因子,使得调整后的自相关系数修正因子可以表达出输入信号的不同,因此避免了一些特殊输入信号的病态求解条件,使得自相关系数更适合后续压缩处理,提高了无损编码器压缩效率和有损编码器的重建语音质量,并且复杂度很低。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。在附图中:
图1所示为本发明音频压缩带宽扩展方法第一实施例流程图;
图2所示为本发明音频压缩带宽扩展方法第二实施例流程图;
图3所示为本发明音频压缩带宽扩展方法第三实施例流程图;
图4所示为本发明音频压缩带宽扩展方法第四实施例流程图;
图5所示为本发明音频压缩装置的第一实施例结构图;
图6所示为本发明音频压缩装置的第二实施例结构图;
图7所示为本发明音频压缩装置第二实施例的带宽扩展单元的实施例结构示意图;
图8所示为本发明音频压缩装置的第三实施例结构图;
图9所示为本发明音频压缩装置第三实施例的带宽扩展单元的实施例结构示意图;
图10所示为本发明带宽扩展单元的另一个实施例结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施方式和附图,对本发明做进一步详细说明。在此,本发明的示意性实施方式及其说明用于解释本发明,但并不作为对本发明的限定。
本发明实施例提供一种音频压缩带宽扩展方法及其压缩装置。以下结合附图对本发明进行详细说明。
实施例一
如图1所示为本发明音频压缩带宽扩展方法第一实施例流程图,该方法包括以下步骤:
步骤101,对输入信号加窗。
步骤102,计算加窗后的输入信号的第一自相关系数。
步骤103,根据第一自相关系数调整自相关系数修正因子。
步骤104,根据第一自相关系数和调整后的自相关系数修正因子,计算第二自相关系数。
其中,所述自相关系数修正因子包括白噪声修正因子和滞后窗系数,所述滞后窗系数即Lag-window系数;所述调整自相关系数修正因子可以是,调整白噪声修正因子和Lag-window系数,或者仅调整白噪声修正因子,或者仅调整Lag-window系数。
根据第一自相关系数调整自相关系数修正因子可以是:根据所述第一自相关系数确定输入信号的特征参数,根据特征参数调整自相关系数修正因子。其中,特征参数可以选取能量、周期性参数、过零率和反射系数等参数或它们的某种组合,并且可以从原始输入信号或任何一个步骤中的信号中提取。
步骤105,根据所述第二自相关系数计算出LP系数。
步骤106,根据所述LP系数对输入信号进行压缩编码,输出压缩编码数据流。
其中,根据所述LP系数对输入信号进行压缩编码可以是:根据LP系数对原始输入信号进行LP预测,计算出残差信号,再做LTP(Long Term Prediction,长时预测)和熵编码,最后输出残差信号的无损压缩编码码流;或者,将LP系数和原始信号输入到码激励线性预测(CELP,Code Excited LinearPrediction)模型,得到编码码流。
作为本发明的一个实施例,还可以包括预处理步骤,在所述步骤101之前,对输入信号进行预处理。对于有损压缩该预处理可以是高通滤波步骤,用于提高输入信号的高频成份或用于滤除不必要的低频干扰成分,然后将该滤波后的信号进行步骤101加窗处理;对于无损压缩该预处理可以是映射处理,将输入信号从A率或者μ率映射到脉冲编码调制(PCM)域,在PCM域的信号更适合LP短时预测。
通过上述实施例的技术方案,通过自相关系数反映了各个信号的自身特点,根据这种特点对自相关系数修正因子进行调整,使得调整后的自相关系数修正因子根据各个信号的特点确定,从而针对不同的信号计算出不同的LP系数,这样能够使LP系数更加准确的符合信号自身的特征,可以很好地避免一些病态的求解条件,使得求解的系数更加鲁棒,而且复杂度低。
实施例二
如图2所示为本发明音频压缩带宽扩展方法第二实施例流程图,该方法包括以下步骤:
步骤201,对输入信号加窗。可以采用现有技术中有损编码中采用的加窗,首先输入的语音频信号s(n)与窗函数win(n)相乘得到加窗信号s′(n):
s′(n)=win(n)s(n) n=0,...N-1,N为帧长。
步骤202,根据加窗后的输入信号s′(n),求第一自相关系数r(k),例如可以采用下述计算公式得到:
步骤203,根据第一自相关系数求出能量参数。
某些实施方式中,可以根据第一自相关系数的第一个系数r(0)求出帧平均能量:
Ener_avg=r(0)/N,其中N为帧长;
另外一些实施方式中,可以根据第一自相关系数的第一个系数r(0)求出帧能量参数:
步骤204,根据能量参数对白噪声修正因子进行调整。
本发明实施例中,可以设置能量门限Ethr,根据能量参数E与Ethr的关系区分输入信号,针对不同的输入信号采用不同的调整函数对白噪声因子进行相应的调整,具体的可以根据能量参数所处的不同门限值区间采用不同的调整函数对白噪声因子进行相应的调整,
某些实施方式中,可以根据帧平均能量Ener_avg和能量门限Ethr,将帧分为高能量帧和低能量帧,然后对白噪声修正因子winlag(0)做不同的调整处理:
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
能量门限Ethr确定可以通过大量的语音语料找到能够区分清/浊音的一个常值,例如Ethr=1638,约为32dB。这里的H,L,α,β是经验值常数,可以利用具有代表性的训练数据以最终编码器性能为标准训练得出,例如H=1.001,L=1.002,α=β=-6×10-7。
另外一些实施方式中,可以根据帧能量参数Ener和能量门限Ethr,将帧分为高能量帧和低能量帧,然后对白噪声修正因子winlag(0)做不同的调整处理:
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
能量门限Ethr确定可以通过大量的语音语料找到能够区分清/浊音的一个常值,考虑到帧长的影响,可以对不同的帧长设置不同的能量门限,例如 这里的H,L,α,β是经验值常数,可以利用具有代表性的训练数据以最终编码器性能为标准训练得出,例如H=1.0028,L=1.0018,α=β=-2-14。
步骤205,根据扩展带宽f0,计算带宽扩展的lag-window系数winlag(k):
f0为扩展带宽,例如为34Hz,fs为信号的采样频率,例如为8000Hz,p为LP分析的阶数。
步骤206,根据第一自相关系数r(k)、调整后的白噪声修正因子winlag(0)和lag-window系数winlag(k),计算自相关系数修正因子调整后的第二自相关系数r(0)′…r(k)′:
r(0)′=winlag(0)r(0)
r(k)′=winlag(k)r(k) k=1,...,p
步骤207,用调整后的第二自相关系数r(0)′…r(k)′经过Levinson-Durbin算法求出新的LP系数。
步骤208,根据所述LP系数对输入信号进行压缩编码,输出压缩编码数据流。其中,根据所述LP系数对输入信号进行压缩编码可以是:对原始输入信号经过LP预测计算出残差信号,再做LTP和熵编码,最后输出残差信号的无损压缩输出;或者,将LP系数和原始信号输入到码激励线性预测(CELP)模型,最后得到编码码流。
通过本实施例的技术方案,通过自相关系数计算出反映信号的自身特点的能量参数,根据能量参数对白噪声修正因子进行调整,使得调整后的自相关系数修正因子根据各个信号的特点确定,从而针对不同的信号计算出不同的LP系数,这样能够使LP系数更加准确的符合信号自身的特征,可以很好地避免一些病态的求解条件,使得求解的系数更加鲁棒,而且复杂度低。
实施例三
如图3所示为本发明音频压缩带宽扩展方法第三实施例流程图,该方法包括以下步骤:
步骤301,对输入信号加窗。可以采用现有技术中有损编码中采用的加窗,首先输入的语音频信号s(n)与窗函数win(n)相乘得到加窗信号s′(n):
s′(n)=win(n)s(n) n=0,...N-1,N为帧长。
步骤302,根据加窗后的输入信号s′(n),求第一自相关系数r(k),例如可以采用下述计算公式得到:
步骤303,确定白噪声修正因子为:winlag(0)=1.0001。
步骤304,根据第一自相关系数,计算出帧的反射系数;在本例中考虑到计算复杂度的影响,只计算出第一个反射系数,但是本发明并不限于只计算第一个反射系数,反射系数可以通过Levinson-Durbin递归算法求得:
E[0]=r(0)
for i=1 to p
for j=1 to i-1
end
end
通过此递归算法最终得出ki=-k′i=1,...,p,其中,
k1=r(1)/r(0)。
步骤305,根据反射系数k1自适应求出要扩展的带宽f0,调整扩展带宽f0:
f0=F+αk1,其中F可以为一常值,例如为60Hz,α为调节扩展因子,可以利用具有代表性的训练数据以最终的编码器性能为标准训练得出,例如α=10。
步骤306,根据扩展带宽f0,计算带宽扩展的lag-window系数:
其中,f0为步骤305中计算得出的扩展带宽,fs为信号采样频率,例如为8000Hz,p为LP分析的阶数。
步骤307,根据第一自相关系数r(k)、白噪声修正因子winlag(0)和lag-window系数winlag(k),计算自相关系数修正因子调整后的第二自相关系数r(0)′…r(k)′:
r(0)′=winlag(0)r(0)
r(k)′=winlag(k)r(k) k=1,...,p
步骤308,用调整后的第二自相关系数r(0)′…r(k)′经过Levinson-Durbin算法求出新的LP系数。
步骤309,根据所述LP系数对输入信号进行压缩编码,输出压缩编码数据流。其中,根据所述LP系数对输入信号进行压缩编码可以是:将LP系数和原始信号输入到码激励线性预测(CELP)模型,最后得到编码码流;或者,对原始输入信号经过LP预测计算出残差信号,再做LTP和熵编码,最后输出残差信号的无损压缩输出。
通过本实施例的技术方案,通过自相关系数计算出反映信号的自身特点的反射系数,根据反射系数确定扩展带宽,并进一步对lag-window进行调整,使得调整后的自相关系数修正因子根据各个信号的特点确定,从而针对不同的信号计算出不同的LP系数,这样能够使LP系数更加准确的符合信号自身的特征,可以很好地避免一些病态的求解条件,使得求解的系数更加鲁棒,而且复杂度低。
实施例四
如图4所示为本发明音频压缩带宽扩展方法第四实施例流程图,该方法包括以下步骤:
步骤401,对输入信号加窗。可以采用现有技术中有损编码中采用的加窗,首先输入的语音频信号s(n)与窗函数win(n)相乘得到加窗信号s′(n):
s′(n)=win(n)s(n) n=0,...N-1,N为帧长。
步骤402,根据加窗后的输入信号s′(n),求第一自相关系数,例如可以采用下述计算公式得到:
步骤403,根据第一自相关系数求出能量参数。
某些实施方式中,可以根据第一自相关系数的第一个系数r(0)求出帧平均能量:
Ener_avg=r(0)/N,其中N为帧长;
另外一些实施方式中,可以根据第一自相关系数的第一个系数r(0)求出帧能量参数:
步骤404,根据能量参数对白噪声修正因子进行调整。
本发明实施例中,可以设置能量门限Ethr,根据能量参数E与Ethr的关系区分输入信号,针对不同的输入信号采用不同的调整函数对白噪声因子进行相应的调整,具体的可以根据能量参数所处的不同门限值区间采用不同的调整函数对白噪声因子进行相应的调整,
某些实施方式中,可以根据帧平均能量Ener_avg和能量门限Ethr,将帧分为高能量帧和低能量帧,然后对白噪声修正因子winlag(0)做不同的调整处理:
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
这里的Ethr,H,L,α,β是经验值常数,可以根据具体情况得出。
另外一些实施方式中,可以根据帧能量参数Ener和能量门限Ethr,将帧分为高能量帧和低能量帧,然后对白噪声修正因子winlag(0)做不同的调整处理:
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
这里的Ethr,H,L,α,β是经验值常数,可以根据具体情况得出。
步骤405,根据第一自相关系数,计算出帧的反射系数;在本例中考虑到计算复杂度的影响,只计算出第一个反射系数,但是本发明并不限于只计算第一个反射系数:
k1=r(1)/r(0)。
步骤406,根据反射系数k1自适应求出要扩展的带宽f0,调整扩展带宽f0:
f0=F+αk1,其中F可以为一常值,例如为60Hz,α为调节扩展因子,可以利用具有代表性的训练数据以最终的编码器性能为标准训练得出,例如α=10。
步骤407,根据扩展带宽f0,计算带宽扩展的lag-window系数:
其中,f0为步骤405中计算得出的扩展带宽,fs为信号采样频率,例如为8000Hz,p为LP分析的阶数。
步骤408,根据第一自相关系数r(k)、白噪声修正因子winlag(0)和lag-window系数winlag(k),计算自相关系数修正因子调整后的第二自相关系数:
r(0)′=winlag(0)r(0)
r(k)′=winlag(k)r(k) k=1,...,p
步骤409,用调整后的第二自相关系数r(0)′…r(k)′经过Levinson-Durbin算法求出新的LP系数。
步骤410,根据所述LP系数对输入信号进行压缩编码,输出压缩编码数据流。其中,根据所述LP系数对输入信号进行压缩编码可以是:对原始输入信号经过LP预测计算出残差信号,再做LTP和熵编码,最后输出残差信号的无损压缩输出;或者,将LP系数和原始信号输入到码激励线性预测(CELP)模型,最后得到编码码流。
通过本实施例的技术方案,通过自相关系数计算出反映信号的自身特点的能量参数和反射系数,根据能量参数对白噪声修正因子进行调整,根据反射系数确定扩展带宽,并进一步对lag-window进行调整,使得调整后的自相关系数修正因子根据各个信号的特点确定,从而针对不同的信号计算出不同的LP系数,这样能够使LP系数更加准确的符合信号自身的特征,可以很好地避免一些病态的求解条件,使得求解的系数更加鲁棒,而且复杂度低。
实施例五
如图5所示为本发明信号压缩装置的第一实施例结构图,该装置包括:加窗单元501,第一自相关系数计算单元502,带宽扩展单元503,LP系数求解单元504,压缩单元505。
所述加窗单元501,用于对输入信号进行加窗处理。
所述第一自相关系数计算单元502,用于根据所述加窗单元501加窗后的输入信号,计算第一自相关系数。
所述带宽扩展单元503,用于根据所述第一自相关系数计算单元502计算的第一自相关系数调整自相关系数修正因子,并根据该第一自相关系数和调整后的自相关系数修正因子,计算第二自相关系数。
所述LP系数求解单元504,用于根据所述带宽扩展单元503计算的第二自相关系数计算出LP系数。
所述压缩单元505,用于根据所述LP系数求解单元504计算的LP系数对输入信号进行压缩编码,输出压缩编码数据流。
作为本发明的一个实施例,还可以包括预处理单元500,用于针对不同的压缩,对输入信号进行相应的预处理,将处理后的信号发送给所述加窗单元,使输入信号更适合后续模块处理。对于有损压缩该预处理单元可以是高通滤波器,用于提高输入信号的高频成份或用于滤除不必要的低频干扰成分,然后将该滤波后的信号输入到加窗单元501中;对于无损压缩该预处理单元可以是起到映射功能的模块,将输入信号从A率或者μ率映射到脉冲编码调制(PCM)域,在PCM域的信号更适合LP短时预测。
通过上述实施例,通过自相关系数反映了各个信号的自身特点,根据这种特点对自相关系数修正因子进行调整,使得调整后的自相关系数修正因子根据各个信号的特点确定,从而针对不同的信号计算出不同的LP系数,这样能够使LP系数更加准确的符合信号自身的特征,可以很好地避免一些病态的求解条件,使得求解的系数更加鲁棒,而且复杂度低。
实施例六
如图6所示为本发明信号压缩装置的第二实施例结构图,该装置包括:加窗单元601,第一自相关系数计算单元602,带宽扩展单元603,LP系数求解单元604,LP预测单元605,LTP处理单元606,熵编码单元607。
所述加窗单元601,用于对输入信号加窗,可以采用现有技术中有损编码中采用的加窗单元,首先输入的语音频信号s(n)与窗函数win(n)相乘得到加窗信号s′(n):
s′(n)=win(n)s(n) n=0,...N-1,N为帧长。
所述第一自相关系数计算单元602,用于根据所述加窗单元601加窗后的输入信号,计算第一自相关系数,例如可以采用下述计算公式得到:
所述带宽扩展单元603,如图7所示,可以包括能量模块701,白噪声修正因子模块702,lag-window系数模块703,第二自相关系数计算模块704。
所述能量模块701,用于根据第一自相关系数求出能量参数。
某些实施方式中,能量模块701可以根据第一自相关系数的第一个系数r(0)求出帧平均能量:
Ener_avg=r(0)/N,其中N为帧长;
另外一些实施方式中,能量模块701可以根据第一自相关系数的第一个系数r(0)求出帧能量参数Ener:
所述白噪声修正因子模块702,用于根据能量模块701求出的能量参数对白噪声修正因子进行调整。
本发明实施例中,可以设置能量门限Ethr,根据能量参数E与Ethr的关系区分输入信号,针对不同的输入信号采用不同的调整函数对白噪声因子进行相应的调整,具体的可以根据能量参数所处的不同门限值区间采用不同的调整函数对白噪声因子进行相应的调整,
某些实施方式中,白噪声修正因子模块702可以根据帧平均能量Ener_avg和能量门限Ethr,将帧分为高能量帧和低能量帧,然后对白噪声修正因子winlag(0)做不同的调整处理:
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
这里的Ethr,H,L,α,β是经验值常数,可以根据具体情况得出。
另外一些实施方式中,白噪声修正因子模块702可以根据帧能量参数Ener和能量门限Ethr,将帧分为高能量帧和低能量帧,然后对白噪声修正因子winlag(0)做不同的调整处理:
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
这里的H,L,α,β是经验值常数,可以根据具体情况得出。
所述lag-window系数模块703,用于根据扩展带宽f0,计算带宽扩展的lag-window系数winlag(k):
f0为扩展带宽,例如为34Hz,fs为信号采样频率,例如为8000Hz,p为LP分析的阶数。
所述第二自相关系数计算模块704,用于根据第一自相关系数r(k)、调整后的白噪声修正因子winlag(0)和lag-window系数winlag(k),计算自相关系数修正因子调整后的第二自相关系数:
r(0)′=winlag(0)r(0)
r(k)′=winlag(k)r(k) k=1,...,p
所述LP系数求解单元604,用于根据所述带宽扩展单元603调整后的第二自相关系数r(0)′…r(k)′经过Levinson-Durbin算法求出新的LP系数。
所述LP预测单元605,用于根据所述LP系数求解单元604计算的LP系数对原始输入信号进行LP预测,计算出残差信号;
所述LTP处理单元606,用于对所述LP预测单元605输出的残差信号做LTP;
所述熵编码单元607,用于对所述LTP处理单元606输出的长时预测后的信号进行熵编码,输出残差信号的无损压缩编码码流。
所述LP预测单元605、LTP处理单元606和熵编码单元607分别可以采用现有技术中的功能单元实现。
通过本实施例的技术方案,通过自相关系数计算出反映信号的自身特点的能量参数,根据能量参数对白噪声修正因子进行调整,使得调整后的自相关系数修正因子根据各个信号的特点确定,从而针对不同的信号计算出不同的LP系数,这样能够使LP系数更加准确的符合信号自身的特征,可以很好地避免一些病态的求解条件,使得求解的系数更加鲁棒,而且复杂度低。
实施例七
如图8所示为本发明音频压缩装置的第三实施例结构图,该装置包括:加窗单元801,第一自相关系数计算单元802,带宽扩展单元803,LP系数求解单元804,CELP编码单元805。
所述加窗单元801,用于对输入信号加窗,可以采用现有技术中有损编码中采用的加窗单元,首先输入的语音频信号s(n)与窗函数win(n)相乘得到加窗信号s′(n):
s′(n)=win(n)s(n) n=0,...N-1,N为帧长。
所述第一自相关系数计算单元802,用于根据所述加窗单元601加窗后的输入信号,计算第一自相关系数,例如可以采用下述计算公式得到:
所述带宽扩展单元803,如图9所示,可以包括白噪声修正因子模块901,反射系数计算模块902,带宽计算模块903,lag-window系数模块904,第二自相关系数计算模块905。
所述白噪声修正因子模块901,用于确定白噪声修正因子winlag(0)=1.0001。
所述反射系数计算模块902,用于根据第一自相关系数,计算出帧的反射系数;在本例中考虑到计算复杂度的影响,只计算出第一个反射系数,但是本发明并不限于只计算第一个反射系数:
k1=r(1)/r(0)。
所述带宽计算模块903,用于根据所述反射系数计算模块902计算的反射系数k1自适应求出要扩展的带宽:
f0=F+αk1,其中F可以为60Hz,α为经验因子,可以根据实验来确定。
所述lag-window系数模块904,用于根据所述带宽计算模块903输出的扩展带宽f0,计算带宽扩展的lag-window系数:
f0为所述带宽计算模块903计算得出的扩展带宽,fs为信号采样频率,例如为8000Hz,p为LP分析的阶数。
所述第二自相关系数计算模块905,用于根据第一自相关系数r(k)、白噪声修正因子winlag(0)和lag-window系数winlag(k),计算自相关系数修正因子调整后的第二自相关系数:
r(0)′=winlag(0)r(0)
r(k)′=winlag(k)r(k) k=1,...,p
所述LP系数求解单元804,用于根据所述带宽扩展单元803调整后的第二自相关系数r(0)′…r(k)′,采用Levinson-Durbin算法求出新的LP系数。
所述CELP编码单元805,用于将所述LP系数求解单元804求得的LP系数和原始输入信号,输入到码激励线性预测(CELP)模型,得到编码码流。
另外,作为本发明带宽扩展单元的另一个实施例,如图10所示,包括能量模块1001,白噪声修正因子模块1002,反射系数计算模块1003,带宽计算模块1004,lag-window系数模块1005,第二自相关系数计算模块1006。图10所示的带宽扩展单元,可以是实施例六中带宽扩展单元603和实施例七中带宽扩展单元803的替代方案;带宽扩展单元603也可以用于实施例七中替代带宽扩展单元803,带宽扩展单元803也可以用于实施例六中替代带宽扩展单元603。
所述能量模块1001,用于根据第一自相关系数求出能量参数。
某些实施方式中,能量模块1001可以根据第一自相关系数的第一个系数r(0)求出帧平均能量:
Ener_avg=r(0)/N,其中N为帧长;
另外一些实施方式中,能量模块1001可以根据第一自相关系数的第一个系数r(0)求出帧能量参数Ener:
所述白噪声修正因子模块1002,用于根据能量模块1001求出的能量参数对白噪声修正因子进行调整。
本发明实施例中,可以设置能量门限Ethr,根据能量参数E与Ethr的关系区分输入信号,针对不同的输入信号采用不同的调整函数对白噪声因子进行相应的调整,具体的可以根据能量参数所处的不同门限值区间采用不同的调整函数对白噪声因子进行相应的调整,
某些实施方式中,白噪声修正因子模块1002可以根据帧平均能量Ener_avg和能量门限Ethr,将帧分为高能量帧和低能量帧,然后对白噪声修正因子winlag(0)做不同的调整处理:
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
这里的Ethr,H,L,α,β是经验值常数,可以根据具体情况得出。
另外一些实施方式中,白噪声修正因子模块1002可以根据帧能量参数Ener和能量门限Ethr,将帧分为高能量帧和低能量帧,然后对白噪声修正因子winlag(0)做不同的调整处理:
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
这里的H,L,α,β是经验值常数,可以根据具体情况得出。
所述反射系数计算模块1003,用于根据第一自相关系数,计算出帧的反射系数;在本例中考虑到计算复杂度的影响,只计算出第一个反射系数,但是本发明并不限于只计算第一个反射系数:
k1=r(1)/r(0)。
所述带宽计算模块1004,用于根据所述反射系数计算模块1003计算的反射系数k1自适应求出要扩展的带宽:
f0=F+αk1,其中F可以为60Hz,α为经验因子,可以根据实验来确定。
所述lag-window系数模块1005,用于根据所述带宽计算模块1004输出的扩展带宽f0,计算带宽扩展的lag-window系数:
f0为所述带宽计算模块1004计算得出的扩展带宽,fs为信号采样频率,例如为8000Hz,p为LP分析的阶数。
所述第二自相关系数计算模块1006,用于根据第一自相关系数r(k)、白噪声修正因子winlag(0)和lag-window系数winlag(k),计算自相关系数修正因子调整后的第二自相关系数:
r(0)′=winlag(0)r(0)
r(k)′=winlag(k)r(k) k=1,...,p
通过上述实施例,通过自相关系数计算出反映信号的自身特点的能量参数和反射系数,根据能量参数对白噪声修正因子进行调整,根据反射系数确定扩展带宽,并进一步对lag-window进行调整,使得调整后的自相关系数修正因子根据各个信号的特点确定,从而针对不同的信号计算出不同的LP系数,这样能够使LP系数更加准确的符合信号自身的特征,可以很好地避免一些病态的求解条件,使得求解的系数更加鲁棒,而且复杂度低。
其中,在本发明各实施例中,根据第二自相关系数计算出LP系数,可以采用多种算法实现,例如,Levinson-Durbin算法、协方差法、协格法(格型法)等,上述实施例中为了陈述方便以Levinson-Durbin算法为例进行了描述,在本发明实施例中并不限定实现算法的具体形式。
在本发明的各个实施例中,根据第一自相关系数计算出帧的反射系数时,可以计算多个反射系数ki,之后,可以使用一个或多个反射系数计算扩展带宽。此时,扩展带宽的计算方式可以相应变化,采用多个反射系数结合多个调节扩展因子,形成新的反射系数和扩展带宽的关系式。本发明的各个实施例中,列举了一种反射系数和扩展带宽的关系式,仅仅是为了举例说明,本领域普通技术人员,根据本发明实施例可以得到各种反射系数和扩展带宽的关系式。本发明实施例中对反射系数和扩展带宽的关系式不作限定,具体可以利用具有代表性的训练数据以最终的编码器性能为标准训练得出各个反射系数对应的调节扩展因子,从而构建各种反射系数和扩展带宽的关系式。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (13)
1.一种信号压缩方法,其特征在于该方法包括:
对输入信号加窗;
求加窗后的输入信号的第一自相关系数;
根据所述第一自相关系数调整自相关系数修正因子;
根据所述第一自相关系数和调整后的自相关系数修正因子,计算第二自相关系数;
根据所述第二自相关系数计算出线性预测系数;
根据所述线性预测系数对输入信号进行压缩编码,输出压缩编码数据流。
2.根据权利要求1所述的信号压缩方法,其特征在于,所述根据所述第一自相关系数调整自相关系数修正因子包括:
根据所述第一自相关系数计算出能量参数,根据所述能量参数对白噪声修正因子进行相应的调整;
根据所述第一自相关系数计算出帧的反射系数;根据所述反射系数调整扩展带宽;根据调整的扩展带宽计算滞后窗系数。
3.根据权利要求1所述的信号压缩方法,其特征在于,所述根据所述第一自相关系数调整自相关系数修正因子包括:
根据所述第一自相关系数计算出能量参数,根据所述能量参数对白噪声修正因子进行相应的调整;
根据扩展带宽计算滞后窗系数。
5.根据权利要求2或3所述的信号压缩方法,其特征在于,所述根据所述第一自相关系数计算出能量参数,根据所述能量参数对白噪声修正因子winlag(0)进行相应的调整包括:
根据所述第一自相关系数的第一个系数r(0)和帧长计算出帧平均能量Ener_avg=r(0)/N,其中N为帧长;
将帧平均能量大于或者等于一门限值的白噪声修正因子调整为winlag(0)=H+α*Ener_avg;将帧平均能量小于该门限值的白噪声修正因子调整为winlag(0)=L+β*Ener_avg;其中H,L,α,β是经验值常数。
6.根据权利要求1所述的信号压缩方法,其特征在于,所述根据所述第一自相关系数调整自相关系数修正因子包括:
根据所述第一自相关系数计算出帧的反射系数,根据所述反射系数调整扩展带宽;根据调整的扩展带宽计算滞后窗系数。
7.根据权利要求2或6所述的信号压缩方法,其特征在于,所述根据所述第一自相关系数计算出帧的反射系数,根据所述反射系数调整扩展带宽包括:
计算出第一反射系数k1=r(1)/r(0),其中r(0)为输入信号的第一自相关系数中的第一个,r(1)为输入信号的第一自相关系数中的第二个;
计算出扩展带宽f0=F+αk1,其中F和α是经验值常数。
8.一种信号压缩方法,其特征在于,该方法包括:
对输入信号加窗;
求加窗后的输入信号的第一自相关系数;
根据所述第一自相关系数的第一个系数计算出能量参数,根据所述能量参数对白噪声修正因子进行相应的调整;
根据扩展带宽计算滞后窗系数;
根据所述第一自相关系数、调整后的白噪声修正因子和滞后窗系数,计算第二自相关系数;
根据所述第二自相关系数计算出线性预测系数;
根据所述线性预测系数对输入信号进行线性预测,计算出残差信号,对所述残差信号进行压缩编码,输出压缩编码数据流。
9.一种信号压缩装置,其特征在于,该装置包括:
加窗单元,用于对输入信号加窗;
第一自相关系数计算单元,用于求所述加窗单元处理后的输入信号的第一自相关系数;
带宽扩展单元,根据所述第一自相关系数计算单元求得的第一自相关系数调整自相关系数修正因子,并根据所述第一自相关系数和调整后的自相关系数修正因子,计算第二自相关系数;
线性预测系数求解单元,用于根据所述带宽扩展单元计算的第二自相关系数计算出线性预测系数;
压缩单元,根据所述线性预测系数求解单元计算的线性预测系数对输入信号进行压缩编码,输出压缩编码数据流。
10.根据权利要求9所述的信号压缩装置,其特征在于,所述带宽扩展单元包括:
能量模块,用于根据所述第一自相关系数计算出能量参数;
白噪声修正因子模块,用于根据所述能量参数对白噪声修正因子进行相应的调整;
反射系数计算模块,用于根据所述第一自相关系数计算出帧的反射系数;
带宽计算模块,用于根据所述反射系数调整扩展带宽;
滞后窗系数模块,用于根据调整的扩展带宽计算滞后窗系数;
第二自相关系数计算模块,用于根据所述第一自相关系数、调整后的白噪声修正因子和所述滞后窗系数计算第二自相关系数。
11.根据权利要求9所述的信号压缩装置,其特征在于,所述带宽扩展单元包括:
能量模块,用于根据所述第一自相关系数计算出能量参数;
白噪声修正因子模块,用于根据所述能量参数对白噪声修正因子进行相应的调整;
滞后窗系数模块,用于根据扩展带宽计算滞后窗系数;
第二自相关系数计算模块,用于根据所述第一自相关系数、调整后的白噪声修正因子和所述滞后窗系数计算第二自相关系数。
12.根据权利要求9所述的信号压缩装置,其特征在于,所述带宽扩展单元包括:
白噪声修正因子模块,用于确定白噪声修正因子;
反射系数计算模块,用于根据所述第一自相关系数计算出帧的反射系数;
带宽计算模块,用于根据所述反射系数调整扩展带宽;
滞后窗系数模块,用于根据所述调整的扩展带宽计算滞后窗系数;
第二自相关系数计算模块,用于根据所述第一自相关系数、白噪声修正因子和所述滞后窗系数计算第二自相关系数。
13.根据权利要求9至12任一项所述的信号压缩装置,其特征在于,还包括预处理单元,用于针对不同的压缩,对输入信号进行相应的预处理,将处理后的信号发送给所述加窗单元,使输入信号更适合后续模块处理。
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910149823XA CN101609678B (zh) | 2008-12-30 | 2009-06-25 | 信号压缩方法及其压缩装置 |
JP2009290579A JP5275212B2 (ja) | 2008-12-30 | 2009-12-22 | 信号圧縮方法及び装置 |
EP09180886A EP2204797B1 (en) | 2008-12-30 | 2009-12-29 | Signal compression method and apparatus |
KR1020090132915A KR101095425B1 (ko) | 2008-12-30 | 2009-12-29 | 신호 압축 방법 및 장치 |
AT09180886T ATE537537T1 (de) | 2008-12-30 | 2009-12-29 | Signalkomprimierungsverfahren und -vorrichtung |
US12/648,994 US8396716B2 (en) | 2008-12-30 | 2009-12-29 | Signal compression method and apparatus |
US13/728,256 US8560329B2 (en) | 2008-12-30 | 2012-12-27 | Signal compression method and apparatus |
JP2013051028A JP2013109381A (ja) | 2008-12-30 | 2013-03-13 | 信号圧縮方法及び装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810247024.1 | 2008-12-30 | ||
CN200810247024 | 2008-12-30 | ||
CN200910149823XA CN101609678B (zh) | 2008-12-30 | 2009-06-25 | 信号压缩方法及其压缩装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101609678A CN101609678A (zh) | 2009-12-23 |
CN101609678B true CN101609678B (zh) | 2011-07-27 |
Family
ID=41483403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910149823XA Active CN101609678B (zh) | 2008-12-30 | 2009-06-25 | 信号压缩方法及其压缩装置 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8396716B2 (zh) |
EP (1) | EP2204797B1 (zh) |
JP (2) | JP5275212B2 (zh) |
KR (1) | KR101095425B1 (zh) |
CN (1) | CN101609678B (zh) |
AT (1) | ATE537537T1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8396716B2 (en) | 2008-12-30 | 2013-03-12 | Huawei Technologies Co., Ltd. | Signal compression method and apparatus |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2363767T3 (es) * | 2002-12-20 | 2011-08-16 | SMITH & NEPHEW, INC. | Prótesis de rodilla de alto rendimiento. |
CN101945431B (zh) * | 2010-08-30 | 2014-08-13 | 京信通信系统(中国)有限公司 | 有损数据压缩方法及基于有损数据压缩的数字通信系统 |
WO2012095924A1 (ja) * | 2011-01-14 | 2012-07-19 | パナソニック株式会社 | 符号化装置、通信処理装置および符号化方法 |
CN104025191A (zh) * | 2011-10-18 | 2014-09-03 | 爱立信(中国)通信有限公司 | 用于自适应多速率编解码器的改进方法和设备 |
CN109979471B (zh) * | 2013-07-18 | 2022-12-02 | 日本电信电话株式会社 | 线性预测分析装置、线性预测分析方法以及记录介质 |
KR101832368B1 (ko) * | 2014-01-24 | 2018-02-26 | 니폰 덴신 덴와 가부시끼가이샤 | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 |
ES2770407T3 (es) | 2014-01-24 | 2020-07-01 | Nippon Telegraph & Telephone | Aparato, método, programa y soporte de registro de análisis predictivo lineal |
KR101864122B1 (ko) | 2014-02-20 | 2018-06-05 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
KR102318763B1 (ko) | 2014-08-28 | 2021-10-28 | 삼성전자주식회사 | 기능 제어 방법 및 이를 지원하는 전자 장치 |
US10310910B1 (en) * | 2014-12-09 | 2019-06-04 | Cloud & Stream Gears Llc | Iterative autocorrelation calculation for big data using components |
US9773318B2 (en) * | 2015-10-02 | 2017-09-26 | Varian Medical Systems, Inc. | Systems and methods for detecting camera defect caused by exposure to radiation |
CN110265043B (zh) * | 2019-06-03 | 2021-06-01 | 同响科技股份有限公司 | 自适应有损或无损的音频压缩和解压缩演算方法 |
CN110380826B (zh) * | 2019-08-21 | 2021-09-28 | 苏州大学 | 移动通信信号自适应混合压缩方法 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6142698A (ja) * | 1984-08-03 | 1986-03-01 | 日本電気株式会社 | 音声分析方式 |
JPS6211900A (ja) * | 1985-07-10 | 1987-01-20 | シャープ株式会社 | 音声分析合成に於ける音源ゲイン設定方式 |
JPS63281200A (ja) * | 1987-05-14 | 1988-11-17 | 沖電気工業株式会社 | 音声区間検出方式 |
JPH01123300A (ja) * | 1987-11-06 | 1989-05-16 | Mitsubishi Electric Corp | 音声符号化装置 |
DE4331358A1 (de) | 1992-10-12 | 1994-04-14 | Braun Melsungen Ag | Verfahren zur quantitativen selektiven Entfernung oder präparativen Gewinnung von Tumor-Nekrose-Faktor (TNF) oder/und Lipopolysacchariden (LPS) aus wäßrigen Flüssigkeiten |
JPH06142698A (ja) | 1992-11-04 | 1994-05-24 | Chiyoda Corp | 塩分を含んだヘドロの早期土壌化方法 |
IN184794B (zh) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
US5574825A (en) * | 1994-03-14 | 1996-11-12 | Lucent Technologies Inc. | Linear prediction coefficient generation during frame erasure or packet loss |
US6240386B1 (en) | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
JP2000221998A (ja) * | 1999-01-28 | 2000-08-11 | Matsushita Electric Ind Co Ltd | 音声符号化方法及び音声符号化装置 |
JP3552201B2 (ja) * | 1999-06-30 | 2004-08-11 | 株式会社東芝 | 音声符号化方法および装置 |
JP3859462B2 (ja) * | 2001-05-18 | 2006-12-20 | 株式会社東芝 | 予測パラメータ分析装置および予測パラメータ分析方法 |
US7742926B2 (en) | 2003-04-18 | 2010-06-22 | Realnetworks, Inc. | Digital audio signal compression method and apparatus |
JP2005010337A (ja) * | 2003-06-18 | 2005-01-13 | Sony Corp | 音声信号圧縮方法及び音声信号圧縮装置 |
US7930184B2 (en) | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
CN101023472B (zh) * | 2004-09-06 | 2010-06-23 | 松下电器产业株式会社 | 可扩展编码装置和可扩展编码方法 |
US7991622B2 (en) | 2007-03-20 | 2011-08-02 | Microsoft Corporation | Audio compression and decompression using integer-reversible modulated lapped transforms |
CN101609678B (zh) | 2008-12-30 | 2011-07-27 | 华为技术有限公司 | 信号压缩方法及其压缩装置 |
-
2009
- 2009-06-25 CN CN200910149823XA patent/CN101609678B/zh active Active
- 2009-12-22 JP JP2009290579A patent/JP5275212B2/ja active Active
- 2009-12-29 US US12/648,994 patent/US8396716B2/en active Active
- 2009-12-29 KR KR1020090132915A patent/KR101095425B1/ko active IP Right Grant
- 2009-12-29 AT AT09180886T patent/ATE537537T1/de active
- 2009-12-29 EP EP09180886A patent/EP2204797B1/en active Active
-
2012
- 2012-12-27 US US13/728,256 patent/US8560329B2/en active Active
-
2013
- 2013-03-13 JP JP2013051028A patent/JP2013109381A/ja active Pending
Non-Patent Citations (7)
Title |
---|
Benjamin J. Shannon et al.Speech Enhancement Based on Spectral Estimation from Higher-lag Autocorrelation.《INTERSPEECH 2006 - ICSLP》.2006,1427-1430. |
Benjamin J. Shannon et al.Speech Enhancement Based on Spectral Estimation from Higher-lag Autocorrelation.《INTERSPEECH 2006- ICSLP》.2006,1427-1430. * |
ckströ |
m et al.Effect of White-Noise Correction on Linear Predictive Coding.《IEEE SIGNAL PROCESSING LETTERS》.2007,第14卷(第2期),148-151. |
Stephen So et al.A comparative study of LPC parameter representations and quantisation schemes for wideband speech coding.《ELSEVIER Digital Signal Processing》.2007,117-137. * |
Tom Bä |
Tom Bäckström et al.Effect of White-Noise Correction on Linear Predictive Coding.《IEEE SIGNAL PROCESSING LETTERS》.2007,第14卷(第2期),148-151. * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8396716B2 (en) | 2008-12-30 | 2013-03-12 | Huawei Technologies Co., Ltd. | Signal compression method and apparatus |
US8560329B2 (en) | 2008-12-30 | 2013-10-15 | Huawei Technologies Co., Ltd. | Signal compression method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
CN101609678A (zh) | 2009-12-23 |
US8396716B2 (en) | 2013-03-12 |
US20130117030A1 (en) | 2013-05-09 |
EP2204797B1 (en) | 2011-12-14 |
EP2204797A1 (en) | 2010-07-07 |
US8560329B2 (en) | 2013-10-15 |
ATE537537T1 (de) | 2011-12-15 |
KR101095425B1 (ko) | 2011-12-16 |
US20100169086A1 (en) | 2010-07-01 |
KR20100080435A (ko) | 2010-07-08 |
JP5275212B2 (ja) | 2013-08-28 |
JP2013109381A (ja) | 2013-06-06 |
JP2010170124A (ja) | 2010-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101609678B (zh) | 信号压缩方法及其压缩装置 | |
CN101140759B (zh) | 语音或音频信号的带宽扩展方法及系统 | |
CN101335000B (zh) | 编码的方法及装置 | |
US9009036B2 (en) | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding | |
CN102779523B (zh) | 语音编码装置及编码方法、语音解码装置及解码方法 | |
CN102436820B (zh) | 高频带信号编码方法及装置、高频带信号解码方法及装置 | |
KR101792712B1 (ko) | 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조 | |
CN101770775A (zh) | 信号处理方法及装置 | |
CN101359978A (zh) | 一种控制变速率多模式宽带编码速率的方法 | |
US11443751B2 (en) | Phase reconstruction in a speech decoder | |
CN101281748B (zh) | 用编码索引实现的空缺子带填充方法及编码索引生成方法 | |
US10847172B2 (en) | Phase quantization in a speech encoder | |
CN101320565A (zh) | 感知加权滤波方法及感知加权滤波器 | |
Madane et al. | Speech compression using Linear predictive coding | |
CN101651752B (zh) | 解码的方法及装置 | |
CN100498933C (zh) | 代码转换机及代码转换方法 | |
CN103337243B (zh) | 一种amr码流转换成amr-wb码流的方法 | |
CN101587711A (zh) | 基音后处理方法、滤波器以及基音后处理系统 | |
CN101499281B (zh) | 一种语音编码中的增益量化方法及装置 | |
CN103035249A (zh) | 一种基于时频平面上下文的音频算术编码 方法 | |
Wiriyanuruknakorn et al. | A Finite State Vector Quantizer for New Bit Rate Speech Compression | |
Bachu et al. | A Comparison of LBG and ADPCM Speech Compression Techniques | |
Dutta et al. | Speech compression with masked modulated lapped transform and SPIHT algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |