CN100343895C - 音频编码方法和装置,音频解码方法和装置 - Google Patents

音频编码方法和装置,音频解码方法和装置 Download PDF

Info

Publication number
CN100343895C
CN100343895C CNB038122014A CN03812201A CN100343895C CN 100343895 C CN100343895 C CN 100343895C CN B038122014 A CNB038122014 A CN B038122014A CN 03812201 A CN03812201 A CN 03812201A CN 100343895 C CN100343895 C CN 100343895C
Authority
CN
China
Prior art keywords
fir
centerdot
coefficient group
impulse response
finite impulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB038122014A
Other languages
English (en)
Other versions
CN1656537A (zh
Inventor
A·C·登布林克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1656537A publication Critical patent/CN1656537A/zh
Application granted granted Critical
Publication of CN100343895C publication Critical patent/CN100343895C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Abstract

公开了一种编码音频信号的方法。该方法包括以下步骤:按照一个频率敏感化参数来模型化该音频信号,以提供K阶的无限脉冲响应(IIR)滤波器型特性组并且能够与该敏感化参数线性组合,以提供针对该音频信号的一个估计,该IIR型滤波器模型满足最小相位滤波器的要求。该K阶的特性组被变换为该敏感化参数的一个函数,以提供与满足最小相位滤波器要求的有限脉冲响应(FIR)滤波器型特性兼容的K+1阶的特性组。该K+1阶的特性组被归一化,以提供K阶的特性组。生成编码音频流,以包括归一化的K阶特性组的表示。

Description

音频编码方法和装置,音频解码方法和装置
技术领域
本发明涉及编码和解码音频信号。
背景技术
在音频和语音编码中时常采用线性预测编码(LPC)。图1(a)示出用于常规的基于LPC编码器的K阶有限脉冲响应(FIR)型预测滤波器10组件。该滤波器提供针对从该信号的K个先前取样的线性组合产生的一个给定信号x(n)的估计
Figure C0381220100061
在图1(a)的实例中,相关x(n)和r(n)的滤波器F(z)的传递函数可以表示如下:
F ( z ) = 1 - z - 1 Σ k = 0 K - 1 α k z - k 公式1
根据某些准则通常根据加权均方差来计算预测系数αk
估计 又被从该信号x(n)中减去,以提供残留信号r(n)。这一残留信号和用于预测滤波器的信息即预测系数α通常被发送或以一种更高效的形式被存储。例如,预测系数αk可被映射到一组反射系数,并且这些反射系数又能够被映射在对数区域比(log area ratio)(LAR)上。可替换地,这些预测系数αk可在随着比特流中表示信号x(n)的残留信号一起被编码之前被直接映射到线谱频率(line spectralfrequency)(LSF)。(鉴于量化敏感性,LAR和LSF域最佳。)例如反正弦反射系数(ASRC)和线谱对(Line Spectral Pairs)(LSP)的替换表示法也可以被采用。
在图1(b)的一个解码器中,残留信号和针对该预测滤波器的信息被用于重建(或近似)原始信号x(n)。从图1中显然可见该编码器和解码器结构类似。然而,重要的是要注意,为了确保解码器的稳定性,尤其与可能在对用于信号x(n)的比特流编码之前已经在量化期间引入到该信号的失真相关,该滤波器F(z)通常是一个最小相位滤波器。就是说,传递函数F(z)的全部根(极点与零点)必须是在单位圆(unit circle)之内,并且这一般可用于保证FIR滤波器。
使用上述类型的FIR滤波器不允许编码器考虑听觉处理的心理声学模型而被调谐。
在文章″Alterna tives for Warped Linear Predictors″(V.Voitishchuk等人发表在Proc.ProRISC Workshop CSSP,Veldhoven(NL),2001年11月29-30日)和″Stability of LinearPredictive Structures using IIR filters″(A.C.den Brinker发表在Proc.ProRISC Workshop CSSP,Veldhoven(NL),2001年11月29-30日)中,示出Laguerre和Kautz型滤波器,可被用来把一个编码器/解码器朝着更感兴趣的频率范围的方向调谐,并且通常认为是无限脉冲响应(IIR)型滤波器,其可被表示为图2(a)和2(b)中示出的形式。
用于图2(a)滤波器的涉及x(n)和r(n)的总的传递函数是:
F ( z ) = 1 - z - 1 Σ k = 0 K - 1 α k H k ( z ) 公式2
其中集合Hk是属于一组稳定、因果关系、线性和线性-独立滤波器的传递函数。
已经示出,选择该集合Hk为Laguerre滤波器,即:
H k ( z ) = 1 - λ 2 1 - z - 1 λ { z - 1 - λ 1 - z - 1 λ } k 公式3
其中λ∈(-1,1),总的传递F可以是一个最小相位IIR滤波器。
其中λ是实数并且大于0,模型化被转移到人耳更敏感的低频,而当λ小于0时,模型化转向较高频。其中λ=0对应于图1的传统情况。
但是,在发送图2示出类型的滤波器的预测系数中存在的问题是:仅与预测系数α相关的多项式
Figure C0381220100073
的根可能不提供最小相位滤波器,并且这由于在这些参数的量化期间引入的噪声或失真而可能导致解码器的不稳定。
发明内容
根据本发明,提供编码音频信号的一种方法,该方法包括以下步骤:根据频率敏感化参数,模型化该音频信号,以提供能与所述敏感化参数线性组合的K阶的第一无限脉冲响应滤波器型特性组,从而提供所述音频信号的一个估计;把所述第一特性组或第三特性组变换为所述敏感化参数的函数,以提供与有限脉冲响应滤波器型特性兼容的第二特性组;分别归一化所述第二特性组或所述第一特性组,以提供所述第三特性组;和生成编码音频流,该编码音频流包括K阶的被变换与归一化的特性组的表示。
本发明还提供解码音频流的一种方法,该方法包括以下步骤:读出包含音频信号的表示的编码音频流,以提供与有限脉冲响应滤波器型特性兼容的K阶的第一特性组;把所述K阶的第一特性组与频率敏感化参数相组合,以提供解归一化特性;把所述第一特性组或第三无限脉冲响应滤波器型特性组解归一化为所述解归一化特性的函数,以提供第二特性组;把所述第二特性组或所述第一特性组变换为所述敏感化参数的函数,以提供所述第三特性组;和把该音频信号合成为所述频率敏感化参数和K阶的解归一化与变换的特性组的线性组合。
本发明又提供一种音频编码器,包括:用于按照频率敏感化参数来模型化音频信号的装置,以提供能够与所述敏感化参数线性组合的K阶的第一无限脉冲响应滤波器型特性组,从而提供所述音频信号的一个估计;用于把所述第一特性组或第三特性组变换为所述敏感化参数的函数的装置,以提供与有限脉冲响应滤波器型特性兼容的第二特性组;用于分别归一化所述第二特性组或所述第一特性组以提供所述第三特性组的装置;和用于生成编码音频流的装置,该编码音频流包括K阶的被变换与归一化的特性组的表示。
本发明还提供一种音频播放器,包括:用于读出编码音频流的装置,该编码音频流包含音频信号的表示,以提供与有限脉冲响应滤波器型特性兼容的K阶的第一特性组;用于组合所述K阶的第一特性组与频率敏感化参数的装置,以提供解归一化的特性;用于把所述第一特性组或第三无限脉冲响应滤波器型特性组解归一化为所述解归一化特性的函数的装置,以提供第二特性组;用于分别把所述第二特性组或所述第一特性组变换为所述敏感化参数的函数的装置,以提供所述第三特性组;和用于将该音频信号合成为所述频率敏感化参数和K阶的被解归一化与变换的特性组的线性组合的装置。
本发明又提供一种音频系统,包括本发明的音频编码器和本发明的音频播放器。
本发明的最佳实施例提供常规LPC方案的一个扩展,允许Laguerre型预测系数被映射到FIR系统的系数。因此,传统的线性预测编码技术可用于量化和发送或存储Laguerre预测系数。
附图说明
现将参考附图描述本发明的实施例,其中:
图1(a)和1(b)分别示出用于传统线性预测结构的编码器和解码器;
图2(a)和2(b)分别示出用于替换的线性预测方案的编码器和解码器;
图3(a)和3(b)分别示出根据本发明第一实施例用于线性预测方案的编码器和解码器;
图4示出根据本发明第二实施例的一个编码器;
图5示出完成本发明第一和第二实施例的一个普通编码器;和
图6示出包括音频编码器和音频播放器的系统。
具体实施方式
对于使用图2的方案表示的Laguerre型滤波器来说,总的传递函数F(z)能够表示为公式2和3的一个组合:
F ( z ) = 1 - Σ k = 0 K - 1 α k 1 - λ 2 z - 1 1 - z - 1 λ ( - λ + z - 1 1 - z - 1 λ ) k 公式4
公知的是,如果使用例如由Voitishchuk等人和den Brinker公开的数据输入窗口方法优化这些系数,则传递函数F(z)可以是一个最小相位系统。
在本发明的第一实施例中,上述滤波器被映射在一个K阶的最小相位FIR滤波器上,因此这些Laguerre型预测系数能够通过标准技术被量化和发送。
现参考图3(a),图3(a)示出根据本发明第一实施例的编码器14。编码器14包括由Voitishchuk等人和den Brinker公开类型的一个Laguerre滤波器部件16。部件16被提供有确定滤波器的频率敏感性的一个λ值。此值可以被编码在由编码器产生的一个比特流50中,以便由图3(b)的解码器22随后使用,或否则λ值可以被解码器22得知。
对于信号x(n)来说,该部件提供一组预测系数α。这些值随着λ值一起被提供给一个合成器部件18,其按照图2(a)示出的方式产生信号估计
Figure C0381220100101
但是,在该最佳实施例中,预测系数α在一个变换部件20中被变换。由部件20完成的变换使用上三角托普利兹矩阵(upper TriangularToeplitz matrix)的形式表示如下:
c 0 c 1 c 2 · · · c K - 1 c K = 1 λ 0 · · · 0 0 0 1 λ · · · 0 0 0 0 1 · · · 0 0 · · · · · · · · · · · · · · · 0 0 0 · · · 1 λ 0 0 0 · · · 0 1 1 - α 0 / p - α 1 / p · · · - α K - 2 / p - α K - 1 / p
其中α是Laguerre预测系数,并且 p = 1 - | λ | 2 . K+1系数c能够与第K阶FIR滤波器的传递函数G(v)相关,其中 G ( v ) = Σ k = 0 k c k v - k . 如果预测系数α属于最小相位滤波器f(z),则G(v)表示一个最小相位FIR滤波器。
在图3(b)的解码器22中,由部件24对正向变换部件产生的系数c0...ck执行逆变换。部件24被提供有与编码器14采用的相同的λ,并且由部件24执行的变换使用上三角形托普利兹矩阵的形式表示如下:
1 - α 0 / p - α 1 / p · · · - α K - 2 / p - α K - 1 / p = 1 - λ ( - λ ) 2 · · · ( - λ ) K - 1 ( - λ ) K 0 1 - λ · · · ( - λ ) K - 2 ( - λ ) K - 1 0 0 1 · · · ( - λ ) K - 3 ( - λ ) K - 2 · · · · · · · · · · · · · · · 0 0 0 · · · 1 - λ 0 0 0 · · · 0 1 c 0 c 1 c 2 · · · c K - 1 c K
从这种逆变换中将看出:系数(c0...ck)遵守一个线性约束,即:
1 = Σ k = 0 K c k ( - λ ) k 公式5
由于α0...αk-1能够从c1...ck重建如下,所以参数c0能够被认为是冗余的:
- α 0 / p - α 1 / p · · · - α K - 2 / p - α K - 1 / p = 1 - λ · · · ( - λ ) K - 2 ( - λ ) K - 1 0 1 · · · ( - λ ) K - 3 ( - λ ) K - 2 · · · · · · · · · · · · 0 0 · · · 1 - λ 0 0 · · · 0 1 c 1 c 2 · · · c K - 1 c K
回到编码器14,在该第一实施例中,系数c0...ck被传送到一个归一化部件26。该部件利用c0的值除系数c0...ck,以提供一组系数d0...dk。但是将看到,d0的值总是1,并因此系数d1...dk以传递函数 G ‾ ( v ) = Σ k = 0 K d k v - k 对应于K阶的最小相位FIR滤波器的预测系数,如果系数c0...ck又表示一个最小相位滤波器的话。由于在部件26中实现的归一化仅是利用某一因数来除全部系数,所以变换部件20和归一化部件26的次序可以改变,即能首先归一化以及随后变换。在编码器中,这需要首先利用随后的相应改变计算c0。并且将看到,在随后解释的解码器中能够同样改变反变换和解归一化(de-normalisation)的次序。
归一化部件26把系数di...dk传送到部件28,其中这些系数最好变换成LAR或LSF参数,以对应于图1(a)的系数α的量化的方式被量化,除了索引不同并且符号已被反相之外。部件28还接收残留信号r(n),按照适当的方式量化此残留信号并且把这些值传送到多路复用单元30,其生成表示信号x(n)的比特流50。因此,将看出,此比特流能够以与包含传统的FIR滤波器参数的比特流相同的形式被发送。可替换地,该比特流可以稍加修改,以便在某一点上包含值λ,但是否则其格式无需改变。
现在转到图3(b)的解码器22,该比特流50由解复用单元32解码。提取的参数被提供给一个解量化部件,其以传统的方式产生残留信号r(n)和归一化FIR型滤波器参数d1...dk
首先采用一个解归一化部件36来确定c0的值。从方程式5中可见:
Σ k = 0 K d k ( - λ ) k = Σ k = 0 K c k c 0 ( - λ ) k = 1 c 0 公式6
并因此部件36在被提供有在编码器中使用的值λ时,能够使用以下公式来确定c0的值:
c 0 = ( Σ k = 0 K d k ( - λ ) k ) - 1 公式7
应该指出,对于方程式7来说,虽然解归一化部件仅被提供有参数d1...dk,但是能够假定d0=1。因此,一旦已经确定了c0,则其余系数ci...ck由部件36确定如下:
c k = d k c 0 ′ 公式8
由解归一化部件36把系数c0...ck提供给上述的反变换单元24,并且这提供一组Laguerre滤波器预测系数α,其被图2(b)示出的一个解码器合成器部件18′用于生成估计信号
Figure C0381220100124
该估计信号
Figure C0381220100125
与由解量化器部件34提供的残留信号r(n)组合,以提供最终的解码信号x(n)。
将看出,该最佳实施例的变化是可能的。例如,在图4的本发明第二实施例中,一个自适应编码器14′提供峰值展宽或带宽扩展/扩展/展宽特性,如由Y.Tohkura和F.Itakura和S.Hashimoto公开在文章″Spectral smoothing technique in PARCOR speech analysis-synthesis″中(1978年IEEE Trans.Acoust.Speech Signal Process,卷26,587-596页)。通过利用一个指数-降低序列相乘脉冲响应(预测系数)来实现线性预测编码中的频谱峰值展宽。
与本发明相关,通过在第一实施例的变换部件20和自适应归一化部件26之间插入一个峰值展宽部件38来实现峰值展宽。
在原始Laguerre滤波器类型预测系数α变换到系数c0...ck之后,编码器确定是否需要峰值展宽。如果是的话,则系数c0...ck被传送到峰值展宽部件38。该部件把系数c0...ck与例如如下形式的峰值展宽响应相乘:
c ~ k = c k w k , 其中wk=γk和0<γ≤1        公式9
如前所述,需要将一个线性约束加到系数 因此,如果提供有一个峰值展宽系数组,部件38或26′将如下确定一个乘数cf
c f = Σ k = 0 K c ~ k { - λ ) k 公式10
将这些系数
Figure C0381220100134
除以此乘数, c ‾ k = c ~ k / c f , 因此结果系数c满足方程式5的约束条件。归一化部件26′随后能归一化这些系数 c1... ck,以提供如同以前的归一化型FIR系数di...k
将看出,该峰值展宽影响了将在读出峰值展宽信号的解码器内最终合成的信号,并且因此在峰值展宽已被应用时,应在该编码器14′中计算不同的残留信号r(n)。
因此,在第二实施例中,如图2(b)的解量化器部件34被提供有由部件28生成的量化信号,以便提供与在解码器中产生的完全一样的系数d1...k。这些系数又由同样对应于图2(b)部件的部件36和24分别进行解归一化和反向变换,以产生将在解码器中对于峰值展宽信号生成的一组预测系数 α。该合成器18随后根据是否已经应用了峰值展宽而使用预测系数 α或α,并且从信号x(n)中减去此,以产生残留信号r(n)。
将看出,如果系数
Figure C0381220100141
或 c0... ck被直接提供到反变换部件24,则将不提供如上述那样相同的预测系数 α。但是,这将不需要编码器中的部件34和36,并且这在编码器在计算上受限制的情况下是可接受的。
当这样的峰值展宽的比特流被解码时,得到的预测系数 α是频谱峰值展宽Laguerre预测滤波器的系数,其中峰值展宽已经在频率弯曲域(frequency warped domain)中被执行。这意味着编码器事实上在心理-声学相关比例上执行峰值展宽,并且也允许根据其心理-声学函数选择峰值展宽函数,例如wk
将看出,在第二实施例的变型中,能够利用针对残留信号的生成需要的适当变化把峰值展宽应用于系数d1...k而不是系数c0...k
如上面解释的那样,期望保证在编码器中使用的预测系数将与在解码器中采用的预测系数相同,以便产生原始音频信号的最终估计。图5示出一个更通用形式编码器14″,包含第一和第二实施例的编码器。在这一编码器中,由部件20、26′、28和38/38′分别执行如前所述的变换、归一化、量化和可选峰值展宽。(在图5中,部件38/38′指示峰值展宽可以发生在38之前或在38′归一化之后。)
但是,在通常形式的编码器中,量化信号分别通过解量化、解归一化和反变换部件24、26和24被馈送,如在第二实施例中,以保证由编码器用于生成残留信号的预测系数将与在解码器中采用的完全相同。
将从图5中看到,本发明并不局限于前面两个实施例的通过合成信号
Figure C0381220100142
和从信号x(n)减去这一信号而产生残留信号r(n)。本发明的这一方面可以更一般地认为包括一个编码器18″,其理想地使用将在解码器中采用的预测系数和频率敏感化参数(sensitizing parameter)λ,以产生在信号
Figure C0381220100143
的模型化方面和信号自身x(n)之间的差异的一个指示b。
在解码器(没示出)中,一个对应的部件把这一指示b与预测系数和频率敏感化参数λ相组合,以产生原始音频信号的最终估计。
图6示出根据本发明的包括音频编码器1的一个音频系统,包括图3(a)或图4的编码器14、14′和含有如图3(b)所示的解码器22的一个音频播放器3。编码的音频流50通过通信通道2从音频编码器提供到音频播放器,其中通信通道2可以是无线连接、数据总线或存储媒体。在通信通道2是存储媒体的情况下,该存储媒体可以固定在系统中或也可以是一个可移动盘、例如索尼公司的Memory StickTM(存储棒)的固态存储装置。该通信通道2可以是音频系统的一部分,但常常是在该音频系统的外部。
应该指出,上述示出的实施例并不是限制本发明,并且本领域的技术人员将能在不背离所附的权利要求书的范围的条件下设计许多另外的实施例。在该权利要求书中,括号之间放置的任何参考符号都不应该解释为对该权利要求的限制。词语″包括″并不排除未在权利要求中列出的单元或步骤的存在。本发明能够利用包括若干不同单元的硬件来实现,并且借助于适当编程的计算机来实现。在列举若干装置的设备权利要求中,这些装置的几个能够利用同一个硬件来实现。在相互不同的从属权利要求中叙述的某些措施的基本事实并不表示这些措施的组合不能被有益利用。

Claims (12)

1.编码(14)音频信号(x(n))的一种方法,该方法包括以下步骤:
根据频率敏感化参数(λ),模型化(16)该音频信号,以提供能与所述敏感化参数(λ)线性组合的K阶的Laguerre预测系数组(α0...k-1),从而提供所述音频信号(x(n))的一个估计
Figure C038122010002C1
把所述Laguerre预测系数组(α0...k-1)或有限脉冲响应(FIR)滤波器型的归一化系数组变换(20)为所述敏感化参数(λ)的函数,以提供有限脉冲响应(FIR)型滤波器的传递函数系数组;
分别归一化(26)所述有限脉冲响应(FIR)型滤波器的传递函数系数组(c0...k)或所述Laguerre预测系数组(α0...k-1),以提供有限脉冲响应(FIR)滤波器型的所述归一化系数组;和
生成(28,30)编码的音频比特流(50),该编码的音频比特流包括K阶的被变换与被归一化的系数组(d1...k)的表示(LAR,LSF)。
2.根据权利要求1的方法,其中所述IIR滤波器型滤波器特性满足最小相位滤波器的要求,并且所述FIR滤波器型特性满足最小相位滤波器的要求。
3.根据权利要求1的方法,进一步包括以下步骤:
从所述音频信号(x(n))中减去所述估计
Figure C038122010002C2
以提供残留信号(r(n));和
其中所述生成步骤包括在所述编码的音频比特流(50)中包括所述残留信号(r(n))。
4.根据权利要求1的方法,其中所述模型化步骤(16)包括利用具有如下传递函数的Laguerre型滤波器来模型化所述音频信号(x(n)):
F ( z ) = 1 - Σ k = 0 K - 1 α k 1 - λ 2 z - 1 1 - z - 1 λ ( - λ + z - 1 1 - z - 1 λ ) k
其中αk表示Laguerre预测系数组中的第k个系数,并且λ是频率敏感化参数。
5.根据权利要求4的方法,其中所述变换步骤(20)包括根据下列矩阵变换来变换所述Laguerre滤波器系数(α):
c 0 c 1 c 2 · · · c K - 1 c K = 1 λ 0 · · · 0 0 0 1 λ · · · 0 0 0 0 1 · · · 0 0 · · · · · · · · · · · · · · · 0 0 0 · · · 1 λ 0 0 0 · · · 0 1 1 - α 0 / p - α 1 / p · · · - α K - 2 / p - α K - 1 / p
其中α0...αk-1表示Laguerre预测系数组,c0...ck表示有限脉冲响应(FIR)型滤波器的传递函数系数组,λ是频率敏感化参数,并且根据 p = 1 - | λ | 2 来计算p。
6.根据权利要求5的方法,其中所述归一化步骤(26)包括将K+1阶的有限脉冲响应(FIR)型滤波器的所述传递函数系数组(c0...k)除以有限脉冲响应(FIR)型滤波器的所述传递函数系数组之中的一个系数,并且提供所述被除的系数组的余数作为K阶的有限脉冲响应(FIR)滤波器型的所述归一化系数组(d1...k)。
7.根据权利要求1的方法,其中所述生成步骤(28,30)在所述比特流中包括所述频率敏感化参数(λ)。
8.根据权利要求1的方法,还包括以下步骤:
峰值展宽(38)K+1阶的所述特性组(c0...k)。
9.解码(22)音频比特流(50)的一种方法,该方法包括以下步骤:
读取(32)包含音频信号(x(n))的表示(LAR,LSF)的编码音频比特流(50),以提供K阶的有限脉冲响应(FIR)滤波器型的归一化系数组(d1...k);
把K阶的有限脉冲响应(FIR)滤波器型的所述归一化系数组(d1...k)与频率敏感化参数(λ)相组合(36),以提供解归一化系数(c0);
把有限脉冲响应(FIR)滤波器型的所述归一化系数组(d1...k)或Laguerre预测系数组解归一化为所述解归一化系数的函数,以提供有限脉冲响应(FIR)型滤波器的传递函数系数组;
分别把有限脉冲响应(FIR)型滤波器的所述传递函数系数组(c1...k)或有限脉冲响应(FIR)滤波器型的所述归一化系数组(d1...k)变换(20)为所述敏感化参数(λ)的函数,以提供所述Laguerre预测系数组;和
把该音频信号(x(n))合成(18’)为所述频率敏感化参数(λ)和K阶的被解归一化与被变换的系数组(α0...k-1)的线性组合。
10.一种音频编码器(1),包括:
用于按照频率敏感化参数(λ)来模型化(16)音频信号(x(n))的装置,以提供能够与所述敏感化参数(λ)线性组合的K阶的Laguerre预测系数组(α0...k-1),从而提供所述音频信号(x(n))的一个估计
Figure C038122010004C1
用于把所述Laguerre预测系数组(α0...k-1)或有限脉冲响应(FIR)滤波器型的归一化系数组变换(20)为所述敏感化参数(λ)的函数的装置,以提供有限脉冲响应(FIR)型滤波器的传递函数系数组;
用于分别归一化(26)有限脉冲响应(FIR)型滤波器的所述传递函数系数组(c0...k)或所述Laguerre预测系数组(α0...k-1)以提供有限脉冲响应(FIR)滤波器型的所述归一化系数组的装置;和
用于生成(28,30)编码的音频比特流(50)的装置,该编码的音频比特流包括K阶的被变换与被归一化的系数组(d1...k)的表示(LAR,LSF)。
11.一种音频播放器(3),包括:
用于读取(32)包含音频信号(x(n))的表示(LAR,LSF)的编码的音频比特流(50)的装置,以提供K阶的有限脉冲响应(FIR)滤波器型的归一化系数组(d1...k);
用于将K阶的有限脉冲响应(FIR)滤波器型的所述归一化系数组(d1...k)与频率敏感化参数(λ)组合(36)的装置,以提供解归一化的系数(c0);
用于把有限脉冲响应(FIR)滤波器型的所述归一化系数组(d1...k)或Laguerre预测系数组解归一化为所述解归一化特性的函数的装置,以提供有限脉冲响应(FIR)型滤波器的传递函数系数组;
用于分别把有限脉冲响应(FIR)型滤波器的所述传递函数系数组(c1...k)或有限脉冲响应(FIR)滤波器型的所述归一化系数组(d1...k)变换(20)为所述敏感化参数(λ)的函数的装置,以提供所述Laguerre预测系数组;和
用于将该音频信号(x(n))合成(18’)为所述频率敏感化参数(λ)和K阶的被解归一化与被变换的系数组(α0...k-1)的线性组合的装置。
12.一种音频系统,包括权利要求10的音频编码器(1)和权利要求11的音频播放器。
CNB038122014A 2002-05-30 2003-05-16 音频编码方法和装置,音频解码方法和装置 Expired - Fee Related CN100343895C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02077128.3 2002-05-30
EP02077128 2002-05-30

Publications (2)

Publication Number Publication Date
CN1656537A CN1656537A (zh) 2005-08-17
CN100343895C true CN100343895C (zh) 2007-10-17

Family

ID=29595018

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038122014A Expired - Fee Related CN100343895C (zh) 2002-05-30 2003-05-16 音频编码方法和装置,音频解码方法和装置

Country Status (9)

Country Link
US (1) US20050228656A1 (zh)
EP (1) EP1514262B1 (zh)
JP (1) JP4446883B2 (zh)
KR (1) KR101038446B1 (zh)
CN (1) CN100343895C (zh)
AT (1) ATE336781T1 (zh)
AU (1) AU2003230132A1 (zh)
DE (1) DE60307634T2 (zh)
WO (1) WO2003102922A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080015878A (ko) * 2005-05-25 2008-02-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 복수 채널 신호의 예측 엔코딩
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
TWI538000B (zh) * 2012-05-10 2016-06-11 杜比實驗室特許公司 多階段過濾器,音頻編碼器,音頻解碼器,施行多階段過濾的方法,用以編碼音頻資料的方法,用以將編碼音頻資料解碼的方法,及用以處理編碼位元流的方法和裝置
CN104737463B (zh) * 2012-06-18 2018-03-16 瑞典爱立信有限公司 Mimo接收器中的预滤波
US9548056B2 (en) * 2012-12-19 2017-01-17 Dolby International Ab Signal adaptive FIR/IIR predictors for minimizing entropy
PL3462448T3 (pl) * 2014-01-24 2020-08-10 Nippon Telegraph And Telephone Corporation Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu
CN109188069B (zh) * 2018-08-29 2020-08-28 广东石油化工学院 一种用于负载开关事件检测的脉冲噪声滤除方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1285658A (zh) * 1999-08-23 2001-02-28 索尼株式会社 编码、解码装置及方法,记录、再现装置及方法,记录媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4493048A (en) * 1982-02-26 1985-01-08 Carnegie-Mellon University Systolic array apparatuses for matrix computations
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1285658A (zh) * 1999-08-23 2001-02-28 索尼株式会社 编码、解码装置及方法,记录、再现装置及方法,记录媒体

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Generalized Source-Filter Structures for Speech Synthesis MATTI KARJALAINEN AND TUOMAS PAATERO,EUROSPEECH 2001,Vol.4 2001 *
Realizable warped IIR filters and their properties KARJALAINEN M ET AL,ACOUSTICS,SPEECH,AND SIGNAL PROCESSING 1997 *
SPECTRAL SMOOTHING TECHNIQUE IN PARCORSPEECH ANALYSIS-SYNTHESIS TOHKURA Y ET AL,IEEE TRANSACTIONS ON ACOUSTICS,SPEECH AND SIGNAL PROCESSING,Vol.ASSP.26 No.6 1978 *

Also Published As

Publication number Publication date
KR101038446B1 (ko) 2011-06-01
US20050228656A1 (en) 2005-10-13
KR20050007574A (ko) 2005-01-19
DE60307634T2 (de) 2007-08-09
EP1514262A1 (en) 2005-03-16
DE60307634D1 (de) 2006-09-28
CN1656537A (zh) 2005-08-17
JP2005528646A (ja) 2005-09-22
WO2003102922A1 (en) 2003-12-11
EP1514262B1 (en) 2006-08-16
AU2003230132A1 (en) 2003-12-19
ATE336781T1 (de) 2006-09-15
JP4446883B2 (ja) 2010-04-07

Similar Documents

Publication Publication Date Title
RU2437172C1 (ru) Способ кодирования/декодирования индексов кодовой книги для квантованного спектра мдкп в масштабируемых речевых и аудиокодеках
CN1154086C (zh) Celp转发
US6484140B2 (en) Apparatus and method for encoding a signal as well as apparatus and method for decoding signal
CN102306494B (zh) 对音频信号编码和解码的方法和设备
US9711158B2 (en) Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium
US7921007B2 (en) Scalable audio coding
EP2255358A1 (en) Scalable speech and audio encoding using combinatorial encoding of mdct spectrum
CN1262990C (zh) 利用谐波提取的音频编码方法和设备
EP2867892B1 (en) Linear prediction based audio coding using improved probability distribution estimation
EP1756807B1 (en) Audio encoding
JP2012518194A (ja) 適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置
JP5629319B2 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
WO2014044197A1 (en) Audio classification based on perceptual quality for low or medium bit rates
CN100343895C (zh) 音频编码方法和装置,音频解码方法和装置
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
Chong et al. A new waveform interpolation coding scheme based on pitch synchronous wavelet transform decomposition
US20030149559A1 (en) Audio coding and transcoding using perceptual distortion templates
RU2409874C2 (ru) Сжатие звуковых сигналов
JP4618823B2 (ja) 信号符号化装置及び方法
JPH0990989A (ja) 変換符号化方法および変換復号化方法
CN1159044A (zh) 声音编码装置
CN1708786A (zh) 代码转换机及代码转换方法
Li et al. Speech coding based on pitch synchrony and two-stage transformation
Krishnan et al. An adaptive technique for accuracy enhancement of vector quantizers in nonorthogonal domains

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20071017

Termination date: 20200516