JP4649208B2

JP4649208B2 - オーディオコーディング

Info

Publication number: JP4649208B2
Application number: JP2004521016A
Authority: JP
Inventors: ヘーペースハイエルス，エリク; イェーレインベルフ，アドリアーン; トパロヴィッチ，ナタサ
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2002-07-16
Filing date: 2003-07-11
Publication date: 2011-03-09
Anticipated expiration: 2023-07-11
Also published as: RU2005104122A; BR0305556A; US7516066B2; AU2003247040A1; CN1669075A; EP1527441B1; WO2004008437A2; EP1527441A2; JP2005533272A; CN100370517C; WO2004008437A3; RU2321901C2; KR20050023426A; KR101001170B1; US20050261896A1

Description

本発明は、オーディオ信号の少なくとも一部の符号化に関する。

オーディオコーディングの技術分野において、線形予測符号化（LPC）は、スペクトルコンテントを表すものとして周知である。また、線形予測符号化については、効率的な量子化方法が多数提案されている。例えば、ログエリア比（非特許文献１参照）、反射係数（非特許文献２参照）があり、また、ラインスペクトルペアまたはラインスペクトル周波数（非特許文献３、４、５参照）等のラインスペクトル表示がある。

フィルター係数をどのようにラインスペクトル表示に変換するかについては、ここでは詳説しない（非特許文献６、７、８、９、１０参照）が、結果だけを記せば、M次の全極（all-pole）LPCフィルターH(z)をM個の周波数に変換する。この周波数はラインスペクトル周波数（LSF）と呼ぶことが多い。この周波数により、フィルターH(z)がユニークに表される。図１に例が示してある。ここで、説明を明瞭にするため、図１においては、ラインスペクトル周波数をフィルターの振幅応答に向かう線として描いたことに注意されたい。ラインスペクトル周波数は周波数であって、振幅についての情報は何も含んでいない。
R. ViswanathanおよびJ. Makhoul、「線形予測システムにおける送信パラメータの量子化特性Quantization properties of transmission parameters in linear predictive system」、IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-23, pp. 309-321, 1975年6月 A.H. Gray, Jr.およびJ.D. Markel、「スピーチ処理における量子化およびビットアロケーションQuantization and bit allocation in speech processing」、IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-24, pp. 459-473、1976年12月 F.K. SoongおよびB.H. Juang、「ラインスペクトルペア（LSP）およびスピーチデータ圧縮Line spectrum Pair (LSP) and Speech Data Compression」、Proc. ICASSP-84, Vol. 1, pp. 1.10.1-4、1984年 K.K. Paliwal、「24ビット／フレームにおけるLPCパラメータの効率的ベクトル量子化Efficient Venctor Quantization of LPC Parameters at 24 Bits/Frame」、IEEE Trans. On Speech and Audio Processing, Vol. 1, pp. 3-14、1993年1月 F.K. SoongおよびB.H. Juang、「LSPパラメータの最適量子化Optimal Quantization of LSPParameters」、IEEE Trans. On Speech and Audio Processing, Vol. 1, pp. 15-24、1993年1月 F. Itakura、「スピーチ信号の線形予測係数のラインスペクトル表示Line Spectrum Representation of Linear Predictive Coefficients of Speech Signals」、J. Acoust. Soc. Am., 57, 535(A)、1975年 N. SagumuraおよびF. Itakura、「LSPスピーチ分析・合成方法によるスピーチデータ圧縮Speech Data Compression by LSP Speech Analysis-Synthesis Technique」、Trans. IECE ‘81/8, Vol. J64-A, No. 8, pp. 599.606 P. KabalおよびR.P. Ramachandran、「チェビシェフ多項式を用いたラインスペクトル周波数の計算Computation of line spectral frequencies using chebyshev polynomials」、IEEE Trans. on ASSP, vol. 34, no. 6, pp. 1419-1426、1986年12月 J. Rothweiler、「ラインスペクトル周波数のための解法アルゴリズムA rootfinding algorithm for line spectral frequencies」、ICASSP-99 Engin ErzinおよびA. Enis Cetin、「ラインスペクトル周波数のフレーム間差分ベクトル符号化Interframe Differential Vector Coding of Line Spectrum Frequencies」、Proc. Of the Int. Conf. on Acoustic, Speech and Signal Processing 1993 (ICASSP ’93), Vol. II, pp. 25-28、1993年4月27日

本発明の目的は、オーディオ信号の少なくとも一部を符号化する有利な方法を提供することである。このために、本発明は、符号化方法、エンコーダ、符号化されたオーディオ信号、記憶媒体、復号方法、デコーダ、トランスミッタ、レシーバ、およびシステムを提供する。独立クレームに明記したとおりである。従属クレームとして有利な実施形態を記載した。

本発明の第１の態様によると、符号化信号を得るためにオーディオ信号の少なくとも一部を符号化する。符号化は、予測係数を得るためにオーディオ信号の少なくとも一部を予測符号化するステップを有する。この予測係数は、オーディオ信号の少なくとも一部の時間特性（例えば時間エンベロープ）を表す。また、符号化は、予測係数を一組の時間に変換するステップと、その一組の時間を符号化信号に含めるステップとを有する。振幅に関する情報を何ら有さない時間だけで、十分に予測係数を表すことができることに注意されたい。

信号またはその成分の時間的形状を直接符号化して、一組の振幅やゲイン値とすることもできる。しかし、本願発明者の洞察によると、質のより良いオーディオ符号化をするためには、時間的特性（例えば時間的エンベロープ）を表す予測係数を予測符号化により取得し、この予測係数を一組の時間に変換すればよい。質のより良いオーディオ符号化をすることができる理由は、時間軸が固定された方法と比較して、時間の分解能を（必要に応じて）局所的に高くすることができるからである。予測符号化を実施するのに、LPCフィルターの振幅応答を用いて時間的エンベロープを表してもよい。

さらに、本願発明者の洞察によると、特に時間領域におけるラインスペクトル表示の派生物または等価物を用いることにより、時間的エンベロープを表す予測係数の符号化が有利になる。その理由は、この方法においては、時間または時間インスタンスがはっきりしており、さらに符号化することができるからである。それゆえ、本発明のこの形態によると、オーディオ信号の少なくとも一部の時間的特性を符号化する方法を効率的なものとすることができ、オーディオ信号の少なくとも一部をよりよく圧縮することができる。

本発明の実施形態の解釈によると、LPCスペクトルを用いてスペクトルのエンベロープではなく時間的エンベロープを記述する。スペクトルのエンベロープの場合の時間に相当するものは周波数であり、その逆も成り立つ。これが意味するところによると、ラインスペクトル表示を用いた結果得られるのは、周波数ではなく一組の時間または時間インスタンスである。このアプローチにおいては、時間は時間軸上の所定のインターバルに固定されてはおらず、時間そのものが予測係数を表すことに注意されたい。

時間的エンベロープに重複したフレーム分析・合成を用いると、その重複におけるラインスペクトル表示の冗長性をうまく利用できることに、本願発明者は気づいた。本発明の実施形態では、この冗長性をうまく利用している。

本発明とその実施形態によると、WO01/69593-A1に開示されているようなパラメトリックオーディオ符号化方法において、オーディオ信号中のノイズ成分の時間的エンベロープを有利に符号化することができる。このようなパラメトリックオーディオ符号化方法において、オーディオ信号は過渡的信号成分、シヌソイド信号成分、ノイズ成分に分けることができる。シヌソイド成分を表すパラメータは、振幅、周波数、位相である。過渡的成分については、上記のパラメータを拡張してエンベロープを効率的に表すことができる。

本発明とその実施形態はオーディオ信号の周波数帯域全体やその成分に適用することができ、より狭い範囲の周波数帯域に適用することもできる。

本発明の上記その他の態様は、添付した図面を参照して詳細な説明を読めば明らかとなるであろう。

図面には本発明の実施形態を理解するのに必要な要素だけを示した。

以下、LPCフィルタの使用および時間領域におけるLSFの派生物や等価物の計算について説明するが、本発明はクレームの範囲に入る他のフィルターや表示についても適用可能である。

図２は、LPCフィルター等の予測フィルターをどのように用いてオーディオ信号またはその成分の時間的エンベロープを表すかを示している。従来のLPCフィルターを使用できるようにするため、例えばフーリエ変換により、入力信号は最初に時間領域から周波数領域に変換される。実際、時間的形状はスペクトル形状に変換され、後続する従来のLPCフィルターにより符号化される。従来のLPCフィルターは、通常、スペクトル形状を符号化するものである。LPCフィルター分析により、入力信号の時間的形状を表す予測係数が得られる。時間分解能と周波数分解能の間にはトレードオフの関係がある。例えば、LPCスペクトルが非常に鋭いピーク（シヌソイド）を多数含んでいると仮定する。そのとき、聴覚システムは時間分解能の変化にはあまり敏感でないので、分解能も低くてよい。逆に、過渡状態においては、周波数スペクトルの分解能は正確である必要は無い。この意味において、結合符号化であるとみなすこともでき、時間領域の分解能は周波数領域の分解能に依存し、その逆も成り立つ。低い周波数帯域と高い周波数帯域などの複数のLPC曲線を時間領域の予測に利用することもできる。このときも、分解能は周波数予測等の分解能に依存するので、これをうまく利用することができる。

LPCフィルターH(z)は、一般に以下のように表すことができる。

係数a_iは、LPC分析の結果得られる予測フィルタ係数であり、iは1からmまでの整数である。係数a_iによりH(z)が決まる。

LSFの時間領域における等価物を計算するために、以下の方法を用いる。この方法は、一般の全極（all-pole）フィルターの場合にも、周波数領域の場合にもほとんどそのまま使用することができる。周波数領域においてLSFを導出する方法として他に知られたものを用いて、LSFの時間領域の等価物を計算することができる。

多項式A(z)は、m+1次の２つの多項式P(z)とQ(z)に分けられる。多項式P(z)は、A(z)に反射係数+1（格子フィルター形式の）を加えることにより得られる。Q(z)は、A(z)に反射係数-1を加えることにより得られる。直接形式（上記の式）のLPCフィルターと格子形式のLPCフィルターの間には、以下の再現関係がある。

ここで、i=1,2,...,m、A0(z)=1、k_iは反射係数である。

多項式P(z)とQ(z)は、以下の式により求められる。

このように求めた多項式

と

は、それぞれ対称および反対称である。

この多項式には重要な特長がいくつかある。
−P(z)とQ(q)のすべてのゼロ点は、z平面の単位円上にある。
−P(z)とQ(z)のゼロ点は、単位円上で交互になっており、重複しない。
−A(z)の最小位相特性は量子化後も保存され、H(z)の安定性が保証される。

多項式P(z)とQ(z)は、いずれもm+1個のゼロ点を有する。z=-1とz=1とは常にP(z)またはQ(z)のゼロ点であることは明らかである。それゆえ、1+z^-1と1-z^-1により割ることにより除外することができる。mが偶数の場合、

mが奇数の場合、

となる。

多項式P’(z)とQ’(z)のゼロ点は、z_i=e^jtと表すことができる。LPCフィルタは時間領域に適用されるからである。よって、多項式P’(z)とQ’(z)のゼロ点は、時間tにより完全に特徴付けられる。時間tは1フレームの間に0からπの間を動く。0はフレームの最初に対応し、πはフレームの最後に対応する。フレームの長さは、例えば10msまたは20msなどのいかなる長さであってもよい。こうして得られる時間tは、ラインスペクトル周波数の時間領域における等価物であると解釈することができる。この時間をここではLSF時間と呼ぶ。実際のLSF時間を計算するには、P’(z)とQ’(z)の根を求めなければならない。別の方法が非特許文献９、１０、１１で提案されており、同様に使用することができる。

図３は、時間的エンベロープの分析と合成の例を示す模式図である。各フレームkにおいて、ウィンドウ（必ずしも方形である必要は無い）を用いてセグメントをLPCにより分析する。各フレームについて、変換後、N個のLSF時間が得られる。Nは定数である必要は無いが、定数である多くの場合には、表示がより効率的になることに注意されたい。本実施形態では、LSF時間が一様に量子化されると仮定したが、ベクトル量子化等の他の方法を適用してもよい。

実験によると、図３に示したような重複において、フレームk-1のLSF時間とフレームkのLSF時間の間に冗長性があることが多いことが分かった。ここで図４と５も参照する。以下に説明する本発明の実施形態においては、この冗長性をうまく利用してLSF時間の符号化をより効率的にする。この効率化により、オーディオ信号の少なくとも一部をよりよく圧縮することができる。図４と５は、重複するエリアのフレームkのLSF時間が、フレームk-1のLSF時間と同じではないが近いような通常の場合を示していることに注意されたい。

重複するフレームを用いる第１の実施形態
重複するフレームを用いる第１の実施形態では、重複するエリアのLSF時間の差は小さく、無視できるかまたはそれによる画像の劣化を許容できるものと仮定する。フレームk-1のLSF時間とフレームkのLSF時間からなるLSF時間のペアに対して、導出LSF時間を導く。この導出LSF時間は、ペアになっているLSF時間の重み付け平均である。このアプリケーションにおける重み付け平均には、LSF時間のペアのうち一方だけが選択される場合も含むものとする。この選択は、選択されたLSF時間の重みが１で、選択されなかったLSF時間の重みが０である場合と解釈することができる。ペアのLSF時間の両方に同じ重みを付けることも可能である。

例えば、図４に示したように、フレームk-1にLSF時間｛l₀, l₁, l₂,...,l_N｝があり、フレームkにLSF時間｛l₀,l₁,l₂,...,l_M｝があると仮定する。フレームkのLSF時間がシフトされ、量子化レベルlが２つのフレームの各々において同じ位置に来るようにする。ここでは、各フレームの重複するエリアには３つのLSF時間があると仮定する。図４と５に示した場合である。対応するペアが以下のように形成される：｛l_N-2,k-1l_0,k, l_N-1,k-1l_1,k, l_N,k-1l_2,k｝。本実施形態においては、３つの導出LSF時間からなる新しい組が、３つのLSF時間のもとの組２つに基づき構成される。実際のアプローチとしては、フレームk-1（またはk）のLSF時間を取り、フレームk-1（またはk）のLSF時間を単にシフトしてフレームを時間的に調整することにより、フレームk（またはk-1）のLSF時間を計算する。このシフトは、エンコーダとデコーダの両方で行われる。エンコーダでは、右側のフレームkのLSF時間がシフトされ、左側のフレームk-1のLSF時間に一致するようにする。こうすることが必要なのは、ペアを見つけ、最終的に重み付け平均を決定するためである。

好ましい実施形態において、導出時間または重み付け平均が「表示レベル」としてビットストリームに符号化される。この「表示レベル」は、例えば0からπを表す0から255（8ビット）までの整数値である。実際の実施形態ではハフマン符号化も適用される。第１のフレームについて、第１のLSF時間は絶対的（参照ポイントなし）に符号化される。後続のLSF時間（最後に重み付けされたものも含む）は、先行するものとの差分として符号化される。ここで、フレームkが「トリック」を用いてフレームk-1の最後の３つのLSF時間を使用すると仮定する。復号において、フレームkはフレームk-1の最後の３つの表示レベル（0から255の領域の最後にある）を取り、それを自分の時間軸（0から255の領域の最初）にシフトする。フレームkの後続するLSF時間はすべて、重複したエリアの最後のLSFに対応する（フレームkの軸上の）表示レベルで始まる先行するLSF時間との差分として符号化される。フレームkで「トリック」を使えない場合、フレームkの第１のLSF時間は絶対的に符号化され、フレームkの後続するLSF時間はすべて先行するLSF時間との差分として符号化される。

実際的なアプローチとしては、対応するLSF時間のペアごとの平均をとればよい。例えば、(l_N-2,k-1+l_0,k)/2、(l_N-1,k-1+l_1,k)/2、および(l_N,k-1+l_2,k)/2である。

より一層有利なアプローチとして、図３に示したように、ウィンドウは一般的にフェードイン、フェードアウトのような振る舞いをすることを考慮に入れる。このアプローチでは、各ペアの重み付けは聴いて結果がよいものを計算する。以下にその方法を示す。重複するエリアはエリア（π-r,π）である。重み関数は図６に示したように導出される。各ペアに対して左側のフレームk-1の時間の重みが以下のように別々に計算される：

ここで、l_meanはペアの平均である。すなわちl_mean=(l_N-2,k-1+l_0,k)/2。
フレームkの重みはw_k=1-w_k-1として計算される。
新しいLSF時間が：
l_weighted=l_k-1w_k-1+l_kw_k
として計算される。ここで、l_k-1とl_kがペアを形成している。最後に、重み付けされたLSF時間が一様に量子化される。

ビットストリームの最初のフレームには先行するフレームがないので、LSF時間の最初のフレームの符号化には、上記の方法を利用することができない。最初のLSF時間はハフマン符号化を用いて絶対的に符号化しなければならない。後続の値は、同じフレーム内の先行する値との差分として固定ハフマンテーブルを用いて符号化する。第１のフレームに続くフレームには、本質的にはすべて上記の方法を利用することができる。もちろん、上記の方法が常に有利であるとは限らない。例えば、両方のフレームが重複するエリアには同数のLSF時間があるが、まったく一致していない状況を考える。（重み付け）平均を計算しても劣化するだけである。フレームk-1のLSF時間の数がフレームkのLSF時間の数と異なる状況においても、上記の方法は好ましくない。それゆえ、LSF時間の各フレームに対して、符号化信号に単一ビット等の表示を含め、上記の方法を用いたか否かを表示する。すなわち、LSF時間を先行するフレームから読み出すか、それともビットストリームに含まれているかを表示する。例えば、表示するビットが１であるとき、重み付けLSF時間はフレームk-1中の先行するLSF時間との差分として符号化される。フレームkにおいては、重複するエリア内のLSF時間はフレームk-1内のLSF時間から導出される。表示ビットが0のとき、フレームkの第１のLSF時間は絶対的に符号化され、それに続くLSF時間は先行するLSF時間との差分として符号化される。

実際の実施形態においては、LSF時間のフレームは長く、例えば44.1kHzの周波数において1440サンプルである。この場合、余分な表示ビットとして30ビット毎秒程度が必要となるだけである。実験によると、ほとんどのフレームに上記の方法を使用して有利に符号化することができ、結果としてフレームあたりのビットを節約することができた。

重複するフレームを用いたさらに別の実施形態
本発明のさらに別の実施形態によると、LSF時間データをロスレス符号化する。重複したペアを単一のLSF時間にするのではなく、与えられたフレーム中のLSF時間の差が、他のフレーム中のLSF時間により符号化される。図３の例において、値l₀からl_Nがフレームk-1から読み出すとき、フレームkの最初の３つの値l₀からl₃は、それぞれフレームk-1の値l_N-2、l_N-1、l_Nとの（ビットストリーム中の）差を復号することにより読み出される。他のフレーム中のどのLSF時間よりも時間的に近いLSF時間を参照して、LSF時間を符号化することにより、冗長性をうまく利用することができる。時間は最も近い時間を参照して最もよく符号化することができるからである。通常、差は小さいので、別々のハフマンテーブルを用いて非常に効率的に符号化することができる。第１の実施形態で説明した方法を用いるか否かを表示するビットを離れて、この例についても、第１の実施形態が問題となる重複に用いられない場合、差分l_0,k-l_N-2,k-1、l_1,k-l_N-1,k-1、l_2,k-l_N,k-1がビットストリームに含められる。

他の実施形態と比較してより有利というわけではないが、先行するフレーム中の他のLSF時間に対して差分を符号化することも可能である。例えば、後続するフレームの第１のLSF時間の差のみを先行するフレームの最後のLSF時間に対して符号化し、後続するフレーム中の後続するLSF時間の各々を同じフレーム中の先行するLSF時間に対して符号化することが可能である。例えば、フレームk-1についてl_N-1-l_N-2、l_N-l_N-1、またその後フレームkについてl_0,k-l_N,k-1、l_1,k-l_0,k等である。

システムの説明
図７は、本発明の一実施形態によるシステムを示す図である。本システムは、符号化された信号［S］を送信または記録する装置１を有する。装置１は、オーディオ信号Sの少なくとも一部、好ましくはそのオーディオ信号のノイズ成分を受信する入力部１０を有する。入力部１０は、例えばアンテナ、マイクロホン、ネットワーク接続である。符号化された信号を得るため、装置１は本発明の上記の実施形態（特に図４、５、６を参照）による、信号Sを符号化するエンコーダ１１をさらに有する。入力部１０はオーディオ信号全体を受信し、その成分を他の専用エンコーダに供給してもよい。符号化された信号は出力部１２に送られ、その出力部１２は、送信媒体または記憶媒体２を介して送信または格納するのに好適なフォーマットを有するビットストリーム［S］に符号化されたオーディオ信号を変換する。本システムはレシーバまたは再生装置３をさらに有する。レシーバまたは再生装置３は符号化された信号［S］を入力部３０で受信する。入力部３０は、符号化された信号［S］をデコーダ３１に送る。デコーダ３１は、復号プロセスを実行して符号化された信号を復号する。この復号プロセスは実質的にエンコーダ１１における符号化と逆の動作である。これにより復号された信号S’が得られるが、この信号は、符号化プロセスで失われた部分を除いて、元の信号Sと同じものである。デコーダ３１は、復号された信号S’を出力部３２に送り、出力部３２が復号された信号S’を出力する。出力部３２は、復号された信号S’を再生する、スピーカ等の再生部であってもよい。出力部３２は、例えばホームネットワークを介して復号された信号S’をさらに送信するトランスミッタであってもよい。信号S’がノイズ成分等のオーディオ信号の成分を再構成したものである場合、出力部３２は、オーディオ信号全体を供給するために、信号S’を他の再構成された成分と結合する結合手段を含んでいても良い。

本発明の実施形態は、インターアリア、インターネット配信、ソリッドステートオーディオ、３Gターミナル、GPRS、およびこれらの後継機種に適用することができる。

上記の実施形態は本発明を例示するものであり、限定するものではないことに注意すべきである。また、添付したクレームの範囲から逸脱することなく、当業者は別の実施形態を多数設計することも可能であることに注意すべきである。クレーム中の括弧でくくった参照符号はクレームを限定するものと解してはならない。「有する」という言葉は、クレームに記載された要素やステップとは別の要素やステップが存在することを排除するものではない。本発明は異なる要素を有するハードウェアによって実施することができ、またコンピュータを好適にプログラムすることにより実施することができる。いくつかの手段を列挙した装置クレームにおいて、まったく同一のハードウェアにより実施することができる。いくつかの手段が互いに異なる従属クレームに列挙されていたとしても、この手段の組み合わせを用いて本発明の利益を得ることができないということを示しているわけではない。

先行技術による、８個のラインスペクトル周波数を有する８極のLPCスペクトルの例を示す図である。 LPCを使用した例を示し、上図においてはH(z)は周波数スペクトルを表し、下図においてはLPCは時間的エンベロープを表す。分析／合成ウィンドウを例示する模式図である。２つの後続フレームのＬＳＦ時間のシーケンスを例示する図である。フレームkのLSF時間を先行するフレームk-1に対してシフトすることによるＬＳＦ時間のマッチングを示す図である。重複部分の関数として重み付け関数を示すグラフである。本発明の一実施形態によるシステムを示す図である。

Claims

符号化信号を得るために、少なくとも第１のフレームと第２のフレームとにセグメント化され、前記第１のフレームと第２のフレームとは重複部分を有するオーディオ信号の少なくとも一部を符号化する方法であって、各フレームについて、
前記オーディオ信号の少なくとも一部の、時間的エンベロープを表す予測係数を求めるために、前記オーディオ信号の少なくとも一部を予測符号化するステップと、
前記予測係数を表す一組の時間に前記予測系数を変換するステップと、
前記符号化信号に前記一組の時間を含めるステップとを有し、
前記第１のフレームの第２のフレームとの重複部分には各フレームの少なくとも１つの時間を含み、前記重複部分にある前記第１のフレームの１つの時間と、前記重複部分にある前記第２のフレームの１つの時間とからなる１組の時間に対して、導出時間が前記符号化された信号に含まれ、前記導出時間は前記第１のフレームの前記１つの時間と前記第２のフレームの前記１つの時間の重み付け平均であることを特徴とする方法。
前記予測符号化するステップはフィルターを用いて実行され、前記予測係数はフィルター係数である、請求項１に記載の方法。
前記予測符号化は線形予測符号化である、請求項１または２に記載の方法。
前記予測符号化するステップの前に、周波数領域信号を求めるために、時間領域から周波数領域への変換を前記オーディオ信号の少なくとも一部に実行し、前記予測符号化するステップは、前記オーディオ信号の少なくとも一部ではなく前記周波数領域信号に実行される、請求項１または２に記載の方法。
前記時間はラインスペクトル周波数の時間領域の等価物である、請求項１または２に記載の方法。
前記導出時間は前記１組の時間の選択された一方と同一である、請求項１に記載の方法。
フレームの境界に近い時間は、前記境界から遠い時間より軽い重み付けがなされる、請求項１に記載の方法。
前記第２のフレームの時間は前記第１のフレームの時間に対する差分として符号化される、請求項１に記載の方法。
前記第２のフレームの前記時間は、時間的に、前記第１のフレームの他のいずれの時間よりも前記第２のフレームの前記時間に近い前記第１のフレームの時間に対する差分として符号化される、請求項８に記載の方法。
さらに単一ビット表示が前記符号化された信号に含まれ、前記表示は前記符号化信号が前記重複部分に導出時間を含むかどうかを示す、請求項１，６，７，８または９いずれか一項に記載の方法。
さらに単一ビット等の表示が前記符号化された信号に含まれ、前記表示は前記重複部分の前記時間または導出時間を符号化するのに使用された符号化の種類を表示する、請求項１，６，７，８または９いずれか一項に記載の方法。
オーディオ信号の少なくとも一部を表す符号化信号を復号する方法であって、前記符号化信号は少なくとも第１のフレームと第２のフレームとを含み、前記第１のフレームと第２のフレームとは重複部分を有し、各符号化信号は予測係数を表す一組の時間を含むフレームに対応し、前記予測係数は前記オーディオ信号の少なくとも一部の時間的エンベロープを表し、前記方法は、
前記一組の時間から前記時間的エンベロープを導出し、復号信号を求めるために、前記時間的エンベロープを使用するステップと、
前記復号信号を提供するステップとを有し、
前記時間は前記オーディオ信号の少なくとも一部の少なくとも第１のフレームおよび第２のフレームに関係し、前記第１のフレームと前記第２のフレームは各フレームの少なくとも１つの時間を含む重複部分を有し、前記符号化信号は少なくとも１つの導出時間を含み、前記導出時間は元の前記オーディオ信号の少なくとも一部の前記重複部分にある前記第１のフレームの１つの時間と前記重複部分にある前記第２のフレームの１つの時間とを有する一組の時間の重み付け平均であり、前記方法は前記第１のフレームを復号し前記第２のフレームを復号するのに前記少なくとも１つの導出時間を使用するステップをさらに有することを特徴とする方法。
前記方法は、前記予測係数を求めるために前記一組の時間を変換するステップを有し、前記時間的エンベロープは前記一組の時間からではなく前記予測係数から導出される、請求項１２に記載の復号方法。
前記符号化信号はさらに単一ビット表示を有し、前記表示は前記符号化信号は前記重複部分に導出時間を含むかどうかを示し、前記方法は、
前記符号化信号から前記表示を求めるステップと、
前記重複部分が導出時間を含むことを前記表示が示している場合に限って、前記第１のフレームの復号と前記第２のフレームの復号に前記少なくとも１つの導出時間を使用するステップを実行するステップをさらに有する、請求項１２に記載の復号方法。