JP2006513457A

JP2006513457A - 音声を可変レートで符号化および復号する方法

Info

Publication number: JP2006513457A
Application number: JP2004567790A
Authority: JP
Inventors: バラコヴァシ、; ドミニクマサル、
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2003-01-08
Filing date: 2003-12-22
Publication date: 2006-04-20
Anticipated expiration: 2023-12-22
Also published as: JP4390208B2; MXPA05007356A; WO2004070706A1; US7457742B2; FR2849727A1; ES2302530T3; ATE388466T1; EP1581930B1; AU2003299395B2; CA2512179C; DE60319590T2; US20060036435A1; AU2003299395A1; CA2512179A1; KR20050092107A; DE60319590D1; FR2849727B1; CN1735928A; ZA200505257B; CN1735928B

Abstract

符号化のための最大Ｎｍａｘ個のビットが、信号フレームから計算されるパラメータ群に対して規定される。第１のサブ群に対するパラメータは計算され、Ｎ０＜ＮｍａｘであるＮ０個のビットで符号化される。第２のサブ群のパラメータのためのＮｍａｘ−Ｎ０の符号化ビットの割当てが決定され、第２のサブ群に対するパラメータに割当られた符号化ビットが分類される。符号化ビットの割当ておよび／または分類の順序は、第１のサブ群に関する符号化パラメータの関数として決定される。全パラメータ（Ｎ０＜Ｎ＝Ｎｍａｘ）の符号化のためのＮ個の利用可能なビットの総数に対し、上記順序で最初に分類されたＮ−Ｎ０個の符号化ビットが割当られた第２のサブ群に関するパラメータが選択される。上記選択されたパラメータは、Ｎ−Ｎ０個のビットが得られるように計算および符号化される。最後に、第１のサブ群に対するＮ０個の符号化ビットおよび第２のサブ群に対する選択されたパラメータに対するＮ−Ｎ０個の符号化ビットが、符号化器の出力シーケンス中に入れられる。

Description

本発明は、特に、デジタル化され、かつ圧縮された音声信号（スピーチおよび／またはサウンド）の送信または格納の用途に用いられることを目的とした、音声信号を符号化および復号する装置に関する。

特に、本発明は、マルチレート符号化装置とも呼ばれる、可変ビットレートを提供することができる音声符号化装置に関する。このような方式は、符号化のビットレート、おそらくは処理中のビットレートを変えることができることによって、固定レート符号化器とは区別され、これは、異種のアクセスネットワーク、すなわちＩＰタイプ混合固定型モバイルアクセス、高ビットレート（ＡＤＬＳ）、低ビットレート（ＲＴＣ、ＧＰＥＳモデム）、または可変性能を有する端末（モバイル、ＰＣなど）を持つネットワークによる通信に特に適している。

本質的には、２つのカテゴリに属するマルチレート符号化器、すなわち「切替可能」マルチレート符号化器のカテゴリと「階層的」符号化器のカテゴリが区別される。

「切替可能」マルチレート符号化器は、ビットレートの表示が、符号化器および復号器に同時与えられる技術的ファミリ（時間的符号化または周波数符号化、例えば、ＣＥＬＰ、正弦、または変換によるもの）に属する符号化アーキテクチャに依存している。符号化器は、この情報を用いて、アルゴリズムの部分と、選択されたビットレートに関連するテーブルとを選択する。復号器は、それの対称に動作する。音声符号化について多くの切替可能なマルチレート符号化構造が提案されている。そのような符号化の例として、例えば、３ＧＰＰ機構（「第３世代パートナーシッププロジェクト」）、電話帯域でのＮＢ−ＡＭＲ（「狭帯域アダプティブマルチレート」、技術仕様３ＧＰＰＴＳ２６．０９０、バージョン５．０．０、２００２年６月）、または、広帯域でのＷＢ−ＡＭＲ（「広帯域アダプティブマルチレート」、技術仕様３ＧＰＰＴＳ２６．１９０、バージョン５．１．０、２００１年１２月）によって標準化されたモバイル符号化器がある。これらの符号化器は、かなり高精度（ｇｒａｎｕｌａｒｉｔｙ）（ＮＢ−ＡＭＲの場合８ビットレートおよびＷＢ−ＡＭＲの場合９ビットレート）で、かなり広範囲のビットレート（ＷＢ−ＡＭＲの場合４．７５から１２．２ｋｂｉｔ／ｓ、ＷＢ−ＡＭＲの場合６．６０から２３．８５ｋｂｉｔ／ｓ）にわたって動作する。しかし、この柔軟性に支払われる代償として相当複雑な構造が必要である。すなわち、これらのビットレート全てをホスト可能とするために、これらの符号化器は、多くの異なるオプション、異なる量子化テーブルなどをサポートしなければならない。その性能曲線は、ビットレートと共に徐々に増大するが、その増大の度合いは非線形であり、特定のビットレートは、他のものよりも本質的に良好に最適化される。

「スケーラブル」とも呼ばれるいわゆる「階層的」符号化装置では、符号化動作から生じるバイナリデータは、連続した層中に分布する。「カーネル」とも呼ばれるベース層は、バイナリ列の復号に絶対的に必要であり、かつ最低の復号品質を決定する、バイナリエレメントで構成される。

後続する層は、復号動作から生じる信号の品質を徐々に向上させることができ、新しい各層は、復号器によって用いられ、良好な品質の信号を出力に与える新しい情報をもたらす。

階層的符号化の特徴の１つは、いかなる特定の表示を符号化器または復号器に与える必要なしにバイナリ列の一部を削除するために送信または格納チェーンがいかなるものであってもその任意のレベルでの介入の可能性である。復号器は、自身が受信したバイナリ情報を用いて然るべき品質の信号を生成する。

階層的符号化構造の分野も、同様に多くの働きをしてきた。特定の階層的符号化構造は、階層化された符号化情報を送信するように設計されている、１つの種類の符号化器のみに基づいて動作する。他の層が、帯域幅を変更することなく出力信号の品質を向上させると、むしろ「埋め込み型符号化器」（例えば、Ｒ．Ｄ．Ｌａｃｏｖｏら、「ＥｍｂｅｄｄｅｄＣＥＬＰＣｏｄｉｎｇｆｏｒＶａｒｉａｂｌｅＢｉｔ−ＲａｔｅＢｅｔｗｅｅｎ６．４ａｎｄ９．６ｋｂｉｔ／ｓ、Ｐｒｏｃ．ＩＣＡＳＳＰ１９９１、ｐｐ．６８１から６８５を参照されたい」）の話になる。しかし、この種の符号化器は、提案された最低ビットレートと最高ビットレートとの間の大きなギャップを許さない。

階層は、信号の帯域幅を徐々に増すためにしばしば用いられる。すなわちカーネルは、ベースバンド信号、例えば、電話用のもの（３００から３４００Ｈｚ）を供給し、後続する層は、追加の周波数帯域（例えば、最大７ｋＨｚまでの広帯域、最大２０ｋＨｚのＨｉＦｉ帯域または中間帯域等）の符号化を可能にする。サブバンド符号化器または、Ｊ．Ｐ．Ｐｒｉｎｃｅｎら著「Ｓｕｂｂａｎｄ／ｔｒａｎｓｆｏｒｍｃｏｄｉｎｇｕｓｉｎｇｆｉｌｔｅｒｂａｎｋｓｄｅｓｉｇｎｓｂａｓｅｄｏｎｔｉｍｅｄｏｍａｉｎａｌｉａｓｉｎｇｃａｎｃｅｌｌａｔｉｏｎ」、（Ｐｒｏｃ．ＩＥＥＥＩＣＡＳＳＰ−８７、ｐｐ．２１６１から２１６４）およびＹ．Ｍａｈｉｅｕｘら著「ＨｉｇｈＱｕａｌｉｔｙＡｕｄｉｏＴｒａｎｓｆｏｒｍＣｏｄｉｎｇａｔ６４ｋｂｉｔ／ｓ」、（ＩＥＥＥＴｒａｎｓ．Ｃｏｍｍｕｎ．、Ｖｏｌ．４２、Ｎｏ．１１、１９９４年１１月、ｐｐ．３０１０から３０１９）などの文献に記載された時間／周波数変換を用いた符号化器は特にそのような動作に適している。

また、異なった符号化技術が、カーネルおよび追加の層の１つまたは複数のモジュールにしばしば用いられ、各段階がサブ符号化器からなる様々な符号化段階が挙げられる。所与のレベルの段階のサブ符号化器は、以前の段階で符号化されていない信号の符号部分を符号化するか、または前段階で符号化されていない信号（ｃｏｄｉｎｇｒｅｓｉｓｕａｌ）を符号化でき、この符号化されていない信号は復号信号を原信号から差し引いて得られる。

このような構造の利点は、それらが高ビットレートで高品質を生成しつつ、十分な品質を持つ比較的低ビットレートの信号も生成できることである。具体的には、低ビットレートに用いられる技術は一般的には高ビットレートでは有効ではなく、またその逆も言える。

２つの異なる技術（例えば、ＣＥＬＰおよび時間／周波数変換）を用いることが可能なこのような構造は、広範囲のビットレートを掃引するのに特に有効である。

しかし、従来技術において提案されている階層的符号化構造は、各中間層に割当てられているビットレートを厳密に規定している。各層は特定のパラメータの符号化に対応し、階層的バイナリ列の精度（ｇｒａｎｕｌａｒｉｔｙ）はこれらのパラメータに割当られたビットレートに依存する（通常１つの層は、フレーム当り数十ビットのオーダー、所与の時間にわたる信号の特定数のサンプルからなる信号フレームを含むことができ、後述する例では、６０ｍｓの信号に対応する９６０個のサンプルのフレームを考えている）。

さらに、復号された信号の帯域幅がバイナリエレメントの層のレベルに応じて変わることができる場合、ラインビットレートを変更すると、聴取（ｌｉｓｔｅｎｉｎｇ）を妨げる人為的な間違いの結果（ａｒｔｉｆａｃｔｓ）が生じることがある。

本発明は、特に、既存の階層的および切替可能符号化を使用する場合に生じる上述した欠点を軽減するマルチレート符号化の解決策を提案することを目的としている。

したがって、本発明は、符号化ビットの最大数Ｎｍａｘが、デジタル音声信号フレームにしたがって計算できるパラメータ群について定められ、パラメータ群は第１のサブ群と第２のサブ群から構成される、デジタル音声信号フレームをバイナリの出力シーケンスとして符号化する方法を提案する。この提案された方法は以下のステップ、すなわち、
第１のサブ群のパラメータを計算し、これらのパラメータをＮ０＜Ｎｍａｘとなるような符号化ビットの数Ｎ０だけ符号化するステップと、
第２のサブ群のパラメータに対するＮｍａｘ−Ｎ０個の符号化ビットの割当を決定するステップと、
第２のサブ群のパラメータに割当られたＮｍａｘ−Ｎ０個の符号化ビットを定められた順序でランク付けするステップと、
を含む。

Ｎｍａｘ−Ｎ０個の符号化ビットの割当および／またはランク付けの順序が第１のサブ群の符号化パラメータの関数として決定される。本符号化方法は、パラメータ群の符号化のために使用可能なバイナリの出力シーケンスの、Ｎ０＜Ｎ＜Ｎｍａｘである、ビット値Ｎを示すことに応答して、さらに、以下のステップ、すなわち、
前記順序において１番目にランク付けされたＮ−Ｎ０個の符号化ビットが割当られた第２のサブ群のパラメータを選択するステップと、
第２のサブ群の前記選択されたパラメータを計算し、１番目にランク付けされたＮ−Ｎ０個の符号化ビットを生成するようにこれらのパラメータを符号化するステップと、
第１のサブ群のＮ０個の符号化ビットと第２のサブ群の選択されたパラメータのＮ−Ｎ０個の符号化ビットを前記出力シーケンスに挿入するステップと、
を有する。

本発明による方法によって、少なくとも、各フレームについてＮ０からＮｍａｘの範囲のビット数に対応する範囲において動作するマルチレート符号化を規定することが可能となる。

したがって、既存の階層的かつ切替可能な符号化に関連する予め定められたビットレートの考えが、「カーソル」の考えに取って代わられ、これにより、ビットレートを（Ｎ０よりも小さいビット数Ｎに対応するであろう）最小値と（Ｎｍａｘに対応する）最大値との間で自由に変更することが可能になると考えられる。これらの極値は、大きく離れている可能性がある。本方法は、選択されたビットレートに関係なく、符号化の効率の点で良好な性能をもたらす。

バイナリの出力シーケンスのビット数Ｎは、厳密にはＮｍａｘよりも小さいのが有利である。よって、この符号化器について注目に値する点は、用いられるビット割当が符号化器の実際の出力ビットレートではなく、復号器に一致する別の数Ｎｍａｘを参照する点である。

しかし、送信チャンネル上で利用可能な瞬間的なビットレートの関数としてＮｍａｘ＝Ｎを固定することも可能である。このような切替可能なマルチレート符号化器の出力シーケンスは、シーケンス全体受信しない復号器によって、該復号器が、第２のサブ群の符号化ビットの構造をＮｍａｘ知ることによって取り出すこができる限り、処理してもよい。

Ｎ＝Ｎｍａｘにすることが可能な他の場合は、音声データを最大符号化速度で格納する場合である。より低いビットレートで格納されたこの内容のＮ’個のビットを読み出す場合、復号器は、Ｎ’？Ｎ０である限り、第２のサブ群の符号化ビットの構造を取り出すことができるであろう。

第２のサブ群のパラメータに割当られた符号化ビットのランク付けの順序は、予め定められた順序であってもよい。

好適な実施態様において、第２のサブ群のパラメータに割当られた符号化ビットのランク付けの順序は可変である。特に、この順序は、第１のサブ群の少なくとも、符号化されたパラメータの関数として決定された重要性の降順であってもよい。したがって、当該フレームについて、Ｎ０？Ｎ'？Ｎ？ＮｍａｘであるＮ’個のビットのバイナリシーケンスを受信する復号器は、第１のサブ群の符号化のために受信されたＮ０個のビットからこの順序を差し引くことができる。

Ｎｍａｘ−Ｎ０個のビットの第２のサブ群のパラメータの符号化への割当は、固定して行ってもよい（この場合、これらのビットのランク付けの順序は、第１のサブ群の少なくとも、符号化されたパラメータに依存する）。

好適な実施態様において、Ｎｍａｘ−Ｎ０個のビットの、第２のサブ群のパラメータの符号化への割当は、第１のサブ群の符号化されたパラメータの関数である。

第２のサブ群のパラメータに割当られた符号化ビットのランク付けのこの順序は、第１のサブ群の符号化されたパラメータの関数としての少なくとも１つの心理音響的規準（ｐｓｙｃｈｏａｃｏｕｓｔｉｃｃｒｉｔｅｒｉｏｎ）の助けによって決定されるのが有利である。

第２のサブ群のパラメータは信号のスペクトル帯域に関連している。この場合、本方法は、第１のサブ群の符号化されたパラメータに基づいて符号化された信号のスペクトルエンベロップを推定するステップと、上記推定されたスペクトルエンベロップに聴覚モデル（ａｕｄｉｔｏｒｙｐｅｒｃｅｐｔｉｏｎｍｏｄｅｌ）を適用することによって周波数マスキング曲線を計算するステップとを有利に含み、上記心理音響的規準は、スペクトル帯域中のマスキング曲線について、推定されたスペクトルエンベロップのレベルを参照する。

実施態様において、符号化ビットは、第１のサブ群のＮ０個の符号化ビットが第２のサブ群の選択されたパラメータのＮ−Ｎ０個の符号化ビットに先行し、かつ第２のサブ群の選択されたパラメータの各符号化ビットがその中に上記符号化ビットについて決定された順序で現れるように、出力シーケンス中での順序付け行われる。これによって、バイナリシーケンスが切取られた場合に、最も重要な部分を受信することが可能となる。

数Ｎは、特に、例えば送信リソースの利用可能な容量の関数としてフレーム毎に異なっていてもよい。

本発明によるマルチレート音声符号化は、Ｎ０とＮｍａｘの範囲で自由に選択された送信されるビットの数を任意の瞬間で、すなわち、フレーム毎に選択できるため、非常に柔軟な階層的または切替可能なモードによって用いてもよい。

第１のサブ群のパラメータの符号化は可変ビットレートで行ってもよく、これにより数Ｎ０がフレーム毎に異なる。これによって、ビットの分布を、符号化されるフレームの関数として最良に調節することが可能となる。

実施態様において、第１のサブ群は、符号化器カーネルによって計算されたパラメータを含む。符号化器カーネルは符号化される信号の帯域幅よりも低い動作周波数帯域を有し、第１のサブ群は符号化器カーネルの動作帯域よりも高い周波数帯域に関連するエネルギーレベルの音声信号をさらに含むのが有利である。この種類の構造は、十分と思われる品質の符号化された信号を、例えば符号化器カーネルを介して送信し、また、符号化器カーネルによって行われる符号化を、利用可能なビットレートの関数として、本発明による符号化方法から生じる他の情報で補足する、２つの階層を有する階層的符号化器の構造である。

第１のサブ群の符号化ビットは次に、符号化器カーネルによって計算されたパラメータの符号化ビットの直後に、より高い周波数帯域に関連するエネルギーレベルの符号化ビットが来るように、出力シーケンス中で順序付けされるのが好ましい。これによって、復号器が、符号化器カーネルの情報と、より高い周波数帯域に関連付する符号化されたエネルギーレベルとを有するのに十分なビットを受信する限り、連続的に符号されたフレームに対する同一の帯域幅が保証される。

実施態様において、符号化される信号と符号化器カーネルによって生成された、符号化されたパラメータから導出された合成信号との間の差分信号が推定され、第１のサブ群は、符号化器カーネルの動作帯域中に含まれる周波数帯域に関連付する差分信号のエネルギーレベルをさらに含む。

本発明の第２の態様は、本発明の符号化方法によって符号化されたフレームの復号に対応するデジタルの音声信号を合成するようにバイナリの入力シーケンスを復号する方法に関する。この方法によれば、符号化ビットの最大数Ｎｍａｘが信号フレームを記述するためのパラメータ群について規定され、パラメータ群は第１のサブ群と第２のサブ群で構成される。バイナリの入力シーケンスは、１つの信号フレームあたり、前記パラメータ群につき、Ｎ’？ＮｍａｘであるＮ’個の符号化ビットを含む。本発明による復号方法は次のステップ、すなわち、
Ｎ０＜Ｎ’の場合、入力シーケンスのＮ’個のビットから、第１のサブ群のパラメータの符号化ビットの数Ｎ０を抽出するステップと、
抽出されたＮ０個の符号化ビットに基づいて、第１のサブ群のパラメータを回復するステップと、
第２のサブ群のパラメータ対するＮｍａｘ−Ｎ０個の符号化ビットの割当を決定するステップと、
第２のサブ群のパラメータに割当られたＮｍａｘ−Ｎ０個の符号化ビットを決定された順序でランク付けするステップと、
を含む。

割当および／またはＮｍａｘ−Ｎ０個の符号化ビットのランク付けの順序は、第１のサブ群の回復されたパラメータの関数として決定される。本復号方法はさらに以下のステップ、すなわち、
前記順序において第１にランク付けられたＮ’−Ｎ０個の符号化ビットが割当られた第２のサブ群のパラメータを選択するステップと、
入力シーケンスの前記Ｎ’個のビットから、第２のサブ群の選択されたパラメータのＮ’−Ｎ０個の符号化ビットを抽出するステップと、
抽出されたＮ’−Ｎ０個の符号化ビットに基づいて、第２のサブ群の選択されたパラメータを回復するステップと、
第１のサブ群と第２のサブ群の回復されたパラメータを用いることによって、信号フレームを合成するステップと、
を含む。

この復号方法は、符号化器によって事実上あるいは他の方法で生成されたＮｍａｘ個のビットのシーケンスの切取りのために欠落しているパラメータを再生する手順と有利なことに関連している。

本発明の第３の態様は、本発明による符号化方法を実施するように構成されたデジタル信号処理手段を備える音声符号化器に関する。

本発明の他の態様は、本発明による復号方法を実施するように構成されたデジタル信号処理手段を備える音声復号器に関する。

本発明の他の特徴および利点は、非限定的かつ例示的な実施形態に関する以下に述べる説明を添付図面と共に読めば明らかとなるであろう。

図１に示す符号化器は、２つの符号化段階を含む階層型構造を有する。第１の符号化段階１は、ＣＥＬＰ型の電話帯域（３００から３４００Ｈｚ）における例えば符号化器カーネル（ｃｏｄｅｒｋｅｒｎｅｌ）からなる。この符号化器はこの例においては、６．４ｋｂｉｔ／ｓの固定モードにおける、ＩＴＵ−Ｔ（「国際電気通信連合」）によって標準化されたＧ．７２３．１符号化器である。この符号化器は、この標準にしたがってＧ．７２３．１パラメータを計算し、３０ｍｓのフレーム毎に１９２個の符号化ビットＰ１によってこれらを量子化する。

帯域幅を広帯域化（５０から７０００Ｈｚ）することを可能にする第２の符号化段階２は、図１中の減算器３によって与えられる、第１の段階で符号化されていない信号（ｃｏｄｉｎｇｒｅｓｉｄｕａｌ）Ｅ上で動作する。信号同期化モジュール４は、符号化器カーネル１の処理によって費やされる時間だけ音声信号フレームＳを遅延する。その出力は、減算器３へとアドレス指定され、減算器３は、この出力から、符号化器カーネルの出力ビットＰ１によって表される量子化パラメータに基づいて動作する復号器カーネルの出力に等しい合成信号Ｓ’を差し引く。例のごとく、符号化器１は、Ｓ’を出力するローカル復号器を含む。

符号化される音声信号Ｓは、１６ｋＨｚでサンプリングされる、例えば７ｋＨｚの帯域幅を有する。１つのフレームは、例えば９６０個のサンプル、すなわち、６０ｍｓの信号または符号化器カーネルＧ．７２３．１の２つの基本フレームからなる。符号化器カーネルＧ．７２３．１は８ｋＨｚでサンプリングされる信号上で動作するため、信号Ｓは、符号化器カーネル１の入力において、係数（ｆａｃｔｏｒ）２でサブサンプリングされる。同様に、合成信号Ｓ’は、符号化器カーネル１の出力において、１６ｋＨｚでオーバーサンプリングされる。

第１の段階１のビットレートは、６．４ｋｂｉｔ／ｓ（２×Ｎ１＝２×１９２＝３８４ビット／フレーム）である。符号化器の最大ビットレートが３２ｋｂｉｔ／ｓ（Ｎｍａｘ＝１９２０ビット／フレーム）である場合、第２の段階の最大ビットレートは２５．６ｋｂｉｔ／ｓ（１９２０−３８４＝１５３６ビット／フレーム）である。第２の段階２は、例えば、２０ｍｓ（１６ｋＨｚにおいて３２０サンプル）の基本フレームまたはサブフレーム上で動作する。

第２の段階２は、減算器３によって得られた残りの信号Ｅがアドレス指定される、例えばＭＤＣＴ（「変形離散コサイン変換」（ＭｏｄｉｆｉｅｄＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ））型の時間／周波数変換モジュール５を含む。実際、図１に示すモジュール３および５の動作方法は、２０ｍｓの各サブフレームについて以下の動作を行うことにより達成される。
−３２０個のＭＤＣＴ係数を出力するモジュール４によって遅延された入力信号ＳのＭＤＣＴ変換。スペクトルは７２２５Ｈｚに限定され、最初の２８９個のＭＤＣＴ係数のみが０と異なる。
−合成信号Ｓ’のＭＤＣＴ変換。電話帯域信号のスペクトルが取り扱われるため、最初の１３９個のＭＤＣＴ係数のみが０（最大で３４５０Ｈｚ）と異なる。
−以前のスペクトル（複数）間のスペクトル差の計算。

得られたスペクトルは、幅が異なるいくつかの帯域内にモジュール６によって、分散される。例示にすぎないが、Ｇ．７２３．１コーデックの帯域幅を２１個の帯域に細分割し、より高い周波数を１１個の追加の帯域に分散しても酔い。これらの１１個の追加の帯域では、残余Ｅは入力信号Ｓと同じである。

モジュール７は、残余Ｅのスペクトルエンベロップの符号化を行う。これは、前記スペクトル差の各帯域のＭＤＣＴ係数のエネルギーを計算することによって開始される。これらのエネルギーを以下では「スケールファクタ」と呼ぶ。これら３２個のスケールファクタは、差分信号のスペクトルエンベロップを構成している。モジュール７は次に、それらを２つの部分に量子化することに進む。第１の部分は、電話帯域（０から３４５０Ｈｚの最初の２１個の帯域）に対応し、第２の部分は、高帯域（３４５０から７２２５Ｈｚ最後の１１個の帯域）に対応する。各部分では、第１のスケールファクタは可変ビットレートによる従来のホフマン符号化を用いることによって、絶対ベースで量子化され、後続のものは差分ベースで量子化される。これらの３２個のスケールファクタは、ランクｉ（ｉ＝１、２、３）の各サブフレームについて、ビットＰ２の可変数Ｎ２（ｉ）について量子化される。

これらの量子化されたスケールファクタは図１で、ＦＱで示されている。符号化器カーネル１の量子化されたパラメータおよび量子化されたスケールファクタＦＱからなる第１のサブ群の量子化ビットＰｌおよびＰ２は、数Ｎ０＝（２×Ｎ１）＋Ｎ２（１）＋Ｎ２（２）＋Ｎ２（３）と可変である。差Ｎｍａｘ−Ｎ０＝１５３６−Ｎ２（１）−Ｎ２（２）−Ｎ２（３）は、帯域のスペクトル（複数）をより細かく量子化するのに利用可能である。

モジュール８は、モジュール６によって帯域中に分散されたＭＤＣＴ係数を、これらを、これらの帯域についてそれぞれ求められた量子化スケールファクタＦＱによって除算することによって正規化する。このようにして正規化されたスペクトル（複数）は、公知の種類のベクトル量子化方式を用いる量子化モジュール９に与えられる。モジュール９から生じる量子化ビットは図１では、Ｐ３で示されている。

出力マルチプレクサ１０は、モジュール１、７、および９から生じるビットＰ１、Ｐ２、およびＰ３を一緒に集めて、符号化器のバイナリの出力シーケンスΦを形成する。

本発明によれば、現在のフレームを表す出力シーケンスのビットの総数Ｎは、Ｎｍａｘに必ずしも等しくなくてもよい。Ｎｍａｘよりも小さくてもよい。しかし、量子化ビットのこれらの帯域への割当ては、数Ｎｍａｘに基づいて行われる。

図ｌにおいて、この割当は、量子化スケールファクタＦＱと、モジュール１１によって計算されたスペクトルマスキング曲線との数Ｎｍａｘ−Ｎ０に基づいて各サブフレームについて、モジュール１２によって行われる。

モジュール１１の動作は以下の通りである。まず、量子化されたモジュール１１は、モジュール７と、符号化器カーネルから生じる合成信号Ｓ’に対する同じ差分信号分解能で決定する原スペクトルエンベロップとに基づいて、信号Ｓの原スペクトルエンベロップの概略値を決定する。これらの最後の２つのエンベロップは、上記第１のサブ群のパラメータのみが与えられる復号器によっても決定可能である。したがって、信号Ｓの推定されたスペクトルエンベロップは、復号器でも利用可能となる。その後、モジュール１１は、帯域聴覚によるモデルをそれ自身公知の方法で推定された原スペクトルエンベロップに適用することにより、スペクトルマスキング曲線を計算する。この曲線１ｌにより、考慮している各帯域のマスキングレベルが得られる。

モジュール１２は、差分信号の３つのＭＤＣＴ変換の３×３２個の帯域中のシーケンスΦのＮｍａｘ−Ｎ０個の残余ビットの動的割当てを実行する。上述した本発明の実施において、各帯域中のマスキング曲線について推定されたスペクトルエンベロップのレベルを参照する心理音響的知覚の重要性の規準の関数として、このレベルに比例するビットレートが各帯域に割当てられる。他のランク付け規準を用いることができるであろう。

このビット割当ての後、モジュール９は、何ビットを各サブフレーム中の各帯域の量子化について考慮すべきかを知る。

しかし、Ｎ＜Ｎｍａｘの場合、これらの割当られたビットは必ずしも全て用いられない。これらの帯域を表すビットの順序付けは、知覚の重要性の規準の関数としてモジュール１３によって行われる。モジュール１３は、これは、信号対マスク比（推定されたスペクトルエンベロップと各帯域中のマスキング曲線との間の比）の降順であってもよい重要性の降順に、３×３２個の帯域をランク付けする。この順序は、本発明にしたがってバイナリのシーケンスΦの構築に用いられる。

現在のフレームの符号化のためのシーケンスΦ中の所望の数Ｎのビットの一機能として、モジュール９によって量子化される帯域がモジュール１３によって１番目にランク付けされた帯域を選択し、例えば、モジュール１２により決定された選択された複数ビットを各帯域について保持することによって、決定される。

その後、選択された各帯域のＭＤＣＴ係数は、Ｎ−Ｎ０に等しいビット総数を生成するように、割当られたビット数にしたがって、例えばベクトル量子化器の助けによりモジュール９によって量子化される。

出力マルチプレクサ１０は図２（Ｎ＝Ｎｍａｘの場合）に示す以下のように順序付けられたシーケンスの第１のＮビットからなるバイナリのシーケンスΦを構築する。

ａ／まず、２つのＧ．７２３．１フレーム（３８４ビット）に対応するバイナリ列；
ｂ／次に、２２番目のスペクトル帯域（電話帯域を超えた第１の帯域）から３２番目の帯域（可変レートホフマン符号化）へ、３つのサブフレーム（ｉ＝１、２、３）についての、スケールファクタの量子化のためのビット；

ｃ／次に、第１のスペクトル帯域から２１番目の帯域（可変レートホフマン符号化）へ、３つのサブフレーム（ｉ＝１、２、３）についての、スケールファクタの量子化のためのビット；

ｄ／最後に、最も重要な帯域から重要性が最も低い帯域へ、モジュール１３によって決定された順序に合わせて、知覚の重要性の順序での９６個の帯域のベクトル量子化の指数Ｍ_c1、Ｍ_c2、．．．、Ｍ_c96。

最初に（ａおよびｂ）、Ｇ．７２３．１パラメータおよび高帯域のスケールファクタを配置することにより、これらのグループａおよびｂの受信に対応する最小値を超えた実際のビットレートに関係なく、復号器によって回復可能な信号について同じ帯域幅を保持することが可能となる。Ｇ．７２３．１の符号化に加えて高帯域の３×１ｌ＝３３個のスケールファクタのホフマン符号化にとって十分なこの最小値は、例えば８ｋｂｉｔ／ｓである。

上述した符号化方法によって、復号器がＮ０？Ｎ'？ＮであるＮ'個のビットを受信した場合、フレームの復号が可能となる。この数Ｎ'は、通常フレーム毎に可変である。

この例に対応する、本発明による復号器が図３に示されている。デマルチプレクサ２０は、受信されたビットのシーケンスΦ’を、そこから符号化ビットＰ１およびＰ２を抽出するように分離する。３８４個のビットＰ１がＧ．７２３．１型の復号器カーネル２１へと供給されることで、復号器カーネル２１は電話帯域中のベース信号Ｓ’の２つのフレームを合成する。ビットＰ２は、ホフマンアルゴリズムにしたがってモジュール２２によって復号され、モジュール２２は、このようにしてこれら３つのサブフレームのそれぞれについて量子化されたスケールファクタＦＱを回復する。

図１の符号化器のモジュール１１と同一である、マスキング曲線を計算するモジュール２３は、ベース信号Ｓ’と量子化されたスケールファクタＦＱを受信し、９６個の帯域それぞれについてスペクトルマスキングレベルを生成する。量子化されたスケールファクタＦＱのマスキングレベルと、数Ｎｍａｘの情報（およびビットＰ２のホフマン復号からモジュール２２によって推定された数Ｎ０の情報）に基づいて、モジュール２４は、図１のモジュール１２と同じ方法でビット割当を決定する。さらに、モジュール２５は、図１を参照して述べたモジュール１３と同じランク付け規準による帯域の順序付けへと進む。

モジュール２４および２５によって与えられた情報にしたがって、モジュール２６は、入力シーケンスΦ’のビットＰ３を抽出し、シーケンスΦ’中に表された帯域に関する正規化されたＭＤＣＴ係数を合成する。適切な（Ｎ’＜Ｎｍａｘ）場合、欠落した帯域に関する標準化されたＭＤＣＴ係数を以下に述べる内挿または外挿（モジュール２７）によって、さらに合成できる。これらの欠落した帯域は、Ｎ＜Ｎｍａｘに切取るために符号化器によって削除されるか、または、送信（Ｎ’＜Ｎ）中に削除されている。

モジュール２６および／またはモジュール２７によって合成された、標準化されたＭＤＣＴ係数は、符号化器のモジュール５によって行なわれるＭＤＣＴ変換の逆である周波数／時間変換を行うモジュール２９に提示される前に、それらの各量子化されたスケールファクタと乗算される（乗算器２８）。これから得られた時間的補正信号は、復号器カーネル２１によって送信された合成信号Ｓ’に加算され（加算器３０）、復号器の出力音声信号

が生成される。

復号器は、それがシーケンスの第１のＮ０個のビットを受信しない場合にも信号

を合成できる点に留意されたい。

復号器が、上述した聴取の部分ａに対応する２×Ｎ１個のビットを受信すれば十分であり、復号はしたがって「劣化（ｄｅｇｒａｄｅｄ）」モードとなる。この劣化モードのみが、復号された信号を得るのにＭＤＣＴ合成を用いない。このモードとその他のモードとの間の切替えを休止期間なしで行なうようにするために、復号器は、３つのＭＤＣＴ解析を行った後に３つのＭＤＣＴ合成を行い、これによって、ＭＤＣＴ変換のメモリの更新を可能にする。その出力信号は電話帯域品質の信号を含む。第１の２×Ｎ１個のビットさえも受信されなかった場合、復号器は対応するフレームが削除されたと見なし、削除されたフレームを推定する公知のアルゴリズムを用いることができる。

復号器が部分ａに部分ｂのビットを足したものに対応する２×Ｎｌ個のビット（３つのスペクトルエンベロップの高帯域）を受信した場合、この復号器は、広帯域の信号の合成を開始できる。復号器は特に以下のように処理を進めることができる。

１／モジュール２２は受信された３つのスペクトルエンベロップの部分を回復する。

２／受信されなかった帯域は、一時的にゼロにセットされたそれらのスケールファクタを有する。

３／スペクトルエンベロップの低い帯域がＧ．７２３．１の復号の後に得られた信号上で行われたＭＤＣＴ解析に基づいて計算され、モジュール２３はこのようにして得られたエンベロップ上の、これら３つのマスキング曲線を計算する。

４／スペクトルエンベロップは、受信されなかった帯域に起因するゼロ値を回避することによって、調整するように（ｒｅｇｕｌａｒｉｚｅ）修正される。スペクトルエンベロップＦＱの高い部分中のゼロ値は、例えば、以前に計算されたマスキング曲線の１００番目の値に置き換えられ、これによってそれらは依然として聴取できない。低帯域の全スペクトルと高帯域のスペクトルエンベロップは、この際知られている。

５／モジュール２７は次に高スペクトルを生成する。これらの帯域の微細な構造は、スケールファクタによって重み付けする（乗算器２８）前にその既知の近傍の微細な構造を考慮（ｒｅｆｌｅｃｔｉｏｎ）することによって生成される。ビットＰ３のうちいずれも受信されない場合、この「既知の近傍」は、Ｇ．７２３．１復号器カーネルによって生成された信号Ｓ’のスペクトルに対応する。この「考慮」は、標準化されたＭＤＣＴスペクトルの、ばらつきが、「既知の近傍」からの距離に比例して小さくなる値を複製することである。

６／逆方向ＭＤＣＴ変換（２９）および得られた修正信号の復号器カーネルの出力信号への加算（３０）の後、広帯域の合成信号が得られる。

復号器が差分信号の少なくとも低スペクトルエンベロップの部分（部分ｃ）も受信した場合、復号器は、ステップ３におけるスペクトルエンベロップを純化する（ｒｅｆｉｎｅ）のに、この情報を考慮してもよいし、考慮しなくてもよい。

復号器１０がシーケンスの部分ｄ中で１番目にランクされた、最も重要な帯域の少なくともＭＤＣＴ係数を復号するために十分なビットＰ３を受信した場合、モジュール２６は、モジュール２４および２５によって示される割当ておよび順序付けに従って、正規化されたＭＤＣＴ係数の特定の部分を回復する。したがって、これらのＭＤＣＴ係数は、上述したステップ５におけるように内挿する必要はない。他の帯域の場合、ステップ１から６のプロセスは上記したのと同様にしてモジュール２７によって適用可能であり、特定の帯域の受信されたＭＤＣＴ係数を知ることによって、ステップ５における内挿の信頼性が向上する。

受信されなかった帯域は、１つのＭＤＣＴサブフレームと次のＭＤＣＴサブフレームとで異なることもある。欠落した帯域の「既知の近傍」は、他のサブフレーム中の欠落していない同じ帯域および／または同じサブフレーム中の周波数ドメインで最も近い１つまたは２つ以上の帯域に対応することがある。「既知の近傍」のいくつかの帯域／サブフレームに基づいて評価された貢献の重み付け総計を計算することによって、サブフレームについての帯域から欠落しているＭＤＣＴスペクトルを再生することも可能である。

フレーム当りＮ’個のビットの実際のビットレートが所与のフレームの最後のビットを任意に配置している限りにおいて、送信された最後の符号化されたパラメータは、場合に応じて、全体または一部を送信してもよい。次の２つの場合が生じる。
−採用された符号化構造が、受信された部分的な情報の使用を可能にする場合（スカラー量子化器または区分された辞書を備えたベクトル量子化の場合）か、または、
−採用された符号化構造がそれを可能にせず、完全には受信されなかったパラメータが受信されなかった他のパラメータと同様に処理される場合。後者の場合、ビットの順序が各フレームによって異なる場合、このようにして失われたビットの数は可変であり、Ｎ’個のビットを選択することによって、復号されたフレーム全セットの平均が得られ、より少数のビットによって得られるであろう品質よりも高い品質が得られる点に留意されたい。

本発明による例示的な音声符号化器の模式図である。本発明の一実施形態によるＮ個のビットのバイナリ出力シーケンスを示す。本発明による音声復号器の模式図である。

Claims

符号化ビットの最大数Ｎｍａｘが、デジタル音声信号フレームにしたがって計算できるパラメータ群について定められ、前記パラメータ群は第１のサブ群と第２のサブ群から構成される、前記デジタル音声信号フレーム（Ｓ）をバイナリの出力シーケンス（Φ）として符号化する方法であって、
前記第１のサブ群のパラメータを計算し、これらのパラメータをＮ０＜Ｎｍａｘとなるような符号化ビットの数Ｎ０だけ符号化するステップと、
前記第２のサブ群のパラメータに対するＮｍａｘ−Ｎ０個の符号化ビットの割当を決定するステップと、
前記第２のサブ群のパラメータに割当られた前記Ｎｍａｘ−Ｎ０個の符号化ビットを定められた順序でランク付けするステップと、
を含み、
前記Ｎｍａｘ−Ｎ０個の符号化ビットの割当および／またはランク付けの順序が前記第１のサブ群の符号化されたパラメータの関数として決定され、前記パラメータ群の符号化のために使用可能な前記バイナリの出力シーケンスの、Ｎ０＜Ｎ？Ｎｍａｘである、ビット数Ｎを示すことに応答して、さらに、
前記順序において１番目にランク付けされた前記Ｎ−Ｎ０個の符号化ビットが割当られた前記第２のサブ群のパラメータを選択するステップと、
前記第２のサブ群の前記選択されたパラメータを計算し、１番目にランク付けされた前記Ｎ−Ｎ０個の符号化ビットを生成するようにこれらのパラメータを符号化するステップと、
前記第１のサブ群のＮ０個の符号化ビットと前記第２のサブ群の前記選択されたパラメータのＮ−Ｎ０個の符号化ビットを前記出力シーケンスに挿入するステップと、
を有する方法。
前記第２のサブ群のパラメータに割当られた符号化ビットのランク付けの順序はフレーム毎に可変である、請求項１記載の方法。
Ｎ＜Ｎｍａｘである、請求項１または２記載の方法。
前記第２のサブ群のパラメータに割当られた符号化ビットのランク付けの順序は、少なくとも前記第１のサブ群の符号化されたパラメータの関数として決定された重要性の降順である、請求項１から３のいずれか１項に記載の方法。
前記第２のサブ群のパラメータに割当られた符号化ビットのランク付けの順序は、前記第１のサブ群の符号化されたパラメータの関数として少なくとも１つの心理音響的規準の助けにより決定される、請求項４記載の方法。
前記第２のサブ群のパラメータは前記信号のスペクトル帯域に関連し、前記符号化された信号のスペクトルエンベロップは前記第１のサブ群の符号化されたパラメータに基づいて推定され、周波数マスキングの曲線が前記推定されたスペクトルエンベロップに聴覚モデルを適用することにより計算され、前記心理音響的規準は各スペクトル帯域中の前記マスキング曲線について、前記推定されたスペクトルエンベロップのレベルを参照する、請求項５記載の方法。
Ｎｍａｘ＝Ｎである、請求項４から６のいずれか１項に記載の方法。
前記符号化ビットは、前記第１のサブ群のＮ０個の符号化ビットが前記第２のサブ群の前記選択されたパラメータのＮ−Ｎ０個の符号化ビットに先行し、かつ前記第２のサブ群の前記選択されたパラメータの各符号化ビットが前記符号化ビットについて決定された順序でその中に現れるように前記出力シーケンス中で順序付けされる、請求項１から７のいずれか１項に記載の方法。
前記数Ｎはフレーム毎に異なる、請求項１から８のいずれか１項に記載の方法。
前記第１のサブ群のパラメータの符号化は可変のビットレートで行われ、これにより、前記数Ｎ０がフレーム毎に異なる、請求項１から９のいずれか１項に記載の方法。
前記第１のサブ群は、符号化器カーネル（１）によって計算されたパラメータを含む、請求項１から１０のいずれか１項に記載の方法。
前記符号化器カーネル（１）は前記符号化される信号の帯域幅よりも低い動作周波数帯域を有し、前記第１のサブ群は前記符号化器カーネルの動作帯域よりも高い周波数帯域に関連するエネルギーレベルの前記音声信号をさらに含む、請求項１１記載の方法。
前記第１のサブ群の符号化ビットは、前記符号化器カーネルによって計算されたパラメータの符号化ビットの直後に前記のより高い周波数帯域に関連する前記エネルギーレベルの符号化ビットが来るように、前記出力シーケンス中において順序付けされる、請求項８および１２のいずれかに記載の方法。
前記符号化される信号と、前記符号化器カーネルによって生成された符号化されたパラメータから導出された合成信号との差分信号が推定され、前記第１のサブ群は、前記符号化カーネルの動作帯域中に含まれる周波数帯域に関連するエネルギーレベルの差分信号をさらに含む、請求項１１から１３のいずれか１項に記載の方法。
前記第１のサブ群の符号化ビットは、前記符号化カーネル（１）によって計算されたパラメータの符号化ビットの後ろに前記周波数帯域に関連するエネルギーレベルの符号化ビットが来るように、前記出力シーケンス中において順序付けされる、請求項８および請求項１２から１４のいずれか１項に記載の方法。
符号化ビットの最大数Ｎｍａｘが信号フレームを記述するためのパラメータ群について規定され、前記パラメータ群は第１のサブ群と第２のサブ群で構成され、バイナリの入力シーケンスが、１つの信号フレームあたり、前記パラメータ群につき、Ｎ’？ＮｍａｘであるＮ’個の符号化ビットを含む、前記バイナリの入力シーケンス（Φ’）を、デジタル音声信号

を合成するように復号する方法であって、
Ｎ０＜Ｎ’の場合、前記入力シーケンスの前記Ｎ’個のビットから、前記第１のサブ群のパラメータの符号化ビットの数Ｎ０を抽出するステップと、
抽出された前記Ｎ０個の符号化ビットに基づいて、前記第１のサブ群のパラメータを回復するステップと、
前記第２のサブ群のパラメータ対するＮｍａｘ−Ｎ０個の符号化ビットの割当を決定するステップと、
前記第２のサブ群のパラメータに割当られたＮｍａｘ−Ｎ０個の符号化ビットを定められた順序でランク付けするステップと、
を含み、
前記割当および／または前記Ｎｍａｘ−Ｎ０個の符号化ビットのランク付けの順序は、前記第１のサブ群の回復されたパラメータの関数として決定され、さらに
前記順序において１番目にランク付けされた前記Ｎ’−Ｎ０個の符号化ビットが割当られた前記第２のサブ群のパラメータを選択するステップと、
前記入力シーケンスの前記Ｎ’個のビットから、前記第２のサブ群の選択されたパラメータのＮ’−Ｎ０個の符号化ビットを抽出するステップと、
前記抽出されたＮ’−Ｎ０個の符号化ビットに基づいて、前記第２のサブ群の選択されたパラメータを回復するステップと、
前記第１のサブ群と第２のサブ群の回復されたパラメータを用いることによって、前記信号フレームを合成するステップと、
有する方法。
前記第２のサブ群のパラメータに割当られた符号化ビットのランク付けの順序はフレーム毎に可変である、請求項１６記載の方法。
Ｎ’＜Ｎｍａｘである、請求項１６または１７記載の方法。
前記第２のサブ群のパラメータに割当られた符号化ビットのランク付けの順序は、前記第１のサブ群の、少なくとも、回復された符号化パラメータの関数として決定された重要性の降順である、請求項１６から１８のいずれか１項に記載の方法。
前記第２のサブ群のパラメータに割当られた符号化ビットのランク付けの順序は、前記第１のサブ群の符号化パラメータの関数として少なくとも１つの心理音響的規準の助けにより決定される、請求項１９記載の方法。
前記第２のサブ群のパラメータは前記信号のスペクトル帯域に関連し、前記信号のスペクトルエンベロップは前記第１のサブ群の回復されたパラメータに基づいて推定され、周波数マスキングの曲線が前記推定されたスペクトルエンベロップに聴覚モデルを適用することにより計算され、前記心理音響的規準は各スペクトル帯域中の前記マスキング曲線について前記推定されたスペクトルエンベロップのレベルを参照する、請求項２０記載の方法。
前記第１のサブ群のパラメータのＮ０個の符号化ビットは、前記第２のサブ群の選択されたパラメータのＮ’−Ｎ０個の符号化ビットが抽出された位置より前の前記シーケンスの位置で受信されたＮ’個のビットから抽出される、請求項１６から２１のいずれか１項に記載の方法。
前記信号フレームを合成するために、前記第２のサブ群の選択されなかったパラメータが、抽出された前記Ｎ’−Ｎ０個の符号化ビットに基づいて回復された、少なくとも、選択されたパラメータに基づいて、内挿によって推定される、請求項１６から２１のいずれか１項に記載の方法。
前記第１のサブ群が復号器カーネル（２１）の入力パラメータを含む、請求項１６から２３のいずれか１項に記載の方法。
前記符号器カーネル（２１）は前記の合成される信号の帯域幅よりも低い動作周波数帯域を有し、前記第１のサブ群は、前記符号化器カーネルの動作帯域よりも高い周波数帯域に関連するエネルギーレベルの前記音声信号をさらに含む、請求項２４記載の方法。
前記第１のサブ群の前記符号化ビットは、前記符号化器カーネル（２１）の入力パラメータの前記符号化ビットの直後に前記のより高い周波数帯域に関連するエネルギーレベルの符号化ビットが来るように、前記出力シーケンス中で順序付けされる、請求項２２または２５に記載の方法。
前記入力シーケンス（Φ’）のＮ’個のビットが、前記復号器カーネル（２１）の入力パラメータの符号化ビットと、前記のより高い周波数帯域に関連するエネルギーレベルの符号化ビットの少なくとも一部に限定される場合に、
前記入力シーケンスから、前記復号器カーネルの入力パラメータの符号化ビットと、前記エネルギーレベルの符号化ビットの前記一部とを抽出するステップと、
前記復号器カーネル中のベース信号（Ｓ’）を合成し、前記抽出された符号化ビットに基づいて、前記のより高い周波数帯域に関連するエネルギーレベルを回復するステップと、
前記ベース信号のスペクトルを計算するステップと、
前記入力シーケンス中の符号化されていないエネルギーレベルに関連するより高い各帯域にエネルギーレベルを割当てるステップと、
前記対応するエネルギーレベルと、前記スペクトルの少なくとも１つの帯域中の前記ベース信号のスペクトルとに基づいて、より高い各周波数帯域についてスペクトル成分を合成するステップと、
ベース信号修正信号を得るために前記合成されたスペクトル成分を時間ドメインへ変換するステップと、
前記ベース信号と前記修正信号とを加算して前記信号フレームを合成するステップと、
を含む、請求項２６記載の方法。
前記入力シーケンス中の符号化されていないエネルギーレベルに関連するより高い帯域に割当られたエネルギーレベルは、前記ベース信号のスペクトルにしたがって計算された知覚マスキングレベルと、前記抽出された符号化ビットに基づいて回復されたエネルギーレベルとの一部である、請求項２７記載の方法。
ベース信号（Ｓ’）が前記復号器カーネルで合成され、前記第１のサブ群が前記合成される信号と前記ベース信号との差分信号の、前記符号化器カーネルの動作帯域に含まれる周波数帯域に関連するエネルギーレベルをさらに含む、請求項２４から２８のいずれか１項に記載の方法。
Ｎ０＜Ｎ’＜Ｎｍａｘの場合、周波数帯域中のスペクトル成分に関連する、前記第２のサブ群の選択されなかったパラメータが、前記ベース信号の計算されたスペクトルおよび／または前記抽出されたＮ’＜Ｎ０個の符号化ビットに基づいて回復された、選択されたパラメータの助けにより推定される、請求項２５、２６および２９のいずれか１項に記載の方法。
周波数帯域中の前記第２のサブ群の前記選択されなかったパラメータが、前記入力シーケンスのＮ’個の符号化ビットに基づいて決定される、前記帯域のスペクトル近傍の助けによって推定される、請求項３０に記載の方法。
前記復号器カーネル（２１）の前記入力パラメータの前記符号化ビットは、前記周波数帯域に関連するエネルギーレベルの符号化ビットが抽出された位置より前の前記シーケンスの位置で受信されたＮ’個のビットから抽出される、請求項２２および請求項２５から３１のいずれか１項に記載の方法。
前記数Ｎ’はフレーム毎に異なる、請求項１６から３２のいずれか１項に記載の方法。
前記数Ｎ０はフレーム毎に異なる、請求項１６から３３のいずれか１項に記載の方法。
請求項１から１５のいずれか１項に記載の符号化方法を実行するように構成されたデジタル信号処理手段を備えた音声符号化器。
請求項１６から３４のいずれか１項に記載の復号方法を実行するように構成されたデジタル信号処理手段を備えた音声復号器。