JP7104749B2

JP7104749B2 - 最下位ビットの符号化および復号に適合するオーディオ符号化器、オーディオ復号器、方法、およびコンピュータプログラム

Info

Publication number: JP7104749B2
Application number: JP2020118838A
Authority: JP
Inventors: ラヴェッリ・エマニュエル; フックス・ギヨーム; シュネル・マーカス; トマシェク・アドリアン; ガイアスバーガー・ステファン
Original assignee: フラウンホーファー－ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 2017-11-10
Filing date: 2020-07-10
Publication date: 2022-07-21
Anticipated expiration: 2038-11-08
Also published as: CA3148999A1; SG11202004287YA; RU2020119054A3; EP4336502A3; ZA202004584B; EP4336503A2; KR102492557B1; RU2020120251A3; CA3082282A1; SG11202004279TA; US20200273472A1; JP7104785B2; JP2021005086A; EP4336502A2; MX2020004768A; ZA202004583B; CA3082282C; EP3707710A1; JP2020204771A; RU2020120256A

Description

本発明にかかる実施形態は、符号化されたオーディオ情報に基づいて復号されたオーディオ情報を提供するオーディオ復号器に関する。

本発明にかかるさらなる実施形態は、入力オーディオ情報に基づいて符号化されたオーディオ情報を提供するオーディオ符号化器に関する。

本発明にかかるさらなる実施形態は、符号化されたオーディオ情報に基づいて復号されたオーディオ情報を提供する方法に関する。

本発明にかかるさらなる実施形態は、入力オーディオ情報に基づいて符号化されたオーディオ情報を提供する方法に関する。

本発明にかかるさらなる実施形態は、それぞれのコンピュータプログラムに関する。

本発明にかかる実施形態は、算術符号化されたオーディオデータの改良されたトランケーションに関する。

過去には、オーディオコンテンツの符号化および復号に関する多くの異なるコンセプトが開発されてきた。

例えば、新たなＢｌｕｅｔｏｏｔｈコーデック（ＮＢＣ）は、３ＧＰＰＥＶＳ標準［１］において使用されるＭＤＣＴベースのＴＣＸオーディオコーデックに非常に類似したオーディオコーデックである。双方とも、ＭＤＣＴデータのコーディングにスカラー量子化とコンテキストベースの算術符号化（例えば、参考文献［２］から［４］を参照）とを採用している。

スカラー量子化器は、ステップサイズが固有のグローバルゲイン（例えば、サイド情報として復号器に送信される）によって制御される単純な均一量子化器（追加のデッドゾーン付き）である。このグローバルゲインは、スカラー量子化器によって導入される歪みと、算術符号化器によって消費されるビット数との双方を制御する。グローバルゲインが高いほど、歪みが大きくなり、算術符号化器によって消費されるビット数が少なくなる。

ＥＶＳでは、他のほとんどの通信コーデックと同様に、コーデックのビットレートは一定である。すなわち、ＭＤＣＴデータの符号化に利用可能なビット数（ビットバジェット）には制限がある。

その結果、符号化器は、低すぎないグローバルゲインを見つけるべきであり（または見つける必要がある）、そうでなければ、算術符号化器によって消費されるビット数は、ビットバジェットを超えるであろう。また、高すぎないグローバルゲインを見つけるべきであり（または見つける必要がある）、そうでなければ、量子化によって導入される歪みが大きくなり、復号された出力信号の知覚品質の低下をもたらす。

理想的には、符号化器は、フレームごとに最適なグローバルゲインを見つけるべきである：その１つは、ビットバジェットを下回るビット数を生成しながら最小の歪みを与える。

この目標は、例えば、レートループとしても知られる、すなわち、ループの反復ごとに反復アプローチを使用して達成されることができ、ＭＤＣＴデータが再量子化され、算術符号化器によって消費されるビット数が推定され、グローバルゲインがビット数および／または歪みの関数として調整される。

しかしながら、レートループは、計算が複雑であり、複雑さを軽減するために、通常は少数の反復が使用される。これは、非常に低い計算の複雑さを必要とする非常に低消費電力の通信コーデック（例えば、新たなＢｌｕｅｔｏｏｔｈコーデック）に特に関連している。したがって、実際には、次善のグローバルゲインが通常見つかる。

場合によっては、見つかったグローバルゲインが高すぎて、ビットバジェットよりも大幅に低い消費されるビット数をもたらすことがわかっている。この場合、未使用のいくつかのビットがある。これらのビットは、実際には「残差量子化／コーディング」と呼ばれる追加のツール（例えば、ＥＶＳおよびＮＢＣにおいて使用される）によって使用されることができる。このツールは、１ビットのプロ係数を使用して量子化された非ゼロ係数を調整し、グローバルゲインが高すぎても高すぎない歪みを得るのに役立つ。

さらに、他のいくつかの場合には、見つかったグローバルゲインが低すぎて、ビットバジェットを超える消費されたビット数をもたらすことがわかっている。この場合、量子化されたデータは、完全に符号化されることはできない。換言すれば、ビットバジェット内にとどまるためには、データの一部が除外される必要がある。ＥＶＳ標準（および現在はＮＢＣにおいても）において採用されている解決策は、高周波非ゼロ係数をゼロに設定することによってそれらを切り捨てることである。算術符号化器は、（最後の非ゼロ係数インデックスを使用して）高周波ゼロ係数の部分を符号化しないため、このアプローチは、ビットを節約することを可能にし、十分な高周波非ゼロ係数が切り捨てられる場合、これは、ビットバジェット内にとどまることを可能にする。

高周波係数は、知覚的にそれほど重要ではなく、知覚品質の大幅な低下を有さずに、ランダムノイズ（ノイズフィリングツールを使用して、例えば、ＥＶＳ［１］を参照）によって置き換えられることができるため、このアプローチは、低ビットレートにおいて良い結果をもたらすことがわかっている。

しかしながら、高ビットレートでは、このアプローチは、コーデックのパフォーマンスを大幅に低下させる可能性があることもわかっている。
この状況を考慮すると、オーディオ品質、複雑さ、およびビットレートの間の改善されたトレードオフを可能にする概念を有することが望まれている。

本発明にかかる実施形態は、符号化されたオーディオ情報に基づいて復号されたオーディオ情報を提供するオーディオ復号器を形成する。オーディオ復号器は、これらのスペクトル値を表す符号化情報に基づいて復号されたスペクトル値を取得するように構成されている。オーディオ復号器は、算術復号を使用してスペクトル値のセットのそれぞれのシンボルコードに基づいて、スペクトル値ごと（例えば、量子化されたスペクトル値ごと）に２つ以上の最上位ビットを一緒に復号するように構成されている。それぞれのシンボルコードは、１つ以上のスペクトル値のスペクトル値ごとに２つ以上の最上位ビットを表す。オーディオ復号器は、（例えば、量子化されたスペクトル値とすることができる）１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが復号され、最下位ビットが、２つ以上の最上位ビットが復号され且つ２つ以上の最上位ビットよりも多いビットを含むために１つ以上の他のスペクトル値について復号されないように、利用可能な最下位ビット情報の量に応じて、スペクトル値のうちの１つ以上に関連付けられた１つ以上の最下位ビットを復号するように構成されている。さらに、オーディオ復号器は、（復号された）スペクトル値を使用して復号されたオーディオ情報を提供するように構成されている。

このオーディオ復号器は、オーディオ品質、複雑さおよびビットレートの間の適切なトレードオフを提供する効率的な符号化／復号コンセプトを可能にする。例えば、オーディオ復号器は、特定のビットバジェット制約の下でオーディオ符号化器側において全ての（量子化された）スペクトル値を符号化するためにビットバジェットが不十分であるケースを適切に処理することができる。

オーディオ復号器は、一部の（量子化された）スペクトル値の最下位ビットの符号化（および復号）を省略しながら、特定のビットバジェットについて、１つ以上の最上位ビットが多くのスペクトル値（さらには全ての非ゼロスペクトル）についても符号化（および復号）されると、比較的良好なオーディオ品質が達成されることができるという知見に基づいている。換言すれば、ビットバジェットが不十分である場合（例えば、量子化されたスペクトル値の完全な符号化のため）のオーディオ品質の劣化が、全スペクトル値の符号化が省略される解決策と比較すると、最下位ビットの符号化および復号が省略される場合により小さくなることが多いということが、本発明の重要なアイデアである。他の言い方をすれば、多くのスペクトル値の最下位ビットの符号化を省略することは、通常、比較的少ない数のスペクトル値の符号化を完全に省略することと比較した場合（高周波数領域のスペクトル値のみが省略される場合であっても）、ビット需要を削減する（ビットバジェット内に保つ）ためのさらにより良好な解決策であることがわかっている。他の言い方をすれば、本発明は、１つ以上の最上位ビットが復号されているスペクトル値の最下位ビットの復号を（選択的に）省略することが、通常は高周波数範囲におけるスペクトル値の符号化および復号の省略と比較して歪みが少なくなるビット需要を削減するための良い方法であるという知見に基づいている。

したがって、ここで説明するオーディオ復号器は、通常、ビットバジェットが量子化されたスペクトル値の完全な損失のない符号化には不十分なフレームにおいて、信号対雑音比の深刻な劣化をもたらさない。

さらに、この概念は、スペクトル値ごとに２つ以上の最上位ビットが一緒に符号化および復号される場合に特に効率的であることがわかっており、これは、この場合、最下位ビットが符号化および復号されていない場合であっても、最上位ビットが優れたオーディオ表現を可能にするために十分に意味のある情報を担持するためである。換言すれば、スペクトル値ごとに２つ以上の最上位ビットを一緒に復号することにより、例えば、高周波領域において２ビット未満で符号化されたオーディオコンテンツを導入することによって引き起こされるであろう過度のアーティファクトが発生しないようにすることができる。換言すれば、本明細書で述べた概念は、ビットレート、複雑さおよびオーディオ品質の間の優れた構成を提供することが見出された。

好ましい実施形態では、オーディオ復号器は、少なくとも１つのスペクトル値の少なくとも２つの最上位ビットを表す算術符号化表現の１つのシンボルを、少なくとも１つのスペクトル値の少なくとも２つの最上位ビットにマッピングするように構成されている。したがって、２つ以上の最上位ビットが、算術的に符号化された表現（符号化されたオーディオ情報の一部である）の単一シンボルによって表されることが達成されることができ、これにより、符号化／復号コンテキストおよび隣接する（量子化された）スペクトル値間の統計的依存関係の良好な考慮を可能にする。

好ましい実施形態では、算術復号は、少なくとも２つの最上位ビット（例えば、本明細書で「ｎｕｍｂｉｔｓ」および「ｎｕｍｂｉｔｓ－１」として指定される）のビット位置（例えば、ビット重み）を決定し、決定されたビット位置に対する算術符号化表現のシンボルによって決定された少なくとも２つの最上位ビットを割り当てるように構成されている。ビット位置は、例えば、「ＶＡＬ＿ＥＳＣ」として指定されることもできるいくつかのいわゆる「エスケープシンボル」に基づいて決定されることができる。例えば、ビット位置は、算術的に符号化された表現の異なるシンボルに対して個別に決定されてもよい。したがって、適切な数値の重みを最上位ビットに割り当てることができ、１つ以上の最下位ビットおよび１つ以上の中間ビット（１つ以上の最下位ビットと２つ以上の最上位ビットとの間にあるビット位置）がスペクトル値に関連付けられているかどうかを見出すこともできる。したがって、それぞれのスペクトル値の１つ以上の最下位ビット（および必要に応じて、それぞれのスペクトル値の１つ以上の中間ビット）の復号がなおも存在すべきかどうかを決定することができる。また、この概念を使用することにより、２つ以上の最上位ビットがスペクトル値を完全に表すのに十分であるようなスペクトル値の最下位ビットの符号化および復号を回避することができる。これは、例えば、（２つの最上位ビットがある場合）０から３の範囲内にあるスペクトル値に当てはまる。

好ましい実施形態において、オーディオ復号器は、２つ以上の最上位ビットが復号され、且つ２つ以上の最上位ビットおよび最下位ビットよりも多くのビットを含む全てのスペクトル値について、そのビット位置が最下位ビットと２つ以上の最上位ビットとの間にある１つ以上の中間ビットを復号するように構成されている。したがって、最下位ビットを除いて、量子化されたスペクトル値の２進数表現の全てのビットを復号することが可能である。例えば、全ての非ゼロスペクトル値について、最下位ビットを除いて、全てのスペクトル値のバイナリ（および場合によっては符号付き）数表現の全てのビットを復号することができる。したがって、スペクトルの良好な表現を得ることができ、各スペクトル値の最大誤差が、それぞれのスペクトル値の最下位ビットの符号化表現がビットレートの制約の有無に応じて符号化されたオーディオ表現に含まれることができるかどうかの問題とは無関係に、最下位ビットに制限されることが保証される。

好ましい実施形態では、オーディオ復号器は、第１の復号フェーズ（例えば、復号のステップ３）において、スペクトル値ごとに２つ以上の最上位ビット、および２つ以上の最上位ビットが復号され且つ２つ以上の最上位ビット（一緒に復号される）よりも多くのビットと最下位ビット、そのビット位置が最下位ビットと２つ以上の最上位ビットとの間にある１つ以上の中間ビットを含む全てのスペクトル値を復号するように構成されている。さらに、第１の復号フェーズでは、２つ以上の最上位ビットが復号され且つ２つ以上の最上位ビットと中間ビットが存在する限りは任意の中間ビットとが非ゼロ値を示す全てのスペクトル値について、符号が復号される。さらに、オーディオ復号器は、第１の復号フェーズでは、２つ以上の最上位ビットと中間ビットが存在する限りは任意の中間ビットとがゼロ値を示すスペクトル値の符号復号を選択的に省略するように構成されている。さらに、オーディオ復号器は、第１の復号フェーズに続く第２の復号フェーズ（例えば、復号のステップ６）では、２つ以上の最上位ビットと－中間ビットが存在する限りは－任意の中間ビットとがゼロ値を示し且つ最下位ビット情報が非ゼロ値を示すスペクトル値の符号情報を選択的に取得するように構成されている。

したがって、第１のフェーズにおいて復号されたそれらのビット（すなわち、存在する可能性がある２つ以上の最上位ビットと任意の中間ビット）が、スペクトル値の絶対値が最下位ビットの寄与よりも大きくないことを示す場合、符号なし復号が第１のフェーズにおいて行われる。したがって、符号復号は、最下位ビットの実際の復号まで延期される。そのような手順は、無駄に「早すぎる」符号復号が回避されるため有利であり、これは、ビットバジェットの枯渇により、それぞれのスペクトル値に対応する最下位ビットがビットストリームに含まれていない場合に当てはまることができる。

好ましい実施形態では、オーディオ復号器は、スペクトル値に関連する最下位ビット値を得るために、最下位ビット情報ビットシーケンス（例えば、ｌｓｂｓ［］）の後続ビットを順次使用するように構成されている。したがって、最下位ビット（必要に応じて任意の符号）を表す連続したビットシーケンスがあることが達成されることができる。このビットシーケンス（例えば、ｌｓｂｓ［］）を短くすることにより、符号化されたオーディオ表現の送信に必要なビットレートがオーディオ符号化器側で容易に調整されることができ、オーディオ復号器は、非常に容易に、複雑なビットマッピングなしに、そのようなビットレートの調整（または可変長もしくはｌｓｂｓ［］）に適応することができる。

好ましい実施形態では、オーディオ復号器は、２つ以上の最上位ビット値と中間ビットが存在する限りは任意の中間ビットとが非ゼロ値を示すそれぞれのスペクトル値について、最下位ビット情報ビットシーケンス（例えば、ｌｓｂｓ［］）の単一ビット（例えば、ステップ６、ｂｉｔ０）を使用するように構成されており、最下位ビット情報ビットシーケンスの単一ビットは、この場合、最下位ビット値を取得するために使用される。さらに、オーディオ復号器は、２つ以上の最上位ビットと中間ビットが存在する限りは任意の中間ビットがゼロ値を示し、且つ最下位ビット情報ビットシーケンスの使用される単一ビットがゼロ値を確認する（例えば、ステップ６におけるビット０の値「０」）それぞれのスペクトル値について最下位ビット情報ビットシーケンスの単一ビット（例えば、ステップ６、ビット０）を使用するように構成されている。さらに、オーディオ復号器は、２つ以上の最上位値と中間ビットが存在する限りは任意の中間ビット値とがゼロ値を示し、且つ最下位ビット情報ビットシーケンスの第１の使用ビットが、最下位ビット値（ステップ６におけるビット０の値「１」）によってゼロ値からの偏差を示すそれぞれのスペクトル値について、最下位ビット情報ビットシーケンスの後続の２つのビット（例えば、ステップ６におけるビット０およびビット１）を使用するように構成されており、最下位ビット情報ビットシーケンスの第２の使用ビット（例えば、ステップ６におけるビット１）は、それぞれのスペクトル値の符号を決定する。

そのようなメカニズムを使用することにより、高いビットレート効率を実現することができる。最下位ビットの符号化および復号には１つの連続したビットシーケンス（例えば、ｌｓｂｓ［］）のみがあり、この１つの連続したビットシーケンスはまた、ゼロ値から最下位ビット値だけ逸脱するにすぎない（すなわち、２つ以上の最上位ビットと（中間ビットが存在する限りは）任意の中間ビットとがゼロ値を示す）スペクトル値の符号情報も選択的に含む。

好ましい実施形態では、オーディオ復号器は、スペクトル値（例えば、２つ以上の最上位ビットよりも多くのビットを含む全てのスペクトル値）が、最低周波数のスペクトル値から最後の最下位ビット情報が利用可能なスペクトル値までの範囲の最下位ビット情報によって精緻化されるように、且つ最後の最下位ビット情報が利用可能なスペクトル値に関連付けられた周波数よりも高い関連周波数を有する（例えば、全ての）スペクトル値（例えば、２つ以上の最上位ビットよりも多くのビットを含む復号されたスペクトル値さえも）が未精緻化のままであるように、最低周波数のスペクトル値に関連する最下位ビットから始まり、次第により高い周波数に関連するスペクトル値に向かって進んで最下位ビットを復号するように構成されている。換言すれば、より低い周波数範囲のスペクトル値（最低周波数のスペクトル値から最後の最下位ビット情報に関連付けられたスペクトル値まで）は、最下位ビット情報を使用して精緻化されるが、より高い周波数に関連付けられたスペクトル値は、全て未精緻化のままである。その結果、知覚的により重要な低周波数範囲における分解能は、最下位ビット精緻化を使用することによって増加するが、２つ以上の最上位ビット（および利用可能な場合は中間ビット）のみが、それほど知覚的に重要ではないより高い周波数範囲において使用される。その結果、利用可能なビットレートに基づいて可能な限り最良の聴覚印象を得ることができ、スペクトル値の最下位ビット情報が提供される単純なメカニズムも存在する。さらにまた、スペクトル値は、最低周波数のスペクトル値から、最後の最下位ビット情報が関連付けられたスペクトル値まで、精緻化されることができる。

好ましい実施形態では、オーディオ復号器は、符号化器からのシグナリングに応答して、より高い周波数範囲のスペクトル値の復号が省略され（例えば、完全に省略される）且つ最下位ビットが、１つ以上の最上位ビットが復号され且つ最上位ビットよりも多くのビットを含む全てのスペクトル値について復号される第１のモードと、１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが復号されるが、１つ以上の最上位ビットが復号され且つ最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値についての最下位ビットが復号されない第２のモードとの間で切り替え可能に構成されている。

換言すれば、オーディオ復号器は、ビットバジェットの枯渇を処理するために大幅に異なるメカニズムを使用する２つのモード間で切り替え可能である。

第１のモードでは、低い周波数範囲の全てのスペクトル値が最下位ビットを完全に含めて符号化（および復号）される一方で、高い周波数範囲の全てのスペクトル値は、それらが非ゼロであるために結果として復号器側では復号されない場合であっても符号化器によって完全に破棄される。第２のモードでは、少なくとも最上位ビットは、全ての非ゼロスペクトル値について符号化される（したがって復号もされる）が、最下位ビットは、なおも利用可能なビットバジェットが存在する場合に（またはその限りは）のみ符号化（および復号）される。

しかしながら、２つの異なるモード間で切り替える可能性は、オーディオ復号器が変化する送信条件に適応することを可能にすることが見出された。例えば、例えば非常に小さなビットレートしか利用できない場合、第１のモードが第２のモードよりも時には有利であることが見出された。十分に高いビットレートが存在する場合、第１のモードは、良好な結果を提供せず、この場合、多くのスペクトル値のバイナリ表現は、２つ以上の最上位ビットに加えて最下位ビットを含むことも見出された。したがって、オーディオ復号器は、最下位ビットが数個しか存在しない状況や、比較的多数の最下位ビットが存在する状況下で良好な結果で動作することができる（第２のモードにおける動作は、通常、第１の場合において問題がある一方で、第２のモードにおける動作は、通常、第２の場合において非常に有利である）。

好ましい実施形態では、オーディオ復号器は、オーディオ符号化器が第１のモードで動作するか第２のモードで動作するかを決定するために、符号化されたオーディオ表現に含まれるビットストリームフラグを評価するように構成されている。したがって、第１のモードと第２のモードとの間の切り替えは、通常、どのモードが最も有利であるかについての十分な知識を含むオーディオ符号化器によって制御されることができる。また、オーディオ復号器は、第２のモードの第１のモードを使用するかどうかを自ら決定する必要がないため、オーディオ復号器の複雑さを低減することができる。

他の実施形態では、オーディオ復号器は、それぞれのシンボルコードに基づいて、少なくとも２つのスペクトル値について、スペクトル値ごとに２つ以上の最上位ビットを一緒に復号するように構成されており、それぞれのシンボルコードは、少なくとも２つのスペクトル値について、スペクトル値ごとに２つ以上の最上位ビットを表す。そのようなスペクトル値のグループ化では、２つ以上のスペクトル値が算術符号化された表現の単一のシンボルによって表され、また、隣接するスペクトル値間に相関があることが多く、２つの最上位ビットのそれぞれのビット位置を個別に符号化する必要がないため、特に効率的である。しかしながら、ビット位置は、通常、絶対値がよりも大きいスペクトル値によって決定されるため、スペクトル値の１つの「最上位ビット」が双方とも「ゼロ」になることは当然のことである。

本発明にかかる実施形態は、符号化されたオーディオ情報に基づいて復号されたオーディオ情報を提供するオーディオ復号器を形成する。オーディオ復号器は、スペクトル値を表す符号化情報に基づいて復号されたスペクトル値を取得するように構成されている。オーディオ復号器は、複数のスペクトル値のそれぞれのシンボルコードに基づいて１つ以上の最上位ビットを復号し、１つ以上のスペクトル値の１つ以上の最下位ビットを復号するように構成されている。特に、オーディオ復号器は、符号化器からのシグナリングに応答して、より高い周波数範囲のスペクトル値の復号が省略され（例えば、完全に省略される）且つ１つ以上の最上位ビットが復号され（または復号された）且つ最上位ビットよりも多くのビットを含む全てのスペクトル値について最下位ビットが復号される第１のモードと、１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが復号されるが、１つ以上の最上位ビットが復号され（または復号された）且つ１つ以上の最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値について最下位ビットが復号されない第２のモードとの間で切り替え可能に構成されている。さらに、オーディオ復号器は、スペクトル値を使用して復号されたオーディオ情報を提供するように構成されている。

この実施形態は、状況に応じて、第１のモードまたは第２のモードが、複雑さ、ビットレートおよびオーディオ品質の間のトレードオフの点でより有利であり得るというアイデアに基づいている。オーディオ復号器は、ビットバジェットの枯渇に対処するための２つの異なるアプローチを処理することができる。第１のモードで動作する場合、オーディオ復号器は、オーディオ符号化器が高周波数範囲のスペクトル値の符号化を省略する一方で、低周波数範囲のスペクトル値が全て完全に符号化される（最下位ビットを含む）状況を処理することができる。第２のモードでは、オーディオ復号器は、１つ以上の最上位ビットが全てのスペクトル値について符号化される場合であっても、一部のスペクトル値について最下位ビットが選択的に省略される符号化されたオーディオ情報を処理する。既に上述したように、双方のアプローチは、他のいくつかのシステムパラメータ（例えば、利用可能なビットレートなど）に応じて利点を有するため、ここで説明するオーディオ復号器は、様々な条件下で良好な結果を提供することができる。

このオーディオ復号器はまた、上述したオーディオ復号器の特徴と機能のいずれかによって補足されることもできる。

好ましい実施形態では、オーディオ復号器は、中間ビットを取得するように構成され、そのビット位置は、最下位ビットと１つ以上の最上位ビットとの間にあり、最下位ビットは、第１のモードにおける連続したビットシーケンスからの所与のスペクトル値に関連付けられている。さらに、オーディオ復号器は、中間ビットを取得するように構成され、そのビット位置は、最下位ビットと１つ以上の最上位ビットとの間にあり、最下位ビットは、第２のモードにおける別個のビットシーケンスからまたはビットシーケンスの別個の非連続のビット位置からの所与のスペクトル値に関連付けられている。

換言すれば、第１のモードでは、中間ビット（中間ビットが存在する限り）と最下位ビットとの双方を符号化する単一の連続したビットシーケンスが存在することができる。中間ビットに関する情報と最下位ビットに関する情報との双方を含む（ただし、通常は１つ以上の最上位ビットに関する情報を含まない）この連続したビットシーケンスは、ビットレートバジェットが削減される場合に容易に短縮することができる。一方、第２のモードでは、最下位ビットを表す情報および中間ビットを表す情報は、別個のビットシーケンスまたはビットシーケンスの別個のサブシーケンスに含まれる。したがって、中間ビットに関する情報（および必要に応じて符号情報）を取得する１つのビットシーケンスがあり、最下位ビット（および必要に応じて非常にゼロに近い値の符号に関する情報）に関する情報を含む１つのシーケンスがある。その結果、第２のモードで動作するとき、最下位ビットに関する情報は、別個のシーケンスにあるため、最下位ビットを含むシーケンスを削除または短縮することは容易であり、それにより必要なビットレートを削減する。オーディオ復号器は、最下位ビットを表すシーケンスに含まれるビット数に応じて、スペクトル値の最下位ビット精緻化が多かれ少なかれスペクトル値に適用される点で、最下位ビットを含むシーケンスの様々な長さに容易に適応することができる。

本発明にかかる実施形態は、入力オーディオ情報に基づいて符号化されたオーディオ情報を提供するオーディオ符号化器を形成する。オーディオ符号化器は、入力オーディオ情報のオーディオコンテンツを表すスペクトル値を取得するように構成されている。オーディオ符号化器はまた、（符号化されたオーディオ情報の一部とすることができる）スペクトル値を表す符号化情報を得るために、少なくとも複数のスペクトル値を符号化するように構成されている。さらに、オーディオ符号化器は、算術符号化を使用してスペクトル値のセットのそれぞれのシンボルコードを取得するために、スペクトル値ごとに２つ以上の最上位ビットを一緒に符号化するように構成されている。それぞれのシンボルコードは、１つ以上のスペクトル値のスペクトル値ごとに２つ以上の最上位ビットを表すことができる。

オーディオ復号器はまた、１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが符号化される一方で、２つ以上の最上位ビットが符号化され且つ２つ以上の最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値については最下位ビットが符号化されないように、利用可能なビットバジェットに応じて１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットを符号化するように構成されている。さらに、オーディオ符号化器は、スペクトル値を表す符号化情報を使用して、符号化されたオーディオ情報を提供するように構成されている。

このオーディオ符号化器は、２つ以上の最上位ビットが算術符号化を使用して符号化されるスペクトル値の１つ以上の最下位ビットの符号化を選択的に省略することにより、複雑さ、ビットレート、およびオーディオ品質の間の適切なトレードオフを達成できるというアイデアに基づいている。符号化される少なくとも２つの最上位ビットがある場合、１つ以上の最下位ビットの符号化を省略することは特に有害ではないことがわかっている。

特に、最上位ビットが符号化される１つ以上の（量子化された）スペクトル値の最下位ビットの符号化の省略は、ビットバジェット内に維持するようにいくつかのスペクトル値の符号化を完全に省略した場合と比較して、はるかに小さいオーディオ品質の低下を引き起こすことがわかっている。

好ましい実施形態では、算術符号化は、例えば、算術符号化された表現の異なるシンボルに対して個別に、少なくとも２つの最上位ビット（例えば、ｎｕｍｂｉｔｓおよびｎｕｍｂｉｔｓ－１）のビット位置（例えば、ビット重み）を決定し、算術的に符号化された表現に情報、例えば、ビット位置を説明する１つ以上の「ＶＡＬ＿ＥＳＣ」シンボルを含むエスケープシーケンスを含めるように構成されている。したがって、２つ以上の最上位ビットのビット位置またはビット重みは、実際のスペクトル値に適合させることができ、最上位ビットは、比較的大きなスペクトル値に対して大きなビット重みを有することができ、最上位ビットは、スペクトル値が比較的小さい場合は、比較的小さいビット重みを有することができる。したがって、いくつかの量子化されたスペクトル値は、２つ以上の最上位ビットを使用して完全に符号化されてもよく、最下位ビット（または中間ビット）は残らない。対照的に、他の比較的大きなスペクトル値は、２つ以上の最上位ビットを使用し、且つ少なくとも１つの最下位ビットを使用して符号化されることができる。２つ以上の最上位ビットに加えて少なくとも１つの最下位ビットがあるような比較的大きなスペクトル値の場合、符号化器は、利用可能なビットバジェットが使い果たされているかどうかに応じて、最下位ビットを符号化するかどうかを柔軟に決定することができる。しかしながら、量子化分解能が高いほど、２つ以上の最上位ビットに加えて、１つ以上の最下位ビットを含むスペクトル値の数も多くなる。したがって、最下位ビットを符号化しないことによってビットを節約する可能性は、細かい量子化に対して特に高い。

好ましい実施形態では、オーディオ符号化器は、少なくとも１つのスペクトル値の少なくとも２つの最上位ビットを、少なくとも１つのスペクトル値の少なくとも２つの最上位ビットを表す算術符号化表現の１つのシンボルにマッピングするように構成されている。例えば、算術符号化のコンテキストを決定するときなどに、隣接するスペクトル値の最上位ビット間の相関を利用することができるため、算術符号化表現の１つのシンボルを使用して２つ以上の最上位ビットを一緒に符号化すると特に効率的であることがわかっている。

好ましい実施形態では、オーディオ符号化器は、２つ以上の最上位ビットが符号化され且つ２つ以上の最上位ビットおよび最下位ビットよりも多くのビットを含む全てのスペクトル値について、１つ以上の中間ビットを符号化するように構成されており、そのビット位置は、最下位ビットと２つ以上の最上位ビットの間にある。したがって、２つ以上の最上位ビットが符号化される全てのスペクトル値は、実際には良好な分解能で符号化される。そのようなスペクトル値の場合、最下位ビットを除く全てのビットが常に符号化され、これにより、良好な分解能をもたらし、ビットバジェットが使い果たされた場合に最下位ビットのみが影響を受けるという効果を有する。したがって、非常に良好な聴覚印象を維持することができる。

好ましい実施形態では、オーディオ符号化器は、第１の符号化フェーズにおいて、スペクトル値ごとに２つ以上の最上位ビットを符号化し、また、第１の符号化フェーズにおいて、２つ以上の最上位ビットが符号化され且つ２つ以上の最上位ビット（一緒に符号化される）よりも多くのビットと最下位ビット、１つ以上の中間ビットを含むスペクトル値を符号化するように構成されており、中間ビットのビット位置は、最下位ビットと２つ以上の最上位ビットとの間にある。さらに、符号化器は、第１の符号化フェーズにおいて、２つ以上の最上位ビットが符号化され且つ２つ以上の最上位ビットと中間ビットが存在する限りは中間ビットとが非ゼロ値を示す全てのスペクトル値の符号を符号化するように構成されている。しかしながら、オーディオ符号化器は、第１の符号化フェーズにおいて、２つ以上の最上位値と中間ビットが存在する限りは中間ビットとがゼロ値を示すスペクトル値の符号の符号化を選択的に省略するように構成されている。したがって、第１の符号化フェーズでは、最上位ビットと中間ビットが最上位ビットと最下位ビットとの間に存在する限りは中間ビットとが符号化される。しかしながら、第１の符号化フェーズでは、２つ以上の最上位ビットと中間ビットとが非ゼロ値を示す場合にのみ、符号が符号化される。換言すれば、第１の符号化フェーズでは、最下位ビット値のみがゼロとは異なってスペクトル値が非常に小さい場合（２つ以上の最上位ビットのビット重みが、最上位ビットが全てゼロであるように選択される場合、これは、例えば、所与のスペクトル値のビットの重みが、所与のスペクトル値よりも大きい１つ以上の隣接するスペクトル値の影響を受ける場合に発生する）には、符号は符号化されない。

さらに、オーディオ符号化器は、符号化フェーズに続く第２の符号化フェーズにおいて、２つ以上の最上位ビットと中間ビットが存在する限りは中間ビットとがゼロ値を示し且つ最下位ビット情報が非ゼロ値を示すスペクトル値の符号情報を選択的に符号化するように構成されている。換言すれば、最下位ビット値のみがゼロとは異なる非常に小さいスペクトル値の場合、符号は、第２の符号化フェーズにおいてのみ符号化され、所与のスペクトル値についての第２の符号化フェーズが実際に実行（または完了）されるかどうか（すなわち、最下位ビット情報が符号化されたオーディオ情報に含まれているかどうか）の決定は、ビットバジェットに依存する。したがって、いずれの場合にも符号情報が必要である最上位ビットと（中間ビットが存在する限りは）任意の中間ビットとの符号化から既に明らかでない限り、第１の符号化フェーズは効率化され、符号情報は、第２の符号化フェーズにおいてのみ符号化される（例えば、符号化オーディオ情報に含まれる）。どのスペクトル値から始めて第２の符号化フェーズが実行されるかが明確でないため、不要な情報の符号化が回避され、効率が最大化される。第２の符号化フェーズが実行されるかどうかの最終決定は、最上位ビットと中間ビットとの復号に必要なビット数、および他の最下位ビットの符号化によって既に使用されているビット数がわかっている場合にのみ行うことができる。

好ましい実施形態では、オーディオ符号化器は、そのようなスペクトル値の最下位ビットが実際に符号化される（符号化されたオーディオ表現に含まれる）場合、最下位ビットのみがゼロとは異なるスペクトル値の符号化されたオーディオ表現に符号情報のみを含めるように構成されている。したがって、符号化されたオーディオ情報（または符号化されたオーディオ表現）に不要な情報が含まれることを回避することができる。換言すれば、最下位ビットを考慮しない場合であっても、非ゼロである全てのスペクトル値の符号情報が含まれる。最下位ビットを考慮するときにのみ非ゼロであるスペクトル値の場合、最下位ビット情報が実際に符号化されたオーディオ表現に含まれる場合、符号情報は、符号化されたオーディオ表現にのみ含まれる。

好ましい実施形態では、オーディオ符号化器は、スペクトル値に関連する最下位ビット値を符号化するために、最下位ビット情報ビットシーケンスの後続のビットを順次提供するように構成されている。したがって、最下位ビットを考慮する場合にのみ非ゼロであるそのようなスペクトル値について、最下位ビット情報およびおそらくいくつかの符号情報のみを含む連続したビットシーケンスまたはビットストリームが提供される。その結果、最下位ビット情報（関連する符号情報を含む）の別個のシーケンスが存在し、これは、最上位ビットおよび中間ビット（および最下位ビットを考慮せずに残す場合であっても関連する任意の符号情報）の符号化に影響を与えることなく短縮または省略することができる。

好ましい実施形態では、オーディオ符号化器は、２つ以上の最上位ビット値と中間ビットが存在する限りは任意の中間ビットとが非ゼロ値を示すそれぞれのスペクトル値について最下位ビット情報ビットシーケンスの単一ビットを提供するように構成されており、最下位ビット情報ビットシーケンスの使用された単一ビットは、最下位ビット値を符号化するために使用される。さらに、オーディオ符号化器は、２つ以上の最上位値と中間ビットが存在する限りは中間ビットとがゼロ値を示し且つ最下位ビット情報ビットシーケンスの提供された単一ビットがゼロ値を確認するそれぞれのスペクトル値について最下位ビット情報ビットシーケンスの単一ビットを提供するように構成されている。さらに、オーディオ符号化器は、２つ以上の最上位ビットと中間ビットが存在する限りは中間ビットとがゼロ値を示し且つ最下位ビット情報ビットシーケンスの第１の提供されたビットが最下位ビット値によるゼロ値からの偏差を示すそれぞれのスペクトル値について最下位ビット情報ビットシーケンスの後続の２ビットを提供するように構成されており、最下位ビット情報ビットシーケンスの第２の提供されたビットは、それぞれのスペクトル値の符号を符号化する。換言すれば、最下位ビット情報ビットシーケンスは、通常、スペクトル値ごとに１ビットを含むが、スペクトル値がゼロ値から最下位ビット値だけ逸脱する場合、スペクトル値ごとに２ビットを含む。後者の場合、最下位ビット情報のそれぞれの部分が実際に符号化されているか、または実際にオーディオ復号器に送信されるか、または実際にオーディオ復号器によって評価される場合にのみ必要とされることから、符号情報は、最下位ビット情報ビットシーケンスに含まれる。

換言すれば、符号は、最上位ビットと中間ビット（存在する場合）とがゼロ値を示し且つ最下位ビットが非ゼロ値を示す（ゼロ値から最下位ビット値のみ逸脱する）スペクトル値の最下位ビット情報ビットシーケンスに選択的に含まれる。

好ましい実施形態では、オーディオ符号化器は、最低周波数のスペクトル値に関連する最下位ビットから始まり、次第に高い周波数に関連するスペクトル値に向かって進む最下位ビットを符号化するように構成されている。したがって、最下位ビット情報によってスペクトル値を精緻化するための（例えば、１つ以上の最上位ビットよりも多くのビットを含む全てのスペクトル値を精緻化するための）符号化情報は、最低周波数のスペクトル値から「最後の」最下位ビット情報が提供されるスペクトル値までの範囲で提供される。さらに、最後の最下位ビット情報が提供されるスペクトル値に関連する周波数よりも高い関連周波数を有する（全ての）スペクトル値（２つ以上の最上位ビットよりも多くのビットを含む符号化されたスペクトル値であっても）の最下位ビット情報によってスペクトル値を精緻化するための符号化情報は提供されない。他の言い方をすれば、ビットバジェットの未使用ビットは、ビットバジェットが使い果たされるまで、最下位ビット情報によって低周波数領域のスペクトル値を精緻化するために使用される。より高い周波数領域のスペクトル値は、ビットバジェットが使い果たされた場合、最下位ビット情報によって精緻化されない。そのような手順は、最下位ビット情報を提供するときに、より低い周波数部分のスペクトル値がより高い周波数部分のスペクトル値よりも好ましいことをもたらす。これは、低周波数領域の不正確さと比較した場合に高周波数領域の不正確さによって聴覚印象が歪むことが少ないため、音響心理学的要件と一致する。したがって、オーディオ符号化器は、ビットバジェットに基づいて、どの周波数（最後の最下位ビット情報が提供されるスペクトル値）まで、ビットバジェットに応じて最下位ビット情報を使用したスペクトル値の精緻化が存在するかを柔軟に決定することができる。

好ましい実施形態では、オーディオ符号化器は、利用可能なビットバジェットがより低い周波数範囲のスペクトル値の符号化によって使用される（使い果たされる）場合により高い周波数範囲の非ゼロスペクトル値の符号化が（例えば、完全に）省略され且つ１つ以上の最上位ビットが符号化され且つ最上位ビットよりも多くのビットを含む全てのスペクトル値について最下位ビットが符号化される第１のモードと、１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが符号化されるが、１つ以上の最上位ビットが符号化され且つ最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値について最下位ビットが符号化されない第２のモードとの間で切り替え可能であるように構成されている。

既に上述したように、そのようなモード間を切り替えることができることは、異なる環境において且つ異なるビットレート制約の下で効率的なコーディングを可能にする。第１のモードでは、符号化されるスペクトル値の数を変えることができ、ビットバジェットの枯渇に応じて、より高い周波数範囲の非ゼロスペクトル値の符号化を省略することができる。したがって、高周波数範囲での聴覚印象は低下するが、これは、例えば低ビットレート環境など、状況によっては許容できる場合がある。一方、第２のモードでは、オーディオ符号化器は、ビットバジェットに応じて最下位ビットが符号化されるスペクトル値の数を変えることができるが、少なくとも最上位ビットは、全てのスペクトル値について符号化される（高周波数領域であっても）。したがって、第２のモードでは、高周波領域において非ゼロの（量子化された）スペクトル値が完全に省略されることはないが、場合によっては、低い周波数でも符号化精度が低下することがある。第２の動作モードは、例えば、高ビットレート条件下での改善された聴覚印象をもたらすことができ、これは、高周波領域の非ゼロのスペクトル値が完全に省略される場合、大幅な劣化を被るであろう。したがって、オーディオ符号化器は、第１のモードと第２のモードとの間で切り替え可能であることにより、様々な状況およびビットレート要件に柔軟に適応することができる。

好ましい実施形態では、オーディオ符号化器は、オーディオ符号化器が第１のモードで動作するか第２のモードで動作するかを示すために、符号化されたオーディオ情報（または符号化されたオーディオ表現）に含まれるビットストリームフラグを提供するように構成されている。したがって、オーディオ復号器は、第１の復号モードまたは第２の復号モードのどちらを使用すべきかを認識するのが容易である。オーディオ符号化器は、通常、オーディオ復号器よりも特定の状況についてより多くの知識を有するため、そのような信号にビットストリームフラグを使用することは合理的である。

好ましい実施形態では、オーディオ符号化器は、それぞれのシンボルコードを使用して少なくとも２つのスペクトル値のスペクトル値ごとに２つ以上の最上位ビットを一緒に符号化するように構成されることができる。したがって、それぞれのシンボルコードは、少なくとも２つのスペクトル値のスペクトル値ごとに２つ以上の最上位ビットを表すことができる。スペクトル的に隣接するスペクトル値間の依存性および相関関係を利用することができるため、そのような符号化は、特に効率的であることがわかっている。また、最上位ビットのビット重みは、双方のスペクトル値に基づいて決定することができ、絶対値がより大きいスペクトル値は、双方のスペクトル値の最上位ビットの共通ビット重みを決定することができる。したがって、最上位ビットのビット重みをシグナリングするためのシグナリングオーバーヘッドは、それが２つ以上のスペクトル値について一緒にシグナリングされることができることから低減されることができる。

好ましい実施形態では、オーディオ符号化器は、（例えば、スペクトル値を切り捨てることなく）実際の最高周波数非ゼロスペクトル値を決定し、全ての非ゼログループの（量子化された）スペクトル値の全ての非ゼロの（量子化された）スペクトル値の少なくとも２つ以上の最上位ビットを符号化するように構成されている。したがって、全ての非ゼロの（量子化された）スペクトル値の少なくとも最上位ビットが符号化されることが保証されることができ、これは、通常、良好な聴覚印象をもたらす。

好ましい実施形態では、オーディオ符号化器は、全ての非ゼロの（量子化された）スペクトル値の最下位ビットを除く全てのビットを符号化するように構成されている。さらに、オーディオ符号化器は、ビットバジェットが使い果たされるまでスペクトル値の最下位ビットを符号化するように構成されている（例えば、最低周波数のスペクトル値から始めて、より高い周波数のスペクトル値に向かって進む）。したがって、良好な聴覚印象を達成することができ、ビットバジェットに応じて、可変数の最下位ビットのみが符号化においてスキップされる。

好ましい実施形態では、オーディオ符号化器は、スペクトル値の量子化の量子化ステップを決定し、量子化されたスペクトル値の符号化に対するビット需要を決定するグローバルゲイン情報を取得するように構成されている。そのような（グローバルな）ゲイン情報の使用は、量子化ステップを調整するのに役立ち得ることがわかっている。しかしながら、グローバルゲイン情報を使用する場合、ビット需要を微調整することは容易ではないことも認識されている。したがって、いくつかのスペクトル値の最下位ビットの符号化を選択的に省略する概念を使用して、グローバルゲイン情報の使用によって引き起こされるビット需要の調整の不正確さを補償することができる。しかしながら、グローバルゲイン情報の使用と本明細書に記載された符号化概念との組み合わせは、比較的低い計算複雑性を有し、さらに音声品質とビットレートとの間の良好なトレードオフを可能にするシステムを形成することがわかっている。特に、所与の固定ビットレートは、符号化されるべき最下位ビットの数を柔軟に決定することにより、グローバルゲイン情報の複雑さの調整が低くても十分に利用することができる。

本発明にかかる実施形態は、入力オーディオ情報に基づいて符号化されたオーディオ情報を提供するオーディオ符号化器を形成する。オーディオ符号化器は、入力オーディオ情報のオーディオコンテンツを表すスペクトル値を取得するように構成されている。オーディオ符号化器は、スペクトル値を表す符号化情報を取得するために、少なくとも複数のスペクトル値を符号化するように構成されている。オーディオ符号化器は、複数のスペクトル値のそれぞれのシンボルコードを使用して１つ以上の最上位ビットを符号化し、１つ以上のスペクトル値の１つ以上の最下位ビットを符号化するように構成されており、それぞれのシンボルコードは、１つ以上のスペクトル値の１つ以上の最上位ビット値を表す。オーディオ符号化器は、低周波数範囲の符号化されたスペクトル値によって利用可能なビットバジェットが使用され（例えば、使い果たされた場合）且つ１つ以上の最上位ビットが符号化され且つ最上位ビットよりも多くのビットを含む全てのスペクトル値について最下位ビットが符号化される場合に、より高い周波数範囲の非ゼロスペクトル値の符号化が（例えば、完全に）省略される第１のモードと、１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが符号化されるが、１つ以上の最上位ビットが符号化され且つ最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値の最下位ビットは符号化されない第２のモードとの間で切り替え可能に構成されている。オーディオ符号化器は、スペクトル値を表す符号化情報を使用して符号化されたオーディオ情報を提供するように構成されている。

このオーディオ符号化器は、同様のオーディオ符号化器および同様のオーディオ復号器について上述した考慮事項に基づいている。特に、オーディオ符号化器は、第１のモードと第２のモードとの間で切り替え可能である一方で、様々な符号化状況とビットレート要件に適応することができる。

好ましい実施形態では、オーディオ符号化器は、第２のモードにおいて、全ての非ゼロのスペクトル値または全ての非ゼロのスペクトル値のグループの１つ以上の最上位ビットを符号化するように構成されている。したがって、良好な聴覚印象を得ることができる。

好ましい実施形態では、オーディオ符号化器は、第１のモードで動作するとき、（例えば、高い周波数範囲における）１つ以上のスペクトル値が、スペクトル値の符号化において考慮されないように、ビットバジェットが不十分である場合にスペクトル値が符号化される周波数範囲を制限するように構成されている。したがって、ビットバジェットに応じて、周波数範囲の選択的制限が第１のモードにおいて使用され、周波数範囲の制限は、ビットの節約に役立つ。

好ましい実施形態では、オーディオ符号化器は、第１のモードで動作するとき、最大周波数値を決定し、第１のモードで動作するとき、最大周波数までのスペクトル値を符号化し、第１のモードで動作するとき、スペクトル値が非ゼロである（または非ゼロの最上位ビットを有する）場合であっても、最大周波数を超えるスペクトル値を符号化されないままにするように構成されている。さらに、オーディオ符号化器は、第１のモードで動作するとき、計算または推定されたビット需要がビットバジェットを超える場合に符号化されるスペクトル値の数が削減されるように、全てのスペクトル値を符号化するためのビット需要の計算または推定に応じて最大周波数値を選択するように構成されている。さらに、オーディオ符号化器は、第２のモードで動作するとき、（例えば、実際の最大周波数値と等しくなるように）最大周波数値を決定し、第２のモードで動作するとき、最大周波数までのスペクトル値を符号化し、第２のモードで動作するとき、最大周波数を超えるスペクトル値を符号化されないままにするように構成されている。第２のモードで動作する場合、最大周波数値は、全ての非ゼロスペクトル値または全ての非ゼログループのスペクトル値の少なくとも１つ以上の最上位ビットが符号化され且つ最大でゼロ値のスペクトル値が符号化されないままであるように選択される。換言すれば、オーディオ符号化器は、様々なモードで最大周波数値を選択するための様々な基準を使用する。第１のモードでは、ビット要求に応じて最大周波数値が選択され、ビットバジェットが小さすぎる場合、非ゼロの（量子化された）スペクトル値は、符号化されないままになる。一方、第２のモードでは、最大周波数値は、非ゼロ値に量子化された全てのスペクトル値について、少なくとも１つ以上の最上位ビットが符号化されるように選択される。したがって、ビットバジェットの枯渇に対処するために、様々な概念が使用される。第１のモードでは、ビットバジェットの枯渇は、最大周波数値を低減することによって処理される。第２のモードでは、ビットバジェットの枯渇は、最上位ビットが符号化される１つ以上のスペクトル値の最下位値の符号化を省略することによって処理される。

好ましい実施形態では、オーディオ符号化器は、最大周波数を記述する情報を符号化されたオーディオ情報に含めるように構成されている。したがって、オーディオ復号器は、いくつのスペクトル値を復号すべきかを知っている。最大周波数を記述する情報は、ビットバジェットの枯渇に起因する、また、最大周波数を超える全てのスペクトル値がゼロ（例えば、実際には切り捨てなしでもゼロ）であるという信号に起因する、符号化された（および復号された）スペクトル値の数の制限の双方のために使用されることができる。

好ましい実施形態では、オーディオ符号化器は、利用可能なビットレートに応じて第１のモードまたは第２のモードのどちらを使用するかをモード決定するように構成されている（例えば、第１のモードが、比較的小さいビットレートに使用され、第２のモードが比較的高いビットレートに使用されるように）。

第２のモードは、ビットレートが高い場合のビットバジェットの枯渇への対処に良好に適しているため、そのようなメカニズムは有用である。対照的に、ビットレートが比較的低い場合、第１のモードは、第２のモードよりも良好な結果をもたらすことがある。

他の好ましい実施形態では、オーディオ符号化器は、最上位ビット符号化ステップにおいて符号化された１つ以上の最上位ビットに加えて、その符号化は、ビット需要とビットバジェットとに応じて選択的に省略されることができる１つ以上の最下位ビットを含む、スペクトル値またはスペクトル値のグループの数に関する情報に応じて、第１のモードまたは第２のモードのどちらを使用するかのモード決定を行うように構成されている。第２のモードは、（量子化後に）最下位ビットが多数ある場合に最適であるため、そのような概念は役立つ。そのような多数の最下位ビットは、例えば、高ビットレートの場合に存在し、この場合、符号化は、高分解能で行うことができる（そして、細かい量子化を使用することができる）。

好ましい実施形態では、オーディオ符号化器は、オーディオ符号化器が第１のモードで動作するか第２のモードで動作するかを示すビットストリームフラグを符号化されたオーディオ情報に含めるように構成されている。したがって、オーディオ復号器には、どの復号モードを使用するべきかが通知されることができる。

好ましい実施形態では、オーディオ符号化器は、第１のモードにおいて、そのビット位置が最下位ビットと１つ以上の最上位ビットとの間にある中間ビットと、所与のスペクトル値に関連付けられた最下位ビットとを、連続したビットシーケンスに符号化するように構成されている。さらに、オーディオ符号化器は、第２のモードにおいて、そのビット位置が最下位ビットと１つ以上の最上位ビットとの間にある中間ビットと、所与のスペクトル値に関連付けられた最下位ビットとを、別個のビットシーケンスまたはビットシーケンスの別個の非連続ビット位置（またはビットストリーム部分）に符号化するように構成されている。したがって、第１のモードで動作するとき、中間ビットと最下位ビットの双方を表す連続したビットシーケンスがある。対照的に、第２のモードで動作する場合、中間ビットと最下位ビットは、別個のシーケンスに（または共通シーケンスの別個の部分に）提供され、これは、最下位ビットを表すシーケンスの単純な短縮を可能にする。したがって、符号化が完了した後であっても、ビットバジェットへの適応が容易に可能である。これは、ビットバジェットへの適応を容易にする。

好ましい実施形態では、オーディオ符号化器は、第１のモードで動作するとき、そのビット位置が最下位ビットと１つ以上の最上位ビットとの間にある中間ビットと、最下位ビットとに関連するビットシーケンスのスペクトル値に関連する符号情報を符号化するように構成されている。さらに、オーディオ符号化器は、第２のモードで動作するとき、最下位ビット値のみがゼロから逸脱するスペクトル値の符号情報が最下位ビット（および符号情報）に関連するビットシーケンスに符号化されるように、そのビット位置が最下位ビットと１つ以上の最上位ビットとの間にある中間ビットに関連するビットシーケンス、または最下位ビット（および符号情報）に関連するビットシーケンスのスペクトル値に関連する符号情報を選択的に符号化するように構成されている。したがって、最下位ビット情報が評価されるときにのみ符号情報が必要とされる場合、符号情報は、最下位ビット（および符号情報）に関連するビットシーケンス内に配置される。したがって、符号化されたオーディオ表現に常に含まれる情報、すなわち、中間ビットおよび符号情報に関連するビットシーケンスは、最下位ビット情報が省略される場合に不要ないかなる情報も含まない。これは、ビットレートのスケーラビリティを簡素化する。

本発明にかかる実施形態は、入力オーディオ情報に基づいて符号化されたオーディオ情報を提供するオーディオ復号器を形成する。オーディオ符号化器は、（例えば、ＭＤＣＴ変換を使用して）入力オーディオ情報のオーディオコンテンツを表すスペクトル値を取得するように構成されている。オーディオ符号化器は、スペクトル値を表す符号化情報を取得するために、少なくとも複数のスペクトル値を符号化するように構成されている。オーディオ符号化器は、スペクトル値の量子化の量子化ステップを決定し、量子化されたスペクトル値を符号化するためのビット需要を決定する（グローバル）ゲイン情報を取得するように構成されている。オーディオ符号化器は、算術符号化を使用して複数のスペクトル値のそれぞれのシンボルコードを使用して１つ以上の最上位ビットを符号化し、１つ以上のスペクトル値の１つ以上の最下位ビットを符号化するように構成されており、それぞれのシンボルコードは、１つ以上のスペクトル値のスペクトル値ごとに１つ以上の最上位ビットを表す。オーディオ符号化器は、利用可能なビットバジェットに応じて、１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが符号化される一方で、１つ以上の最上位ビットが符号化され且つ１つ以上の最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値について最下位ビットが符号化されないように、１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットを符号化するように構成されている。さらに、オーディオ符号化器は、スペクトル値を表す符号化情報を使用して、符号化されたオーディオ情報を提供するように構成されている。

このオーディオ符号化器は、ゲイン情報（またはグローバルゲイン情報）の使用が量子化の定義に役立つという知見に基づいている。また、最下位ビットを選択的に符号化するという概念は、この概念と組み合わせると非常に効率的である。詳細については、上記の説明も参照されたい。

好ましい実施形態では、オーディオ符号化器は、スペクトル値のグループのエネルギー（例えば、ＭＤＣＴ係数）に基づいてゲイン情報の第１の推定値を取得するように構成されている。さらに、オーディオ符号化器は、ゲイン情報の第１の推定値を使用してスペクトル値のセット（例えば、ＭＤＣＴスペクトル）を量子化するように構成されている。さらに、オーディオ符号化器は、ゲイン情報の第１の推定値を使用して、または精緻化されたゲイン情報を使用して、量子化されたスペクトル値のセットを符号化するために必要なビット数を計算または推定するように構成されている。さらに、オーディオ符号化器は、必要なビット数に応じて、第１のモードを使用するか第２のモードを使用するかを決定するように構成されている。したがって、量子化に関する決定、およびどのモードを使用するかの決定も、効率的な方法で行うことができる。反復手順を選択するかどうかに応じて、スペクトル値のセットを符号化するために必要なビット数は、ゲイン情報の第１の推定値に応じた量子化を使用して、または反復的に精緻化されたゲイン情報に応じた量子化を使用して推定されることができる。したがって、量子化精度の決定の複雑さを合理的に小さく保つことができる。

好ましい実施形態では、オーディオ符号化器は、上述した第１のモードと第２のモードとの間で切り替え可能であるように構成されている。特に、オーディオ符号化器は、必要なビット数と、１つ以上の最上位ビットよりも多くのビットを含むスペクトル値の数を示す基準とに応じて、第１のモードまたは第２のモードのどちらを使用するかを決定するように構成されている。特に、使用されるゲイン情報（第１の推定値または精緻化されたゲイン情報）を決定した後に決定することができる必要なビット数がビットバジェットと比較されることができ、どのモードを使用するかを決定することは、この比較と、１つ以上の最上位ビットよりも多くのビットを含むスペクトル値の数を示す基準との双方に依存することができる。したがって、１つ以上の最上位ビットに加えて１つ以上の最下位ビットを含む多くのスペクトル値がある場合、第２のモードを使用することができる。

好ましい実施形態では、オーディオ符号化器は、上述した第１のモードと第２のモードとの間で切り替え可能であるように構成されている。この場合、オーディオ符号化器は、ビットレートが閾値ビットレート以上である場合およびスペクトル値のセットを符号化するために必要な計算または推定ビット数がビットバジェットよりも多い場合に第２のモードが選択されるように、必要なビット数とビットレートに応じて第１のモードまたは第２のモードのどちらを使用するかを決定するように構成されることができる。第２のモードの使用は、前記の場合に特に役立つことが示されている。

さらに、オーディオ符号化器はまた、前述した他の特徴のいずれかによって補足されることもできる。前述した同じ利点がまた適用される。

本発明にかかるさらなる実施形態は、符号化されたオーディオ情報に基づいて復号されたオーディオ情報を提供する方法と、入力オーディオ情報に基づいて符号化されたオーディオ情報を提供する方法とを形成する。これらの方法は、それぞれのオーディオ復号器およびそれぞれのオーディオ符号化器に対応し、対応するオーディオ復号器またはオーディオ符号化器に関して本明細書で説明する特徴および機能のいずれかによって補足されることができる。

本発明にかかるさらなる実施形態は、本明細書に記載される方法のいずれかを実行するコンピュータプログラムを備える。

さらなる実施形態は、上述したものと同じ検討に基づいており且つ本明細書で述べたように符号化および復号される情報項目のいずれかによって補足されることができるビットストリームを含む。

次に、本発明にかかる実施形態を、添付の図面を参照して説明する。

本発明の実施形態にかかる、オーディオ復号器のブロック概略図を示している。本発明の他の実施形態にかかる、オーディオ復号器のブロック概略図を示している。本発明の実施形態にかかる、オーディオ符号化器のブロック概略図を示している。本発明の実施形態にかかる、オーディオ符号化器のブロック概略図を示している。本発明の実施形態にかかる、オーディオ符号化器のブロック概略図を示している。本発明の実施形態にかかる、他のオーディオ符号化器のブロック概略図を示している。本発明の他の実施形態にかかる、オーディオ復号器のブロック概略図を示している。本発明の実施形態にかかる、オーディオ符号化器の機能のフローチャートを示している。本発明の実施形態にかかる、オーディオ復号器の機能のフローチャートを示している。本発明の実施形態にかかる、オーディオ符号化器の機能の擬似プログラムコード表現を示している。本発明の実施形態にかかる、オーディオ符号化器の機能の擬似プログラムコード表現を示している。本発明の実施形態にかかる、オーディオ符号化器の機能の擬似プログラムコード表現を示している。本発明の実施形態にかかる、オーディオ符号化器の機能の擬似プログラムコード表現を示している。本発明の実施形態にかかる、オーディオ符号化器の機能の擬似プログラムコード表現を示している。本発明の実施形態にかかる、オーディオ符号化器の機能の擬似プログラムコード表現を示している。本発明の実施形態にかかる、オーディオ復号器の機能の擬似プログラムコード表現を示している。本発明の実施形態にかかる、オーディオ復号器の機能の擬似プログラムコード表現を示している。本発明の実施形態にかかる、オーディオ復号器の機能の擬似プログラムコード表現を示している。本発明の実施形態にかかる、オーディオ復号器の機能の擬似プログラムコード表現を示している。従来のオーディオ符号化器／復号器によって生成された信号対雑音比のグラフィック表現を示している。本発明にかかるオーディオ符号化器／復号器によって提供される信号対雑音比のグラフィック表現を示している。本発明の実施形態にかかる、オーディオ符号化およびオーディオ復号の方法のフローチャートを示している。本発明の実施形態にかかる、オーディオ符号化およびオーディオ復号の方法のフローチャートを示している。本発明の実施形態にかかる、オーディオ符号化およびオーディオ復号の方法のフローチャートを示している。本発明の実施形態にかかる、オーディオ符号化およびオーディオ復号の方法のフローチャートを示している。本発明の実施形態にかかる、オーディオ符号化およびオーディオ復号の方法のフローチャートを示している。

１）．図１にかかるオーディオ復号器
図１は、本発明の実施形態にかかるオーディオ復号器１００のブロック概略図を示している。

オーディオ復号器１００は、符号化されたオーディオ情報１１０を受信し、それに基づいて復号されたオーディオ情報１１２を提供するように構成されている。オーディオ復号器１００は、スペクトル値を表す符号化情報１３０に基づいて復号されたスペクトル値１３２を取得するように構成されており、符号化情報１３０は、符号化されたオーディオ情報１１０の一部とすることができる。さらに、符号化されたオーディオ情報１１０は、必要に応じて、ノイズシェーピング情報、制御情報などのようなさらなる情報を含むことができる。

オーディオ復号器は、算術復号を使用したスペクトル値のセットについて、それぞれのシンボルコード（例えば、最上位ビットの算術符号化された表現のシンボルコード）に基づいて、スペクトル値ごと（例えば、量子化されたスペクトル値ごと）に２つ以上の最上位ビットを一緒に復号するように構成されている。それぞれのシンボルコードは、１つ以上のスペクトル値のスペクトル値ごとに２つ以上の最上位ビットを表すことができる。算術的に符号化されたシンボルコードは、例えば、スペクトル値を表す符号化情報１３０の一部とすることができる。

さらに、オーディオ復号器は、どれだけの最下位ビット情報が利用可能であるかに応じて、１つ以上のスペクトル値に関連する１つ以上の最下位ビットを復号するように構成されている。最下位ビットの表現と見なすことができる最下位ビット情報はまた、スペクトル値を表す符号化情報１３０の一部とすることができる。

特に、オーディオ復号器は、（量子化された）スペクトル値の１つ以上に関連付けられた１つ以上の最下位ビットが復号されるが、１つ以上の最上位ビットが復号され（または復号された）且つ１つ以上の最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値の最下位ビットは復号されないように、どれだけの最下位ビット情報が利用可能であるかに応じて、１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットを復号するように構成されることができる。

換言すれば、オーディオ復号器は、２つ以上の最上位ビットが復号された一部のスペクトル値の最下位ビットを復号するように構成されることができ、オーディオ復号器は、１つ以上の最上位ビットが復号された一部の他のスペクトル値の１つ以上の最下位ビットの復号を省略することができる。

さらに他の言い方をすれば、オーディオ復号器は、例えば、最上位ビットが復号されたスペクトル値の真のサブセットのみを精緻化することができ、最下位ビットによって精緻化されるスペクトル値の数は、どれだけの最下位ビット情報が利用可能であるか（例えば、ビットバジェット制約を考慮して、オーディオ復号器によって符号化されたオーディオ情報１１０にどれだけの最下位ビット情報が含まれるか）に依存する。

オーディオ復号器１００は、必要に応じて、本明細書で説明される特徴、機能および詳細のいずれかによって、個別にまたは組み合わせて補足されることができる。

２）．図２にかかるオーディオ復号器
図２は、本発明の実施形態にかかる、オーディオ復号器２００のブロック概略図を示している。

オーディオ復号器２００は、オーディオ情報２１０を受信および符号化し、それに基づいて、復号されたオーディオ情報２１２を提供するように構成されている。

符号化オーディオ情報２１０は、例えば、スペクトル値を表す符号化情報２３０を含むことができ、スペクトル値を表す符号化情報２３０は、例えば、１つ以上の最上位ビットおよび符号の最下位ビットの表現を表す算術的に符号化されたシンボルコードを含むことができる。符号化されたオーディオ情報２１０は、例えば、ノイズシェーピング情報の制御情報のようなさらなる情報を必要に応じて含むことができる。任意のさらなる情報もまた、復号プロセスにおいて使用されてもよいが、本発明にとって必須ではない。

オーディオ復号器は、スペクトル値を表す符号化情報２３０に基づいて、復号されたスペクトル値２３２を取得するように構成されている。

オーディオ復号器は、複数のスペクトル値のそれぞれのシンボルコードに基づいて（例えば、算術符号化されたシンボルコードに基づいて）１つ以上の最上位ビットを復号し、１つ以上のスペクトル値の１つ以上の最下位ビットを復号するように構成されている。例えば、オーディオ復号器は、算術的に符号化されたシンボルコードと、符号化情報１３０に含まれることができる最下位ビットの表現とを使用することができる。

オーディオ復号器２００は、符号化器からのシグナリングに応答してより高い周波数範囲のスペクトル値の復号が省略され（例えば、完全に省略される）且つ１つ以上の最上位ビットが復号され且つ最上位ビットよりも多くのビットを含む全てのスペクトル値の最下位ビットが復号される第１のモードと、１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが復号されるが、１つ以上の最上位ビットが復号され且つ最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値についての最下位ビットは復号されない第２のモードとの間で切り替え可能に構成されている。換言すれば、第１のモードでは、オーディオ復号器２００は、例えば、より高い周波数範囲（例えば、符号化器によって指定された周波数よりも上）のスペクトル値の復号を省略しながら、より低い周波数範囲（例えば、オーディオ符号化器によって決定されてシグナリングされた周波数まで）のスペクトル値のみを復号することができる。しかしながら、第１のモードでは、最上位ビット、任意の中間ビットおよび任意の最下位ビットが、より低い周波数範囲の全てのスペクトル値について復号されるように、スペクトル値の全数表現が低周波数範囲の全てのスペクトル値について復号されることができる。対照的に、第２のモードでは、オーディオ復号器は、１つ以上の最上位ビットが復号される一部のスペクトル値の最下位ビットのみを復号することができるが、１つ以上の最上位ビットが復号される全てのスペクトル値については復号することができない。したがって、第２のモードでは、最下位ビットは、１つの周波数領域では復号されることができるが、他の周波数領域（例えば、より高い周波数領域）では復号されない。

さらに、オーディオ復号器２００は、スペクトル値２３２を使用して復号されたオーディオ情報２１２を提供するように構成されている。例えば、オーディオ復号器２００は、復号されたスペクトル値２３２のさらなる処理を含むことができるが、その詳細は、本発明の主題には特に関連しない。

さらに、オーディオ復号器２００は、個別にまたは組み合わせて、本明細書で説明される特徴、機能および詳細のいずれかによって補足されることができることに留意されたい。

３）．図３にかかるオーディオ符号化器
図３は、本発明の実施形態にかかる、オーディオ符号化器３００のブロック概略図を示している。オーディオ符号化器３００は、入力オーディオ情報３１０を受信し、（符号化されたオーディオ情報１１０、２１０に対応することができる）符号化されたオーディオ情報３１２を提供するように構成されている。オーディオ符号化器３００は、入力オーディオ情報３１０のオーディオコンテンツを表すスペクトル値３３０を取得するように構成されている。例えば、オーディオ復号器３００は、必要に応じて、例えば、スペクトル値３３０を取得するために、時間領域からスペクトル領域への変換（例えば、ＭＤＣＴ）および／またはスペクトルシェーピング（時間領域および／またはスペクトル領域における）のような任意の形態の前処理を含むことができる。

スペクトル値３３０は、例えば、符号付きバイナリ表現における量子化された（好ましくは整数）値とすることができる。さらに、オーディオ符号化器は、スペクトル値３３０を表す符号化情報３５０を取得するために、少なくとも複数のスペクトル値３３０を符号化するように構成されている。オーディオ符号化器３００は、例えば、スペクトル値を表す符号化情報３５０を使用して符号化されたオーディオ情報３１２を提供するように構成されることができる。しかしながら、オーディオ符号化器３００は、必要に応じて、符号化されたオーディオ情報３１２にも含まれる（しかし、その詳細は本発明に特に関連しない）制御情報またはノイズシェーピング情報のようなさらなる情報を提供することもできる。

オーディオ符号化器３００は、算術符号化を使用してスペクトル値のセットのそれぞれのシンボルコードを取得するために、スペクトル値ごとに２つ以上の最上位ビットを一緒に符号化するように構成されている。それぞれのシンボルコードは、例えば、１つ以上のスペクトル値のスペクトル値ごとに２つ以上の最上位ビットを表すことができる。

オーディオ符号化器は、さらに、１つ以上のスペクトル値に関連する１つ以上の最下位ビットが符号化されるが、２つ以上の最上位ビットが符号化され且つ２つ以上の最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値については最下位ビットが符号化されないように、ビットバジェットに応じて１つ以上のスペクトル値３３０に関連する１つ以上の最下位ビットを符号化するように構成されている。

例えば、オーディオ符号化器３００は、より低い周波数部分のスペクトル値についての符号化された最下位ビットのみを提供することができるが、より高い周波数部分のスペクトル値については提供することができない。どのスペクトル値に最下位ビットが提供されるかを選択することにより、いくつかのビットをビットバジェットに適合させることができる。

さらに、図３にかかるオーディオ符号化器は、個別にまたは組み合わせて、本明細書で説明される特徴、機能および詳細のいずれかを使用して補足されることができることに留意されたい。

４）．図４にかかるオーディオ符号化器
図４は、本発明の実施形態にかかる、オーディオ符号化器４００のブロック概略図を示している。

オーディオ符号化器４００は、入力オーディオ情報４１０を受信し、それに基づいて、符号化されたオーディオ情報４１２を提供するように構成されている。オーディオ符号化器は、入力オーディオ情報４１０のオーディオコンテンツを表すスペクトル値３３０（例えば、符号付きバイナリ表現で量子化された（好ましくは整数）スペクトル値とすることができる）を取得するように構成されている。例えば、任意の前処理を使用することができ、これは、例えば、時間領域から周波数領域への変換および／またはノイズシェーピングを含むことができる。さらに、量子化は、必要に応じて、スペクトル値４３０を取得するために使用されてもよい。

オーディオ符号化器は、スペクトル値を表す符号化情報４５０を取得するために、少なくとも複数のスペクトル値４３０を符号化するようにさらに構成されている。オーディオ符号化器は、複数のスペクトル値のそれぞれのシンボルコードを使用して（スペクトル値の）１つ以上の最上位ビットを符号化し、１つ以上のスペクトル値の１つ以上の最下位ビットを符号化するように構成されている。それぞれのシンボルコードは、例えば、１つ以上のスペクトル値の１つ以上の最上位ビット値を表すことができる。オーディオ符号化器は、利用可能なビットバジェットがより低い周波数範囲のスペクトル値の符号化によって使用された場合（使い果たされた場合）に、より高い周波数範囲の非ゼロスペクトル値の符号化が省略され（例えば、完全に省略される）且つ１つ以上の最上位ビットが符号化され且つ最上位ビットよりも多くのビットを含む全てのスペクトル値について最下位ビットが符号化される第１のモードと、１つ以上のスペクトル値に関連付けられている１つ以上の最下位ビットが符号化されるが、１つ以上の最上位ビットが符号化され且つ１つ以上の最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値について最下位ビットが符号化されない第２のモードとの間で切り替え可能に構成されることができる。

換言すれば、オーディオ符号化器は、例えば、第１のモードでは比較的少ない数（例えば、全ての非ゼロスペクトル値ではない）を符号化することができるが、符号化されるそれらのスペクトル値は、完全な精度で符号化される（最下位ビットを含む）。対照的に、第２のモードでは、オーディオ符号化器は、例えば、全ての非ゼロスペクトル値の少なくとも最上位ビットを符号化することができるが、分解能を下げて一部のスペクトル値を符号化することができる（例えば、対応する最下位ビットを符号化することなく）。したがって、符号化器は、例えば、複数のビットをビットバジェットに適合させるための異なるメカニズムを提供する２つのモード間で切り替え可能であり、第１のモードは、ビット数の削減のためにより高い周波数範囲のスペクトル値の符号化の省略に依存し、第２のモードは、一部のスペクトル値（最上位ビットとおそらくは一部の中間ビットのみが符号化され、「部分的に符号化」される）の最下位ビットの省略に依存する。

図４にかかるオーディオ符号化器４００は、個別にまたは組み合わせて、本明細書で説明される任意の特徴、機能および詳細によって補足されることができる。

５）．図５にかかるオーディオ符号化器
図５は、本発明の実施形態にかかる、オーディオ符号化器５００のブロック概略図を示している。オーディオ符号化器５００は、入力オーディオ情報５１０を受信し、それに基づいて、符号化されたオーディオ情報５１２を提供するように構成されている。オーディオ符号化器は、入力オーディオ情報５１０のオーディオコンテンツを表すスペクトル値５３０を取得するように構成されている。例えば、オーディオ符号化器は、修正離散コサイン変換（ＭＤＣＴ）を使用して、スペクトル値５３０を取得することができる。一般的に言えば、オーディオ符号化器５００は、必要に応じて、時間領域から周波数領域への変換およびノイズシェーピングなどの任意の種類の前処理を使用することができ、オーディオ符号化器５００は、必要に応じて、量子化も使用することができる。例えば、スペクトル値５３０は、量子化されたスペクトル値であってもよく、またはノイズシェーピングおよび量子化されたＭＤＣＴ係数であってもよい。

オーディオ符号化器は、スペクトル値を表す符号化情報５５０を取得するために、少なくとも複数のスペクトル値５３０を符号化するように構成されている。符号化情報５５０は、符号化されたオーディオ情報５１２の一部とすることができる。しかしながら、符号化されたオーディオ情報５１２はまた、必要に応じて、制御情報またはスペクトルシェーピング情報のようなさらなる情報を含んでもよい。

オーディオ符号化器５００はまた、スペクトル情報の量子化の量子化ステップを決定し、量子化されたスペクトル値を符号化するためのビット需要を決定するゲイン情報（例えば、グローバルゲイン情報）５６０を取得するように構成されている。

オーディオ符号化器５００は、算術符号化を使用して複数の（量子化された）スペクトル値のそれぞれのシンボルコードを使用して（量子化されたスペクトル値の）１つ以上の最上位ビットを符号化し、１つ以上の（量子化された）スペクトル値の１つ以上の最下位ビットを符号化するように構成されている。それぞれのシンボルコードは、例えば、１つ以上のスペクトル値のスペクトル値ごとに１つ以上の最上位ビットを表すことができる。

オーディオ符号化器は、１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが符号化されるが、１つ以上の最上位ビットが符号化され且つ１つ以上の最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値について最下位ビットが符号化されないように、利用可能なビットバジェットに応じて、１つ以上の（量子化された）スペクトル値に関連付けられた１つ以上の最下位ビットを符号化するように構成されている。例えば、オーディオ符号化器は、一部のスペクトル値について符号化された最下位ビットのみを提供することができるが、最下位ビット精緻化からの恩恵も受けるであろう他のスペクトル値については最下位ビット情報が提供されない。

さらに、オーディオ符号化器５００は、スペクトル値を表す符号化情報５５０を使用して符号化されたオーディオ情報５１２を提供するように構成されている。

オーディオ符号化器５００は、個別にまたは組み合わせて、本明細書で説明される特徴、機能および詳細のいずれかによって補足されることができることに留意されたい。

６）．図６にかかるオーディオ符号化器
図６は、本発明の実施形態にかかる、オーディオ符号化器のブロック概略図を示している。

図６にかかるオーディオ符号化器は、全体が６００で示されている。

オーディオ符号化器６００は、入力オーディオ情報６１０を受信し、それに基づいて、符号化されたオーディオ表現６１２を提供するように構成されている。

オーディオ符号化器６００は、入力オーディオ信号に何らかの種類の前処理（例えば、フィルタリング、帯域幅制限、時間領域ノイズシェーピングなど）を適用することができる任意の前処理６２０を含むことができる。

オーディオ符号化器６００は、必要に応じて、例えば、低遅延修正離散コサイン変換のような修正離散コサイン変換または同様の変換を実行することができる時間領域からスペクトル領域への変換６３０を含むことができる。時間領域からスペクトル領域への変換６３０は、例えば、入力オーディオ情報６１０、またはその前処理されたバージョン６２２を受信し、スペクトル値６３２を提供することができる。

オーディオ符号化器６００は、必要に応じて、スペクトル値６３２を受信し、例えば、ノイズシェーピングを実行することができる（さらなる）前処理を含むことができる。例えば、（さらなる）前処理６４０は、スペクトルノイズシェーピングおよび／または時間的ノイズシェーピングを実行することができる。必要に応じて、前処理６４０は、例えば、（例えば、心理音響モデルによって決定されることができる）周波数帯域の心理音響関連性にしたがって、異なる周波数帯域（「スケールファクタ帯域」）をスケーリングするためにスケールファクタを適用することができる。したがって、前処理されたスペクトル値６４２を取得することができる。

オーディオ符号化器６００は、必要に応じて、例えば、スペクトル値６３２または前処理されたスペクトル値６４２をスケーリングすることができるスケーリング６５０を含むことができる。例えば、スケーリング６５０は、グローバルゲインを使用してスペクトル値６３２または前処理されたスペクトル値６４２をスケーリングし、それによってスケーリングされたスペクトル値６５２を提供することができる。

オーディオ符号化器６００はまた、スペクトル値６３２、前処理されたスペクトル値６４２、またはスケーリングされたスペクトル値６５２を受信することができる量子化（または量子化器）６６０も含む。量子化６６０は、例えば、スペクトル値６３２または前処理されたスペクトル値６４２またはスケーリングされたスペクトル値６５２を量子化し、それにより、例えば符号付き整数値とすることができ且つ例えばバイナリ表現で表現されることができる（例えば、２の補数表現で）、量子化されたスペクトル値６６２を取得することができる。量子化されたスペクトル値６６２は、例えば、Ｘ_ｑによって指定されることができる。例えば、所定の数の２５６、５１２、１０２４、または２０４８の量子化されたスペクトル値をフレームごとに提供することができ、異なる周波数が量子化されたスペクトル値に関連付けられる。

符号化器６００はまた、量子化されたスペクトル値６６２（Ｘ_ｑ）を受信し、それに基づいて、（量子化された）スペクトル値６７２を表す符号化情報を提供することができる符号化６７０を含むこともできる。

量子化されたスペクトル値６６２は、スペクトル値３３０、４３０、５３０に対応することができ、スペクトル値を表す符号化情報６７２は、スペクトル値を表す符号化情報３５０、４５０、５５０に対応することができることに留意されたい。さらに、符号化６７０は、例えば、符号化器３００、４００、５００に関して説明された機能を実行することができることに留意されたい。しかしながら、符号化６７０はまた、（例えば図８を参照して）以下に説明される機能、または前記機能の少なくとも一部を含むこともできる。

オーディオ符号化器６００はまた、必要に応じて、符号化情報６７２に後処理を適用することができる後処理６８０を含む。

したがって、符号化された表現６１２が提供され、これは、通常、符号化情報６７２を含む。しかしながら、符号化されたオーディオ表現６１２は、必要に応じて、制御情報およびノイズシェーピングに関する情報（スケールファクタ情報、線形予測係数など）のような追加情報も含むことができる。符号化されたオーディオ表現は、必要に応じて、グローバルゲイン情報および／または符号化モード情報／復号モード情報および／または「ｌａｓｔｎｚ」情報を含むこともできる。

結論として、本明細書に開示されるスペクトル値の符号化の概念は、例えば、オーディオ符号化器６００において実装されることができ、本明細書で説明されるスケールファクタ符号化の一部または全ての特徴のみがオーディオ符号化器６００で引き継がれることができる。

７）．図７にかかるオーディオ復号器
図７は、本発明の実施形態にかかる、オーディオ復号器７００のブロック概略図を示している。オーディオ復号器７００は、（例えば、符号化されたオーディオ表現６１２に対応することができる）符号化されたオーディオ情報７１０を受信するように構成されており、それに基づいて、復号されたオーディオ情報７１２を提供することができる。オーディオ符号化器７００は、例えば、符号化されたオーディオ情報またはその一部を受信し、それに基づいて量子化されたスペクトル値７２２（これもＸ_ｑによって指定される）を提供する復号７２０を含むことができる。例えば、復号７２０は、バイナリ表現（例えば、２の補数表現）で符号付き整数値を提供することができる。

オーディオ復号器７００は、必要に応じて、量子化されたスペクトル値を受信し且つ逆量子化を実行することができる逆量子化器７３０を含む。例えば、逆量子化器７３０は、グローバルゲイン情報を使用して、逆量子化によって実行されるマッピングを調整することができる。

オーディオ復号器７００は、必要に応じて、逆量子化器によって提供される逆量子化されたスペクトル値７３２を受信することができ且つスケーリングを実行することによって逆量子化およびスケーリングされたスペクトル値７４２を取得することができるスケーリング７４０を含む。スケーリングは、必要に応じて、グローバルゲインに依存することができる。

オーディオ復号器７００はまた、必要に応じて、逆量子化されたスペクトル値７３０または逆量子化およびスケーリングされたスペクトル値７４２を受信することができ且つスペクトルシェーピングを実行することができる後処理７５０を含むことができる。例えば、スペクトルシェーピングは、スペクトルノイズシェーピングであってもよく、および／またはスケールファクタを使用する異なる周波数帯域のスケーリングに基づいてもよく、および／または線形予測係数を使用するスペクトルシェーピングに基づいてもよい（スペクトルシェーピングを制御する情報は、符号化されたオーディオ情報に含めることができる）。

オーディオ復号器７００はまた、必要に応じて、逆量子化されたスペクトル値７３２、逆量子化およびスケーリングされたスペクトル値７４２または後処理７５０によって提供される後処理された（例えば、スペクトル的にシェーピングされた）スペクトル値７５２を受信することができる、スペクトル領域から時間領域への変換７６０を含むことができる。スペクトル領域から時間領域への変換は、例えば、逆修正離散コサイン変換、または低遅延逆修正離散コサイン変換、または任意の他のスペクトル領域から時間領域への変換を実行することができ、それにより、スペクトル領域から時間領域への変換によって受信された入力情報に基づいて、時間領域のオーディオ表現７６２を取得することができる。

時間領域オーディオ表現７６２は、例えば、（任意の）後処理７７０に入力されることができ、これは、１つ以上の後処理ステップを実行することができ、例えば、時間領域スペクトルシェーピング（例えば、ＬＰＣフィルタリングを使用してスペクトル領域においてスペクトルシェーピングが実行されない場合）も実行することができる。

したがって、復号されたオーディオ情報７１２は、スペクトル領域から時間領域への変換７６２の出力に基づいて提供されてもよく、おそらく何らかの形態の後処理および／またはフレームリンク（重畳加算演算のような）を使用して取得されてもよい。

結論として、オーディオ復号器７００は、いくつかのオーディオ復号機能を実行することができ、例えば、ノイズシェーピングまたはスペクトルシェーピングに関する詳細は、実装ごとに大幅に変化することができる。スペクトルシェーピングまたはノイズシェーピングは、スペクトル領域で（すなわち、スペクトル領域から時間領域への変換前に）および／または時間領域で（例えば、スペクトル領域から時間領域への変換後に）実行されることができる。

しかしながら、符号化されたオーディオ情報７１０は、符号化されたオーディオ情報１１０、２１０に対応することができ、符号化されたオーディオ情報７１０は、追加の制御情報およびスペクトルシェーピングを調整するための情報を含むことができることに留意されたい。さらに、量子化されたスペクトル値７２２は、例えば、復号されたスペクトル値１３２、２３２に対応することができる。

また、復号７２０は、オーディオ復号器１００、２００に関して説明された機能の一部または全てを実行することができる。

また、復号７２０は、個別にまたは組み合わせて、本明細書で開示されるスペクトル値（またはスペクトル係数）の復号に関して本明細書で説明される特徴、機能および詳細のいずれかによって補足されることができる。

８）．図８にかかるオーディオ符号化（スペクトル値符号化）
図８は、本明細書で説明されるオーディオ符号化器のいずれかによって実行されることができる機能のフローチャートを示している。

図８を参照して（また、以下の図に関しても）説明される機能の一部または全てを、図３、図４、図５、および図６のオーディオ符号化器に引き継ぐことができることに留意されたい。

図８は、典型的には量子化されたスペクトル値とすることができるスペクトル値の符号化に焦点を合わせていることにも留意されたい。必須ではないが、スペクトル値は、バイナリの２の補数表現で表される符号付き整数値であることが好ましい。

フローチャート８００に示される機能は、グローバルゲインの第１の推定８１０を含む。この推定は、例えば、オーディオコンテンツのフレームに関連付けられることができるスペクトル値のセットに基づいて行われることができ、またビットバジェット（または、同等に、ビットレートバジェット）を考慮することができる。

図８に示すように、オーディオ符号化器またはオーディオ符号化の機能はまた、グローバルゲインの第１の推定値を使用するか、または（反復的に取得することができる）グローバルゲインの精緻化された推定値を使用して、スペクトル係数（または同等に、スペクトル値）の量子化８１４も含む。ステップ８１４では、量子化されたスペクトル（量子化されたスペクトル係数または量子化されたスペクトル値によって表すことができる）を符号化するのに必要なビット数の計算または推定がある。

ステップ８１８において実行される、必要なビット数のこの計算または推定に基づいて、ステップ８２２において、グローバルゲインを必要に応じて調整または精緻化して、それによってグローバルゲインの改善された推定値を得ることができる。

したがって、ステップ８１０、８１４、および８１８、ならびに必要に応じてステップ８２２を実行することにより、「グローバルゲイン情報」（または、一般に、スペクトル値の量子化を記述する情報）が得られ、これにより、期待されるビット数が少なくともビットバジェットにほぼ一致するような量子化をもたらすことができる。しかしながら、複雑さの制約を考慮して、グローバルゲイン情報は、グローバルゲイン情報に応じて量子化されたスペクトル値の符号化がビットバジェットと比較して多かれ少なかれなおも消費することがあるように、非常に適切ではない場合があることに留意されたい。

グローバルゲインの計算または量子化に関するいかなる詳細も、本発明にとって必須ではないことに留意されたい。むしろ、本発明にかかる実施形態は、ビットバジェットに過度に違反することなくスペクトル値が符号化されることができるように、量子化されたスペクトル値を提供する任意のメカニズムによって機能する。

機能８００は、モード決定８３０を実行することをさらに含む。しかしながら、１つのモード（本明細書では「第２のモード」として指定される）のみを使用するオーディオ符号化器も可能であるため、モード決定の実行は、任意と見なすことができる。モード決定８３０は、必要に応じて、最後に符号化された係数のモード依存識別を含む。モード決定に応じて、最後に符号化された係数の決定は、異なる方法で実行されてもよい。

「第１のモード」が使用される場合、ビットを節約するために（およびビットバジェット内にとどまるために）いくつかの非ゼロスペクトル値を符号化しないようにする決定が存在することができる。この場合、最後に符号化されたスペクトル係数に関連する周波数は、非ゼロのスペクトル値が存在する最大周波数よりも小さくなるように選択されることができる。その結果、高周波領域の一部の非ゼロスペクトル値は、第１のモードで符号化されない場合がある。

対照的に、第２のモードでは、全ての非ゼロスペクトル係数について少なくとも最上位ビットが符号化される。したがって、最後に符号化された係数は、例えば、最高周波数の非ゼロスペクトル値になるように選択されることができる。

符号化される最高周波数スペクトル値を記述するインデックスは、第１のモードと第２のモードの双方において制御情報「ｌａｓｔｎｚ」として提供される。

以下、機能８４０から８６９を参照しながら、「第１のモード」における動作を説明する。

第１のモードにおける動作は、算術符号化器初期化８４０を含む。このステップでは、算術符号化器の状態とコンテキストが初期化される。

ステップ８４４では、第１のモードの使用を示すモード情報、グローバルゲイン、および最後に符号化された係数（ｌａｓｔｎｚ）を識別する情報のように、いくつかのサイド情報が符号化される。

機能８４８から８６４は、スペクトル値ごと、またはスペクトル値のグループごとに反復される。好ましい実施形態では、２つのスペクトル値を含むグループが符号化されることに留意されたい。しかしながら、個々のスペクトル値の符号化も可能である。

スペクトル値の実際の符号化は、スペクトル係数またはスペクトル係数のグループについての最上位ビット重みの決定を含む。例えば、１つまたは２つのスペクトル係数の数表現が調べられ、「１」を含む最高値のビット位置がどれであるかが識別される。例えば、バイナリ値「０００１００００」は、ビット位置５にその最上位ビットを含み、ビット重み１６を有する。一緒に符号化されるスペクトル値のペアが考慮される場合、２つのスペクトル値の最上位ビット位置の最大値が決定される。任意の詳細については、以下に提供される「ステップ７ａ」の説明を参照されたい（図１０ａの説明を参照）。

ステップ８５２では、例えば、特定の符号化されたシンボルのシーケンスを提供することによって行うことができる最上位ビット重みが符号化され、特定の符号化されたシンボルの数は、ビット位置（または、同等に、ビット重み）を示す。例えば、算術符号化で知られている、いわゆる「エスケープシンボル」を使用することができる。機能８５２に関する任意の詳細については、例えば、以下に提供される「ステップ７ｂ」の説明を参照されたい（図１０ｃを参照）。

その後、最上位ビット符号化８５６が実行される。このステップでは、識別された最上位ビットのビット位置（または識別された最上位ビットのビット位置に隣接）の１つ以上のビット（例えば、２ビット）が符号化される。例えば、ステップ８４８においてビット重み１６を有するビット位置５が識別される場合、第１のスペクトル値のビット位置５および４（ビット重み１６および８）を有するビットは、第２のスペクトル値のビット位置５および４（ビット重み１６および８を有する）のビットとともに符号化されることができる。したがって、この例では、合計で４ビットを一緒に符号化することができ、通常、２つのスペクトル値の少なくとも１つは、ビット位置５（ビット重み１６）で「１」を有する。例えば、言及された４つのビットは、コンテキストベースの算術コーディングを使用してシンボル「ｓｙｍ」にマッピングされることができる。任意の詳細については、例えば、以下に提供される「ステップ７ｃ」の説明を参照されたい（図１０ｄを参照）。

ステップ８６０では、ビット符号化が残っている。ステップ８６０では、例えば、ステップ８５６において符号化され且つ１つ以上の最上位ビットよりも多くのビットを含む（例えば、ｎｕｍｂｉｔｓ＞２）全てのスペクトル値についての（全て）下位ビット（１つ以上の最下位ビットを含む）の符号化が存在することができる。換言すれば、ステップ８５６において部分的（ただし完全ではない）に符号化された各スペクトル値について（１つ以上の最上位ビットの符号化は、ビット重み１を有するビットに至るまで、完全な精度でスペクトル値を表現するのに十分ではなかったため）、全ての下位ビットが符号化される。

上記の例を参照すると、ビット５および４がステップ８５６において第１のスペクトル値および第２のスペクトル値について符号化されている場合、ビット１、２および３は、ステップ８６０において、第１のスペクトル値および第２のスペクトル値について符号化される。

任意の詳細については、従来のアプローチのステップ７ｄの説明を参照されたい。

ステップ８６４では、１つ以上の最上位ビットが符号化されている全ての非ゼロのスペクトル値についての符号の符号化が存在する。任意の詳細については、ステップ７ｅの説明を参照されたい（図１０ｆを参照）。

前述のように、ステップ８４８から８６４は、各スペクトル値、または最上位ビットが一緒に符号化されるスペクトル値の各グループについて反復される。

ステップ８６８では、使用されたビットの数の決定があり、ステップ８６９では、利用可能な未使用のビットがまだある場合、必要に応じて、精緻化情報の符号化がある。

結論として、第１のモードにおいて動作するとき、一部の非ゼロスペクトル値は、符号化においてスキップされるが、実際に符号化される全てのスペクトル値は、全分解能（最下位ビットまで）で符号化される。したがって、必要なビットレートの変化は、いくつのスペクトル値が符号化されないままであるか（符号化においてスキップされる）を決定することによって行うことができる。

以下では、いくつかの実施形態では唯一のモードであり得る第２のモードにおける動作を、機能８７０から８９８を参照して説明する。

第２のモードにおける符号化は、算術符号化のコンテキストにおける状態が初期化される算術符号化器初期化８７０を含む。

ステップ８７４では、グローバルゲイン情報、「ｌａｓｔｎｚ」および第２のモードが使用されることを示すモード情報（符号化器が第１のモードと第２のモードとの間で切り替え可能である場合）のようないくつかのサイド情報が符号化される。

機能８７８から８９４は、符号化される各スペクトル値、または一緒に符号化されるスペクトル値の各グループについて実行される。

ステップ８７８では、スペクトル係数（またはスペクトル値）またはスペクトル係数（またはスペクトル値）のグループの最上位ビット重みの決定が存在する。任意の詳細については、機能８４８に関する説明と、以下の「ステップ７ａ」の説明を参照されたい（図１０ａを参照）。

ステップ８８２では、最下位ビットの取り消しと最下位ビットの情報処理がある。例えば、最下位ビット情報は、１つ以上の最上位ビットと最下位ビットとの双方を含むそのようなスペクトル値の数表現において取り消される（ｎｕｍｂｉｔｓ＞２）。例えば、全ての奇数スペクトル値は、次の（隣接する）偶数値に設定されることができ、その絶対値は、奇数値の絶対値よりも小さい。例えば、値１は０に設定されることができ、値３は２に設定されることができ、値－１は０に設定されることができ、値－３は－２に設定されることができる。任意の詳細については、以下のステップ１０１０ｆ、１０１１ｆを参照されたい。

しかしながら、最下位ビットに関する情報、およびスペクトル値の符号に関する情報（スペクトル値が＋１から０または－１から０に設定される場合）は、最下位ビット情報ビットストリーム（例えば、ｌｓｂｓ［］）に格納されることができる。詳細については、例えば、以下に説明する「ステップ７ａｂｉｓ」を参照されたい（図１０ｂを参照）。

さらに、最上位ビット重み符号化８８６があり、これは、最上位ビット重み符号化８５２と等しくすることができる。任意の詳細については、ステップ７ｂ（図１０ｃ）の説明を参照されたい。

また、ステップ８８２において変更されたスペクトル値が使用される（最下位ビット値が除去された）という事実を除き、最上位ビット符号化８５６と同一とすることができる最上位ビット符号化８９０がある。任意の詳細については、ステップ７ｃおよび図１０ｄの説明を参照されたい。

さらに、下位ビット符号化８９２がある。下位ビット符号化８９２では、１つ以上の最下位ビットを除き、下位ビットの符号化がある。換言すれば、最下位ビットとステップ８９０において符号化された１つ以上の最上位ビットとの間にあるビットは、例えばそれらをビットストリームに順次書き込むことによって符号化されることができる。任意の詳細については、以下の「ステップ７ｄ－新たなバージョン」の説明を参照されたい（図１０ｅを参照）。

さらに、ステップ８８２において修正されたスペクトル値に基づいて符号が決定されるという事実を除き、符号の符号化８６４と実質的に同一である符号の符号化８９４がある。

例えば、元の（量子化された）スペクトル値が＋１の場合、スペクトル値は、ステップ８８２において０に変更されており、この符号は、非ゼロ値についてのみ符号化されるため、ステップ８９４において符号の符号化はない。同様に、スペクトル値が最初に－１であった場合（量子化後）、スペクトル値は、ステップ８８２において０に修正され、ステップ８９４において符号は符号化されない（符号はゼロ値について符号化されないため）。

符号の符号化に関する任意の詳細については、ステップ７ｅ（図１０ｆ）の説明を参照されたい。

ステップ８７８から８９４は、全てのスペクトル値またはスペクトル値のグループについて反復され、その最上位ビットは一緒に符号化される。

ステップ８９６では、最下位ビットの符号化に利用可能なビット数の決定がある。この数は、例えば、ｎｌｓｂｓによって指定され、例えば、未使用のビット数を指定することができる。

ステップ８９８では、未使用ビット（その数はステップ８９６において決定された）が最下位ビットの「実際の」符号化に使用される（符号化されたオーディオ表現への、ステップ８８２において得られた最下位ビット情報またはその一部を含む）。例えば、ステップ８８２において決定されたビットシーケンスまたはその一部は、符号化されたオーディオ表現に追加される。このビットシーケンスは、最下位ビットの取り消しによってゼロに変更されたそれらのスペクトル値の最下位ビットおよび符号を含む。

したがって、第２のモードでは、１つ以上の最上位ビットを表すシンボル、１つ以上の最下位ビット（およびいくつかの符号情報）を除く下位ビットを表すビットシーケンス、および最下位ビット（およびいくつかの符号情報）を表すビットシーケンスが提供される。下位ビットを表すシーケンスでは、下位ビット（および符号）は、スペクトル値ごとに、または一緒に符号化されたスペクトル値のペアについて連続して含めることができる。また、最下位ビットを表すビットシーケンスにおいて、最下位ビットがスペクトル値ごとに含まれる。

符号化８００に関するさらなる任意の詳細が以下に説明されることに留意されたい。ステップの擬似プログラムコード表現への参照が図８に含まれていることにも留意されたい。擬似プログラムコード表現で説明されている詳細は必須ではないが、必要に応じて、図８に示す各ステップに個別に含めることができる。

９．図９にかかるオーディオ復号（スペクトル値復号）コーディング
図９は、本明細書で説明されるようなオーディオ復号器によって実行されることができる機能の概略表現を示している。

図９に記載された機能の一部または全ては、オーディオ復号器によって実行されることができることに留意されたい。図９に記載された機能の１つまたはいくつかを個別に実装することで十分であるが、完全な機能を実装することが好ましいことに留意されたい。特に、図９に開示されている機能は、スペクトル値を表す符号化情報に基づく、復号されたスペクトル値の提供に関連している。図９に示されるような機能は、例えば、オーディオ復号器７００の復号７２０において実装されることができる。

機能９００は、ステップ９１０において、算術復号器状態の初期化、および算術復号器によって使用されるコンテキストｃの初期化を含む。任意の詳細については、例えば、以下に説明するように、復号の「ステップ１」を参照されたい。

機能９００はまた、グローバルゲインまたはグローバルゲイン情報の復号９１４、モード選択（モード１またはモード２の選択）のためのシグナリングビットの復号９１６、および最後の非ゼロ符号化された係数（「ｌａｓｔｎｚ」）に関する情報の復号９１８を含む。ステップ９１６および９１８は、任意であると見なされるべきであり、ステップ９１４は、量子化を定義する他の任意の情報の復号によって置き換えることができることに留意されたい。

機能９００は、ステップ９３０から９４８に示される第１のモードにおける復号と、ステップ９５０から９７２に示される第２のモードにおける復号とを含む。ステップ９３０から９４８で説明されているように、第１のモードにおける動作は、任意であると見なされるべきであることに留意されたい。換言すれば、２つのモード間を切り替える可能性が機能を拡張し且ついくつかの利点をもたらすとしても、オーディオ復号がステップ９５０から９７２によって説明される第２のモードにおいて動作することができれば十分でもある。

さらに、機能９００はまた、例えば、復号器７００のブロック７３０によって実行されることができる、復号されたスペクトル値の逆量子化９８０を実行することを含む。

以下、第１のモードの動作について説明する。

第１のモードにおける復号は、例えば、Ｘ_ｑ（ｎ）およびＸ_ｑ（ｎ＋１）によって指定されることができる２つの係数の１つ、２つまたはそれ以上の最上位ビットの同時復号を含むことができる最上位ビットの復号９３０を含む。最上位ビット復号９３０は、例えば、係数の（符号化された）合計ビット数（例えば、ｎｕｍｂｉｔｓ）の決定、または一緒に符号化された最上位ビットに続く係数の下位ビットの数の決定を含むことができる。

例えば、一緒に復号された２つのスペクトル係数の１つが５番目のビット位置（ビット重み１６を有する）に非ゼロ値（最上位ビット）を含むことが、（例えば、符号化されたオーディオ表現のシグナリング情報に基づいて）復号器によって認識されることができる。したがって、位置４および５のビット（ビット重み８および１６を有する）は、一緒に（グループとして）復号される２つのスペクトル値について一緒に復号される。最上位ビットのビット位置は、例えば、算術符号化および復号の分野で知られている「エスケープシンボルメカニズム」を使用して符号化されることができる。任意の詳細については、例えば、以下の「ステップ３ａ」の説明を参照されたい（図１１ａ）。

第１のモードにおける復号は、下位ビット復号９３４をさらに含む。例えば、１つ以上の最上位ビットが復号された全てのスペクトル値の１つ以上の最下位ビットを含む（全ての）下位ビットの復号が存在することができる。例えば、下位ビットは、ビットシーケンスから読み取ることができる。詳細については、例えば、下記の「ステップ３ｂ、従来のアプローチ」を参照されたい。

第１のモードにおける復号は、符号復号９３８を含み、符号は、ステップ９３０、９３４において非ゼロ値が復号された全てのスペクトル値について復号されることができる。詳細については、例えば、以下の「ステップ３ｃ」の説明を参照されたい（図１１ｃを参照）。

第１のモードにおける復号は、符号化されていないスペクトル係数のゼロ化９４２を含む。例えば、その周波数が符号化器から復号器にシグナリングされた特定の周波数を上回っている全てのスペクトル係数は、ゼロに設定されることができる。詳細については、例えば、以下の「ステップ４」の説明を参照されたい。

第１のモードにおける復号はまた、いくつかの未使用ビットの決定９４４を含む。例えば、総ビットバジェットの何ビットが前の復号ステップにおいて使用されていないかを決定することができる。

第１のモードにおける復号は、さらに、必要に応じて、例えば、復号されたスペクトル値がさらに精緻化されることができる精緻化９４８を含むことができる。詳細については、例えば、以下の「ステップ６」の説明を参照されたい。

したがって、第１のモードでは、最後の非ゼロの符号化された係数情報に関する情報によって定義された最大周波数までのスペクトル値が、符号復号を含めて完全に復号される（最上位ビットから最下位ビットまで）。

しかしながら、「ステップ３ａ」から「ステップ６」を参照して以下に説明する詳細は、必要に応じてこれらのステップに導入できることに留意されたい。しかしながら、以下に説明される全ての詳細を導入することは必須ではなく、いくつかの実施形態では、ステップの１つまたはいくつかにおいてのみ以下の詳細を維持することで十分であることに留意されたい。

以下では、ステップ９５０から９７２を参照して、第２のモードにおける復号について説明する。

第２のモードにおける復号は、例えば、１つ以上の最上位ビットの算術復号を含むことができる最上位ビット復号９５０を含む。例えば、最上位ビット復号９５０は、係数の総ビット数、または係数の下位ビットの数、または１つ以上の最上位ビットのビット位置（またはビット重み）の決定を含むことができる。さらに、最上位ビット復号９５０は、２つのスペクトル係数またはスペクトル値Ｘ_ｑ（ｎ）、Ｘ_ｑ（ｎ＋１）の１つ、２つ、またはそれ以上の最上位ビットの同時復号を含むことができる。

任意の詳細については、例えば、以下の「ステップ３ａ」の説明を参照されたい（図１１ａ）。

第２のモードにおける復号はまた、任意であると見なすことができる下位ビット復号９５４も含む。下位ビット復号９５４では、１つ以上の最下位ビットを除いて、下位ビットの復号が行われる。下位ビット復号９５４は、最下位ビットまたは複数の最下位ビットが下位ビット復号９５４において省略されるという事実を除いて、下位ビット復号９３４と同様とすることができる。任意の詳細については、例えば、以下の「ステップ３ｂ」（新バージョン）の説明を参照されたい（図１１ｂ）。

第２のモードにおける復号は、ステップ９５０、９５４において復号されたスペクトル値の復号された部分（１つ以上の最下位ビットを含まない）が非ゼロ値を示す限り、ステップ９５０、９５４において復号されたスペクトル値の符号が復号される符号復号９５８も含む。任意の詳細については、例えば、以下の「ステップ３ｃ」の説明を参照されたい（図１１ｃ）。

ステップ９５０、９５４、９５８は、復号される全てのスペクトル値、または復号される全てのスペクトル値のグループについて反復されることに留意されたい。ここで、復号されるいくつかのスペクトル値は、例えば、符号化器から提供された、最後の非ゼロ符号化係数情報によって示されることができる。

第２のモードにおける復号はまた、符号化器によって提供されておらず且つ最後の非ゼロ符号化係数情報を考慮して復号されていない、符号化されていないスペクトル係数のゼロ化９６２も含む。任意の詳細については、以下のステップ４の説明を参照されたい。

さらに、最下位ビット復号に利用可能なビット数の決定９６８がある。換言すれば、未使用のビットの数（復号ステップ９５０、９５４、９５８において使用されなかったビットバジェットのビット）が決定される。詳細については、例えば、以下の「ステップ５」の説明を参照されたい。

第２のモードにおける復号はまた、１つ以上の最上位ビットよりも多くのビットを有する係数のための１つ以上の最下位ビットの選択的復号９７２を含む。換言すれば、前述のスペクトル値の一部（全てではない）のみが最下位ビット情報によって精緻化されるように、ステップ９５０、９５４、９５８において復号された一部のスペクトル値のみについて１つ以上の最下位ビットが復号されることができる。ステップ９７２は、例えば、ステップ９５０および９５４でゼロ値が復号され（ステップ９５８において符号が復号されなかったなど）且つ最下位ビット情報が非ゼロ値を示すようなスペクトル値の符号の検討を含むことができる。したがって、スペクトル値（またはスペクトル係数）は、最下位ビットおよび符号情報を含むビットシーケンスからの最下位ビット情報によって精緻化される。精緻化されるスペクトル値の数は、最下位ビットに利用可能なビット数の決定９６８の結果に依存する。

したがって、第２のモードにおける復号は、（最下位ビットを含む）完全な精度を有するいくつかのスペクトル値と、（最下位ビットを有しない）精度を低下させたいくつかのスペクトル値とを提供する。

以下に説明する「ステップ３ａ」から「ステップ６」の詳細は、任意に使用することができることに留意されたい。しかしながら、以下に説明する「ステップ３ａ」から「ステップ６」の詳細は、必須であると見なすべきではない。また、「ステップ３ａ」から「ステップ６」を参照して以下に説明する全ての詳細を使用する必要を生じさせることなく、個々のステップの詳細を導入できることに留意されたい。

さらに、機能９００はまた、逆量子化９８０を実行することも含み、第１のモードにおいて復号されたスペクトル値および／または第２のモードにおいて復号されたスペクトル値は、逆量子化される。逆量子化では、ステップ９１４において復号されたグローバルゲイン情報を適用することができる。しかしながら、逆量子化を設定するための様々な可能性も使用することができる。

１０）．図１０ａ～図１０ｆにかかる符号化方法
以下では、ＭＤＣＴスペクトルＸ（ｎ）、０≦ｎ＜Ｎを量子化および符号化するステップの例示的な実装について説明する。この方法は、例えば、オーディオ符号化器３００、４００、５００において、またはオーディオ符号化器６００において使用されることができる（またはそれらによって実行されることができる）。本明細書で説明する特徴は、個別にまたは組み合わせて、機能８００に引き継ぐこともできる。特に、いくつかの実施形態では唯一のモードとすることができるモード２における動作に焦点が当てられる。

以下、第１のステップについて説明する。第１のステップは、グローバルゲインの第１の推定を含む。例えば、この第１の推定では、スペクトルを量子化することも、算術符号化器によって消費されるビット数を計算することもない。これは、ＭＤＣＴ係数のグループのエネルギーと、グローバルゲインの第１の大まかな推定値を取得するための複雑さの低い反復アプローチのみに基づいている。例えば、ＮＢＣ仕様のセクション１．３．８．２を参照されたい。

以下、第２のステップについて説明する。第２のステップは、ステップ１において見つかったグローバルゲインを使用したＭＤＣＴスペクトルの量子化を含む。これは、量子化されたＭＤＣＴスペクトルＸ_ｑ（ｎ）０≦ｎ＜Ｎを生成する。詳細については、例えば、ＮＢＣ仕様のセクション１．８．３を参照されたい。

以下、第３のステップについて説明する。第３のステップは、量子化されたスペクトルＸ_ｑ（ｎ）を符号化するために必要なビット数の計算を含む。さらに、このステップはまた、従来のアプローチ（「第１のモード」とも呼ばれる）を使用するか、新たなアプローチ（「第２のモード」とも呼ばれる）を使用するかを決定することもできる。例えば、ステップは、本明細書で言及されるシグナリングビット（例えば、第１のモードまたは第２のモードのどちらを使用すべきかをシグナリングするシグナリングビット）を設定することができる。例えば、消費されたビット数がビットバジェットを上回り且ついくつかの基準が満たされた場合（例えば、高いビットレートが使用された場合）、新たなアプローチ（第２のモード）を使用することができる。消費されたビットの数がビットバジェットを下回っている場合、または基準（例えば、第２のモードの使用に関する基準）が満たされていない場合は、従来のアプローチ（第１のモード）を使用することができる。

最後に、第３のステップは、最後の非ゼロの符号化係数ｌａｓｔｎｚを見つける。これは、従来のアプローチの説明において説明したように（すなわち、スペクトルを切り捨てるため）、従来のアプローチが選択された場合にのみ見つかる（「このステップは、切り捨てられたスペクトルの消費されたビット数がビットバジェット内に収まることができるように、最後の非ゼロの符号化係数ｌａｓｔｎｚのインデックスを見つける、ＮＢＣ仕様のセクション１．３．８．４を参照されたい」）。新たなアプローチ（第２のモード）が選択された場合、スペクトルは、切り捨てられず、ｌａｓｔｎｚは、単純に最後の非ゼロ係数（例えば、最高周波数の非ゼロスペクトル係数）に対応する。

以下、ステップ４について説明する。第４のステップは、ステップ３において計算されたビット数の関数としてグローバルゲインを調整することを含む。ビット数が多すぎると、グローバルゲインが増加する。ビット数が少なすぎると、グローバルゲインが減少する。次に、ステップ２および３が必要に応じてやり直される。ステップ４は、最適なグローバルゲインが見つかるまで数回反復されることができる。しかしながら、複雑度を低くする必要がある場合は、ステップ４を実行しなくてもよく、または１回だけ実行してもよい（例えば、ＮＢＣのように、ＮＢＣ仕様のセクション１．３．８．６を参照）。

以下、ステップ５について説明する。ステップ５は、算術符号化器状態の初期化、および算術符号化器によって使用されるコンテキストｃの初期化を含む。

以下、ステップ６について説明する。ステップ６は、サイド情報としてグローバルゲインおよび最後の非ゼロ符号化係数ｌａｓｔｎｚを符号化することを含む。さらに、このステップはまた、シグナリングビット（例えば、第１のモードと第２のモードのどちらを使用するかを示すシグナリングビット）もサイド情報として符号化する。

以下、ステップ７について説明する。しかしながら、ステップ７は、サブステップ７ａから７ｅを全て反復することを含む（ｎ＝０；ｎ＜ｌａｓｔｎｚ；ｎ＋＝２）。換言すれば、ｎがｌａｓｔｎｚよりも小さい限り、ステップ７ａから７ｅは、ｎ＝０から開始して反復され、ｎは各反復において２ずつ増加する。各反復において２つのスペクトル値が処理され、通常は全ての非ゼロスペクトル値が処理される（モード２では、少なくとも最上位ビットが全ての非ゼロスペクトル値について符号化されるようにｌａｓｔｎｚが選択されるため）。

以下、ステップ７ａについて説明する。ステップ７ａは、２つの係数Ｘ_ｑ（ｎ）およびＸ_ｑ（ｎ＋１）（好ましくは整数値である）の振幅（または大きさ、または絶対値）を表すのに必要な最小ビット数を計算することを含む。例示的な実装に関する詳細については、図１０ａの擬似プログラムコード（参照符号１０００ａを参照）を参照されたい。より大きな絶対値を有する係数は、２つの係数の振幅（大きさ、絶対値）を表すために必要な最小ビット数を決定する。

以下、ステップ７ａ－ｂｉｓについて説明するが、これは、例えば、ステップ７ａと７ｂとの間に実行することができる。換言すれば、ステップ７ａ－ｂｉｓは、ステップ７ａの直後の追加ステップであり、ｎｕｍｂｉｔｓが２よりも大きい場合（ｎｕｍｂｉｔｓ＞２）に実行される。換言すれば、Ｘ_ｑ（ｎ）および／またはＸ_ｑ（ｎ＋１）を表すために２つの最上位ビットよりも多くのビットが必要な場合、ステップ７ａ－ｂｉｓが実行される。ステップ７ａ－ｂｉｓでは、各係数の最下位ビットが「保存」され、次にその最下位ビットがゼロになるように係数が変更される。係数の符号はまた、係数が元々非ゼロであり且つ最下位ビットをゼロに設定した後にゼロになる場合にも保存される。

この機能に関する詳細については、例えば、図１０ｂに示される擬似プログラムコード表現を参照されたい。

参照符号１０１０ａでわかるように、Ｘ_ｑ［ｎ］の絶対値の最下位ビットが抽出され、変数ｎｌｓｂｓを実行することによって示される位置のビットシーケンスｌｓｂｓに保存される（参照：参照符号１０１０ｂ）。次に、実行中の変数ｎｌｓｂｓを増加させて、ビットシーケンスｌｓｂｓ内の次の未使用ビットを参照する。Ｘ_ｑが＋１または－１であることが判明した場合（参照符号１０１０ｃの条件）、参照符号１０１０ｄでわかるように、Ｘ_ｑ［ｎ］が０よりも大きい場合は符号ビットが０に設定され、Ｘ_ｑが０よりも小さい場合は符号ビットが１に設定される。また、Ｘ_ｑが＋１または－１の場合、符号ビットは、次のビットとして、参照符号１０１０ｅで示されるビットシーケンスｌｓｂｓに保存される。さらに、符号付きスペクトル値Ｘ_ｑは、次に、小さい振幅を有する隣接する偶数値に不均一な値が設定されるように変更される。この機能は、参照符号１０１０ｆで示されている。

しかしながら、全体的な機能が変更されないままである限り、処理ステップ１０１０ａから１０１０ｆの順序を変更できることに留意されたい。当然ながら、中間量を保存することもできる。

さらに、同じ機能がまた、参照符号１０１１ａから１０１１ｆで示されるスペクトル値Ｘ_ｑ［ｎ＋１］についても実行されることに留意されたい。

したがって、ステップ７ａ－ｂｉｓは、ｎｕｍｂｉｔｓが２よりも大きい全てのスペクトル値の最下位ビットを表すビットシーケンスｌｓｂｓを提供する。ここで、ｎｕｍｂｉｔｓが２よりも大きく且つ＋１または－１の値をとる（例えば、それらは、スペクトル値が大きいグループに属しているため）スペクトル値のビットシーケンスｌｓｂｓには符号ビットが含まれている。シーケンスｌｓｂｓのビットは、スペクトル値のシーケンスにおいて順序付けされているが、ｎｕｍｂｉｔｓが２以下である（すなわち、２つの最上位ビットによって完全に表される）ようなスペクトル値のシーケンスｌｓｂｓにはビットが存在しない。

以下、ステップ７ｂについて説明する。このステップ７ｂでは、値「ｎｕｍｂｉｔｓ」に関する情報が符号化される（ｎｕｍｂｉｔｓがステップ７ａにおいて決定され、スペクトル値またはスペクトル値のグループについて符号化される最上位ビットのビット重みを記述している場合）。例えば、ステップ７ｂは、ｎｕｍｂｉｔｓが２よりも大きい場合、ｎｕｍｂｉｔｓ－２エスケープ値（例えば、ＶＡＬ＿ＥＳＣ＝１６によって表される）を符号化することを含む。詳細については、図１０ｃ（参照符号１０２０ａ）を参照されたい。例えば、エスケープ値は、算術符号化を使用して符号化され、算術符号化の確率を取得するためにコンテキストが評価される。エスケープシンボルは、確率ｐを使用した算術符号化によって符号化される。さらに、コンテキストが更新される。

しかしながら、このステップのいかなる詳細も、本発明にとって必須ではない。

以下、ステップ７ｃについて説明する。ステップ７ｃは、各係数Ｘ_ｑ（ｎ）およびＸ_ｑ（＋１）の２つの最上位ビットを単一のシンボルｓｙｍ（その値は０と１５との間にある）として符号化することを含む。ステップ１０４０ａでは、値ｎｕｍｂｉｔｓに基づいて、Ｘ_ｑ［ｎ］およびＸ_ｑ［ｎ＋１］の（バイナリ）数表現が何ビット右にシフトされるかによって決定される（ｎｕｍｂｉｔｓ＞２の場合にステップ７ａ－ｂｉｓにおいて変更されたとき）。これは、参照符号１０４０ａで示され、任意として見なされることができる。ステップ１０４０ｂでは、ｎｕｍｂｉｔｓによって決定されたビット位置のビットが変数ａに格納されるように、Ｘ_ｑ［ｎ］が処理される。ステップ１０４０ｃでは、ｎｕｍｂｉｔによって決定されたビット位置のビットが変数ｂに引き継がれるようにＸ_ｑ［ｎ＋１］が処理される。換言すれば、２つの最上位ビットと見なされるビット位置のビットは、変数ａおよびｂに引き継がれる。

その結果、参照符号１０４０ｄで示されるように、Ｘ_ｑ［ｎ］およびＸ_ｑ［ｎ＋１］の２つの最上位ビットを組み合わせる４ビット値が決定される。次に、変数ｓｙｍは、一緒に符号化される２つのスペクトル値のそれぞれの２つの最上位ビットを含む４ビットシンボルを表す。次に、算術符号化の確率が算術符号化のコンテキストｃから決定され、シンボルｓｙｍが算術符号化を使用し且つコンテキストから決定された確率ｐを考慮して符号化される。その後、コンテキストが更新される。

したがって、一緒に符号化される２つのスペクトル値の２つの最上位ビットを表すシンボルｓｙｍの算術符号化表現が得られる。

以下、ステップ７ｄについて説明する。ステップ７ｄは、最下位ビットを除いた残りのビット（「中間ビット」または「下位ビット」とも呼ばれる）の符号化を含む。詳細については、擬似プログラムコード表現を示す図１０ｅを参照されたい。見てわかるように、実行中の変数ｂは、ｂ＝１からｎｕｍｂｉｔｓ－３まで実行される。したがって、ステップ７ｃにおいて一緒に符号化された２つの最上位ビットが少なくともビット位置３および４（ビット値４および８を有する）またはより高いビット位置であれば、ビットは、ビット位置２（ビット値２を有する）から開始して符号化される。したがって、スペクトル値Ｘ_ｑ［ｎ］およびＸ_ｑ［ｎ＋１］の絶対値のビット位置（ｂ＋１）のビットは、サイド情報として符号化される。したがって、最下位ビットと２つの最上位ビットとの間にある任意のビットは、（ｎｕｍｂｉｔｓによって定義される最上位ビットのビット位置に依存する）そのようなビットが存在するという条件で、ステップ７ｄにおいてサイド情報として符号化される。

例えば、参照符号１０５０ａで示されるループは、ｂ＝１からｂ＝ｎｕｍｂｉｔｓ－３まで実行される（ｎｕｍｂｉｔｓが４以上の場合）。参照符号１０５０ｂでわかるように、Ｘ_ｑ［ｎ］の絶対値のビット位置ｂ＋１のビットは、サイド情報として符号化される。参照符号１０５０ｃでわかるように、Ｘ_ｑ［ｎ＋１］の絶対値のビット位置ｂ＋１のビットは、サイド情報に符号化される。実行中の変数ｂがｎｕｍｂｉｔｓ－２に到達するまで、ステップ１０５０ｂおよび１０５０ｃが反復される。

以下、ステップ７ｅについて説明する。ステップ７ｅは、係数が０の場合を除いて、各係数（またはスペクトル値）の符号を符号化することを含む。ステップ７ｅでは、ステップ７ａ－ｂｉｓにおいて変更された係数が考慮されることに留意されたい。換言すれば、Ｘ_ｑの元の値（ステップ７ａ－ｂｉｓにおける変更前）が２以上または－２以下の場合、スペクトル値Ｘ_ｑの符号が符号化される。対照的に、Ｘ_ｑ［ｎ］が元々０に等しいか、ステップ７ａ－ｂｉｓにおいて０に設定された場合、ステップ７ｅにおける符号の符号化はない。（変更された）スペクトル値Ｘ_ｑ［ｎ］が０に等しいかどうかに関するチェックは、参照符号１０６０ａで見られ、Ｘ_ｑ［ｎ］の正の値についての符号ビット「０」およびＸ_ｑ［ｎ］の負の値についての符号ビット「１」の提供は、参照符号１０６０ｂにおいて見ることができる。サイド情報としての符号値の符号化は、参照符号１０６０ｃで示されている。

同様の機能がまた、参照符号１０６１ａ、１０６１ｂ、および１０６１ｃで示されるＸ_ｑ［ｎ＋１］についても実行される。

以下、ステップ８について説明する。ステップ８は、算術符号化器を終了し、いくつかの未使用ビットを計算することを含む。例えば、ステップ７ｂ、７ｃ、７ｄおよび７ｅにおいて、総ビットバジェットの何ビットが未使用のままであるかが計算されることができる。

以下、ステップ９について説明する。ステップ９では（新たなアプローチが選択された場合、または第２のモードが選択された場合、または符号化器が第２のモードのみを使用する場合）、残余量子化／符号化は、（従来の概念のように）使用されない。未使用のビットがある場合、これらは、ｌｓｂｓ［］に保存されるｎｌｓｂｓビットの符号化に使用される（ステップ７ａ－ｂｉｓを参照）。換言すれば、例えばステップ７ａから７ｅの完了後に、ビットバジェットの全てのビットが使用されていないことが判明した場合、ステップ７ａ－ｂｉｓにおいて提供されたビットシーケンスｌｓｂｓのビット数がビットストリームに（または、一般には、符号化されたオーディオ表現に）含まれる。符号化されたオーディオ表現に含まれるビットシーケンスｌｓｂｓのビット数は、例えば、ビットバジェットが完全に使用される（例えば、最大で１または２ビットまで、さらには完全に）ように、未使用のビット数によって決定されることができる。

結論として、本明細書で説明されているステップまたはその詳細は、図８の機能を実行するときに使用されることができることに留意されたい。例えば、ここで説明されているステップ１から４、またはその詳細を使用して、機能８１０、８１４、８１８、８３０を実装することができる。

さらに、ここで説明するステップ５から９は、機能８７０、８７４、８７８、８８２、８８６、８９０、８９２、８９４、８９６、および８９８を実装するために使用されることができる。しかしながら、本明細書で説明される詳細は、機能８００のステップに個別に引き継がれることができることに留意されたい。

１１）．図１１ａから図１１ｄにかかるオーディオ復号
以下では、図１１ａから図１１ｄを参照して、オーディオ復号機能について説明する。ここで説明する復号機能を使用して、スペクトル値を表す符号化情報に基づいて復号されたスペクトル値を提供することができる。ここで説明する機能は、例えば、図１および図２にかかるオーディオ復号器および図７にかかるオーディオ復号器７００（例えば、復号７２０を実装するため）において使用することができる。ここで説明するステップは、機能９００において使用して、例えば、機能９１０、９５０、９５４、９５８、９６２、９６８、９７２を実装することもできる。

以下、スペクトル値を復号するための機能を段階的に説明する（「第２のモード」または第２のモードのみが使用される場合の復号に焦点を当てている）。

以下、第１のステップについて説明する。第１のステップは、算術復号器状態の初期化と、算術復号器によって使用されるコンテキストｃの初期化とを含む。

以下、第２のステップについて説明する。第２のステップは、グローバルゲイン（またはグローバルゲイン情報、または逆量子化を説明する他の情報）および最後の非ゼロ符号化された係数情報「ｌａｓｔｎｚ」を復号することを含む。換言すれば、第２のステップは、いくつかのサイド情報または制御情報を復号することを含む。さらに、第２のステップはまた、シグナリングビット（例えば、第１のモードと第２のモードのどちらを使用するかを定義するシグナリングビット）も復号する。

以下、ステップ３について説明する。例えば、ステップ３は、全てについてステップ３ａから３ｃを反復することを含む（ｎ＝０；ｎ＜ｌａｓｔｎｚ；ｎ＋＝２）。換言すれば、ステップ３ａから３ｃは、復号される全てのスペクトル値（ｌａｓｔｎｚによって定義）について反復され、２つのスペクトル値のグループが一緒に処理される。

以下、ステップ３ａについて説明する。ステップ３ａは、双方の係数（またはスペクトル値）Ｘ_ｑ（ｎ）およびＸ_ｑ（ｎ＋１）の２つの最上位ビットを復号することを含む。ステップ３ａの詳細を図１１ａに示す。

ステップ３ａは、復号されるべき２つの最上位ビットのビット位置を表す変数ｎｕｍｂｉｔｓの決定を含む。変数ｎｕｍｂｉｔｓは、参照符号１１１０ａにおいて１に初期化される。続いて、ステップ１１１０ｂにおいて（以前に初期化された）コンテキストから確率ｐが取得され、ステップ１１１０ｃにおいて算術復号を使用して且つ確率ｐを使用してシンボルｓｙｍが復号される。続いて、ステップ１１１０ｄにおいてコンテキストが更新され、ステップ１１１０ｅにおいて変数ｎｕｍｂｉｔｓが１だけ増加される。しかしながら、復号されたシンボルｓｙｍがエスケープシンボルである場合、ステップ１１１０ｂ、１１１０ｃ、１１１０ｄ、１１１０ｅが反復される。したがって、第１の復号されたシンボルがエスケープシンボルでない場合、ｎｕｍｂｉｔｓは２に設定され、復号される最上位ビット位置は、ビット位置１および２（ビット値１および２を有する）のビットを定義する。しかしながら、算術復号によって１つ以上のエスケープシンボルが識別されると、変数ｎｕｍｂｉｔｓがさらに増加され、復号される最上位ビットのより高いビット重みを示し、これは、１つ以上の最下位ビットの「場所」があることも示す。しかしながら、最後に復号されたシンボルがエスケープシンボルではないことが判明するとすぐに、可変のｎｕｍｂｉｔｓによって定義されたビット重みを有する最上位値が、復号されたシンボルに基づいて決定される。例えば、シンボルが４ビット値で表される場合、４ビット値の２ビットを使用してスペクトル値Ｘ_ｑ［ｎ］の２つの最上位ビットを定義し、４ビット値の２ビットを使用してスペクトル値Ｘ_ｑ［ｎ＋１］の２つの最上位ビットを定義する。詳細は、参照符号１１１０ｆおよび１１１０ｇで見ることができる。したがって、算術復号によって復号される０、１またはそれ以上のエスケープシンボルは、最上位ビットのビット重みを決定し、エスケープシンボルではないシンボルは、２つのスペクトル値の最上位ビットのビット値を定義する。

以下、ステップ３ａ－ｂｉｓについて説明する。ステップ３ａ－ｂｉｓは、ステップ３ａの直後の追加ステップである。このステップは、後でステップ６において再利用されることができるように、ｎｕｍｂｉｔｓを配列ｎｕｍｂｉｔｓ［ｎ］に保存する。換言すれば、変数ｎｕｍｂｉｔｓの値は、後で使用するために復号されたスペクトル値の全てのペアについて維持される。しかしながら、これは補助的なステップにすぎない。

以下、ステップ３ｂについて説明する。ステップ３ｂは、最下位ビットを除く残りのビットを復号することを含む。詳細については、図１１ｂを参照されたい。ここで、ステップ３ｂは、ｎｕｍｂｉｔｓが４以上の場合、すなわち、スペクトル値（または一緒に処理されたスペクトル値のペアからの少なくとも１つのスペクトル値）のバイナリ数表現が２つの最上位ビットと１つの最下位ビットよりも多くのビット（すなわち、少なくとも４ビット）を含む場合にのみ、残りのビットを復号することに留意されたい。そのビット位置が最下位ビットと２つの最上位ビットの間にあるこれらのビットは、ビット位置２を有するビットから始まり、より高いビット位置（存在する場合）のビットに向かって進んでその後に復号される。この目的のために、実行中の変数ｂは１に初期化され、ｂがｎｕｍｂｉｔｓ－２よりも小さい限り、ビットの復号が実行される。ループ機能は、参照符号１１２０ａで示され、第１のスペクトル値Ｘ_ｑのビットの復号は、参照符号１１２０ｂで示され、そのビット重みによって重み付けされたビットの第１のスペクトル値への追加は、参照符号１１２０ｃで示され、第２のスペクトル値Ｘ_ｑ［ｎ＋１］のビットの復号は、参照符号１１２０ｄで示され、そのビット重みによって重み付けされたビットの追加は、参照符号１１２０ｅで示されている。

以下、ステップ３ｃについて説明する。ステップ３ｃは、係数（またはスペクトル値）が０である場合を除いて、各係数の符号を復号することを含む。

例えば、これまでに（最下位ビットを考慮せずにステップ３ａおよび３ｂにおいて）復号されたスペクトル係数が０に等しいかどうかがチェックされる（参照符号１１３０ａを参照）。スペクトル値Ｘ_ｑ［ｎ］が０と異なる場合、符号ビットが復号され（ステップ１１３０ｂ）、符号ビットが１に等しい場合（参照符号１１３０ｃでチェックされる）、Ｘ_ｑ［ｎ］の符号は、反転される（参照符号１１３０ｄを参照）。参照符号１１３１ａから１１３１ｄで示されるように、同様の機能が第２のスペクトル値について実行される。

以下、ステップ４について説明する。ステップ４では、インデックスｎがｌａｓｔｎｚ以上の全ての係数（またはスペクトル値）が０に設定される。したがって、（サイド情報「ｌａｓｔｎｚ」によって通知される）符号化器によって符号化されていないそれらのスペクトル係数は、明確な値（０）に設定される。

以下、ステップ５について説明する。

ステップ５は、算術復号器の終了と未使用ビットの数の計算とを含む。例えば、ステップ３ａ、３ｂ、および３ｃにおいて復号されたビット数が計算されることができ、これまでに合計ビットバジェットのビット数が使用されていないことがわかる。

以下、ステップ６について説明する。第６のステップでは、未使用のビットがある場合、ｎｌｓｂｓビットが復号され、ｌｓｂｓ［］に格納される。換言すれば、ｎｌｓｂｓビットのシーケンスは、最下位ビットの精緻化に使用され、それらは、直接使用されることができるか、または配列ｌｓｂｓ［］のような中間データ構造に格納されることができる。次に、ｎｕｍｂｉｔｓ［ｎ］が２よりも大きい場合、復号されたｌｓｂビット（または最下位ビット）を使用して、（インデックスｎおよびｎ＋１を有するそれぞれのスペクトル値について）係数（ｎ，ｎ＋１）（またはスペクトル値Ｘ_ｑ［ｎ］およびＸ_ｑ［ｎ＋１］）が精緻化される。

詳細については、図１１ｄを参照されたい。

参照符号１１４０ａでわかるように、実行変数ｋは、０に初期化される。次に、ループ処理がスペクトル値の全てのペアについて実行され、ループ定義は、参照符号１１４０ｂに見ることができる。しかしながら、ループ処理では、２つの最上位ビットよりも多くのビットを含まないスペクトル値の任意のペアはスキップされることに留意されたい。現在処理されているスペクトル値のペアが最上位ビットよりも多くのビットを含むかどうかのチェックは、参照符号１１４０ｃに見ることができる。また、処理（例えば、最下位ビット情報を使用したスペクトル値の精緻化）は、処理されたビットの数が最下位ビットの精緻化に利用可能なビットの総数ｎｌｓｂｓに到達すると、いずれの場合にも（２つの最上位ビットよりも多くのビットを有する全てのスペクトル値が考慮されていない場合であっても）停止されることに留意されたい。ループ処理の中断は、例えば、コマンド「ｂｒｅａｋ」によって行われ、通常、ビットシーケンスまたは配列ｌｓｂｓからの新たなビットが評価される前に最下位ビットの精緻化に利用可能な最大ビット数に到達したかどうかに関する評価があることがわかる。例えば、参照符号１１４０ｅに見ることができるビットシーケンスまたは配列ｌｓｂｓからの新たなビットの読み取りに先行する全ての利用可能なビットが参照符号１１４０ｄにおいて評価されたかどうかのチェックがある。（参照符号１１４０ｅでの）ビットシーケンスまたは配列ｌｓｂからのビットの読み取りに続いて、ビット値に応じて、また以前に復号されたスペクトル値Ｘ_ｑ［ｎ］の値にも応じて、異なるアクションがとられる。ステップ１１４０ｅで読み取られた精緻化ビットの値がゼロである場合、（ビットが以前に復号された値の修正の必要がないことを示すため）それ以上のアクションはとられない。対照的に、ステップ１１４０ｅで読み取られた精緻化ビットの値が「１」である場合、とられるアクションは、スペクトル値Ｘ_ｑ［ｎ］の実際の値に依存する。スペクトル値Ｘ_ｑがゼロよりも大きく且つステップ１１４０ｅで読み取られたビットが「１」である場合、スペクトル値Ｘ_ｑ［ｎ］は、１だけ（すなわち、最下位ビット値だけ）増加され、これは、参照符号１１４０ｆに見ることができる。スペクトル値Ｘ_ｑ［ｎ］が負であり且つステップ１１４０ｅで読み取られたビット値が「１」である場合、スペクトル値Ｘ_ｑ［ｎ］は、１だけ（すなわち、最下位ビット値だけ）減らされる。

しかしながら、値Ｘ_ｑが０であり且つステップ１１４０ｅで読み取られたビットのビット値が「１」である場合、参照符号１１４０ｉに示されるように、他のビットがビットシーケンスまたは配列ｌｓｂから読み取られ、ステップ１１４０ｉにおける他のビットの読み取りは、利用可能なビットの総数に既に到達しているかどうかのチェックによって先行される（これは、「ｂｒｅａｋ」コマンドによるループの中断につながる）。続いて、Ｘ_ｑ［ｎ］の値は、参照符号１１４０ｊで示される、ステップ１１４０ｉにおいて読み取られた「符号ビット」の値に応じて、＋１または－１に選択的に設定される。続いて、ステップ１１４０ｄから１１４０ｊは、第２のスペクトル値Ｘ_ｑ［ｎ＋１］について反復される。

結論として、最下位ビットの精緻化に利用可能なビットシーケンスまたは配列ｌｓｂｓの全てのビットが使い果たされていない限り、前記ビットシーケンスまたは配列ｌｓｂｓからの「精緻化ビット」の処理が存在する。以前に復号されたスペクトル値Ｘ_ｑ［ｎ］、Ｘ_ｑ［ｎ＋１］が０と異なる場合、前記スペクトル値の大きさは、ビットシーケンスまたは配列ｌｓｂｓから読み取られた「精緻化ビット」に応じて、最下位ビット値だけ選択的に増加される。以前に復号されたスペクトル値Ｘ_ｑ［ｎ］、Ｘ_ｑ［ｎ＋１］が０の場合、ビットシーケンスまたは配列ｌｓｂｓから「符号ビット」がさらに抽出され、符号ビットは、スペクトル値が最下位ビット値によって変更される必要があることを以前の（第１の）精緻化ビットが示す場合、スペクトル値Ｘ_ｑ［ｎ］、Ｘ_ｑ［ｎ＋１］が＋１または－１に設定される必要があるかどうかを決定する。対照的に、スペクトル値Ｘ_ｑ［ｎ］、Ｘ_ｑ［ｎ＋１］の値が変更されないままでおく必要があることを精緻化ビットが示す場合、符号ビットは使用されない。

換言すれば、スペクトル値に関連付けられた第１の精緻化ビットは、スペクトル値の大きさが１つの最下位ビット値だけ増加される必要があるかどうかを示すビットと見なすことができ、第２の精緻化ビット（符号ビット）は、以前に復号されたスペクトル値が０であった場合にのみ使用される。

したがって、精緻化には非常に効率的な概念があり、通常、スペクトル値の最下位ビットの精細化には１ビットのみが必要であり、２ビット（精緻化が必要かどうかを決定するビットおよび符号を決定するビット）は、以前に復号されたスペクトル値が０である場合にのみ必要である。

ここで説明される機能は、例えば、復号機能９００で使用されてもよいことに留意されたい。

擬似プログラムコードを参照してここで詳細に説明する特徴は、図９に示すように、個別にまたは組み合わせて機能に導入されることができる。しかしながら、ありとあらゆる詳細を含める必要はなく、ここで説明する詳細は、個別に解釈すると有利な場合があることに留意されたい。

１１）．結論
１１．１）一般
以下に、本発明のいくつかの基本的なアイデアを要約する。特に、本明細書で言及された態様は、本発明の実施形態に、個別にまたは他の態様と組み合わせて実装されることができる。

本発明にかかる実施形態は、より低いビットレートでは、従来のアプローチは符号化性能を大幅に低下させる可能性があるという知見に基づいている。高いビットレートでは、高いビットバジェットが、高周波数係数であっても、スペクトル全体を高精度に量子化することを可能にすることがわかっている。高周波係数の一部を０に設定すると、高周波にかなりの量の歪みを追加し、復号された出力信号の透過的な品質を妨げることもわかっている。図１２では、オーディオ信号の全てのフレームと、３２ｋｂｐｓの低ビットレートおよび１２８ｋｂｐｓの高ビットレートの２つのビットレートについて、ＭＤＣＴスペクトルのＳＮＲがプロットされている。３２ｋｂｐｓでのＳＮＲは、一貫しているように見えるが、１２８ｋｂｐｓでのＳＮＲは、大きな下落を含む。これらの下落は、消費されたビット数がビットバジェットを超えたために、高周波係数が切り捨てられたフレームに対応している。

１１．２）．従来のアプローチの段階的な説明
以下では、従来のアプローチで実行される、ＭＤＣＴスペクトルＸ（ｎ）、０≦ｎ＜Ｎを量子化および符号化するために必要なステップについて説明する。

符号化器
・ステップ１：グローバルゲインの第１の推定を行う。この第１の推定は、スペクトルを量子化することも、算術符号化器によって消費されるビット数を計算することもない。それは、ＭＤＣＴ係数のグループのエネルギーとグローバルゲインの第１の粗い推定を取得するための複雑さの低い反復アプローチのみに基づいている。（ＮＢＣ仕様のセクション１．３．８．２を参照）
・ステップ２：ステップ１で見つかったグローバルゲインを使用したＭＤＣＴスペクトルを量子化する。これは、量子化されたＭＤＣＴスペクトル

、

を生成する。（ＮＢＣ仕様のセクション１．３．８．３を参照）
・ステップ３：量子化スペクトル

の符号化に必要なビット数を計算する。ビット数がビットバジェットを超える場合、このステップはまた、切り捨てられたスペクトルの消費ビット数がビットバジェット内に収まることができるように最後の非ゼロの符号化された係数ｌａｓｔｎｚのインデックスも見つける。（ＮＢＣ仕様のセクション１．３．８．４を参照）
・ステップ４：ステップ３で計算されたビット数の関数としてグローバルゲインを調整する：ビット数が多すぎる場合は、グローバルゲインを増やす；ビット数が少なすぎる場合は、グローバルゲインを減らす。次に、ステップ２および３をやり直す。ステップ４は、最適なグローバルゲインが見つかるまで数回反復されることができる。複雑さを低くする必要がある場合、ステップ４は実行されないか、または１回だけ実行される（ＮＢＣと同様、ＮＢＣ仕様のセクション１．３．８．６を参照）。

・ステップ５：算術符号化器状態を初期化する；コンテキストｃを初期化する。

・ステップ６：グローバルゲインと最後の非ゼロの符号化係数ｌａｓｔｎｚをサイド情報として符号化する。

・ステップ７：次のサブステップを全て繰り返す（ｎ＝０；ｎ＜ｌａｓｔｎｚ；ｎ＋＝２）：
○ステップ７ａ：２つの係数

および

の振幅を表すために必要な最小ビット数を計算する
numbits = ceil( log2( max( abs(

[n]), abs(

[n+1]) ) + 1 ) );

○ステップ７ｂ：ｎｕｍｂｉｔｓ＞２の場合、ｎｕｍｂｉｔｓ－２エスケープ値（ＶＡＬ＿ＥＳＣ＝１６）を符号化する
for (b = 0; b < numbits-2; b++) {
Get probabilities p from context c
Encode escape symbol VAL_ESC with ari. enc. and probabilities p
Update context c
}

○ステップ７ｃ：双方の係数

および

の２つの最上位ビットを単一のシンボルｓｙｍとして符号化する（その値は０から１５である）
s = max(0, numbits-2);
a = abs(

[n]) >> s;
b = abs(

[n+1]) >> s;
sym = a + 4*b;
Get probabilities p from context c
Encode symbol sym with ari. enc. and probabilities p
Update context c

○ステップ７ｄ：ｎｕｍｂｉｔｓ＞２の場合、残りのビットを符号化する
for (b = 0; b < numbits-2; b++) {
bit0 = (abs(

[n]) >> b) & 1;
Encode bit0 as side-information
bit1 = (abs(

[n+1]) >> b) & 1;
Encode bit1 as side-information
}

○ステップ７ｅ：係数がゼロの場合を除いて、各係数の符号を符号化する
if (

[n] != 0 ) {
bit0 = 0;
if (

[n] < 0) {
bit0 = 1;
}
Encode bit0 as side-information
}
if (

[n+1] != 0) {
bit1 = 0;
if (

[n+1] < 0) {
bit1 = 1;
}
Encode bit1 as side-information
}

・ステップ８：算術符号化器を終了し、未使用のビット数を計算する。

・ステップ９：未使用のビットがある場合、残差量子化器によって与えられた残差ビットを符号化する（ＮＢＣ仕様のセクション１．３．９を参照）。

復号器
・ステップ１：算術復号器状態を初期化する；コンテキストｃを初期化する。

・ステップ２：グローバルゲインと最後の非ゼロの符号化係数ｌａｓｔｎｚを復号する。

・ステップ３：次のサブステップを全て繰り返す（ｎ＝０；ｎ＜ｌａｓｔｎｚ；ｎ＋＝２）：
○ステップ３ａ：双方の係数

および

の２つの最上位ビットを復号する
numbits = 1;
do {
Get probabilities p from context c
Decode symbol sym with ari. dec. and probabilities p
Update context c
numbits++;
} while (sym==VAL_ESC)

[n] = (sym & 3) << (numbits-2);

[n+1] = (sym >> 2) << (numbits-2);

○ステップ３ｂ：ｎｕｍｂｉｔｓ＞２の場合、残りのビットを復号する
for (b = 0; b < numbits-2; b++) {
Decode bit0

[n] += bit0 << b
Decode bit1

[n+1] += bit1 << b
}

○ステップ３ｃ：係数がゼロの場合を除いて、各係数の符号を復号する
if (

[n] != 0 ) {
Decode bit0
if (bit0 == 1) {

[n] = -

[n];
}
}
if (

[n+1] != 0) {
Decode bit1
if (bit1 == 1) {

[n+1] = -

[n+1];
}
}

・ステップ４：全ての係数ｎ＞＝ｌａｓｔｎｚをゼロに設定する
・ステップ５：算術復号器を終了および未使用のビット数を計算する
・ステップ６：未使用のビットがある場合、残りのビットを復号する。残差ビットを使用して非ゼロ係数を精緻化する逆残差量子化器を適用する（ＮＢＣ仕様のセクション１．４．３を参照）。

・ステップ７：逆量子化：復号されたＭＤＣＴ係数にグローバルゲインを乗算する
このセクション「従来のアプローチの段階的な説明」で説明されているステップ１から９は、従来のオーディオ符号化器および復号器において使用されることができ、本発明にかかるオーディオ符号化器または復号器は、第１の符号化モードで動作するときにも使用されることができる。

例えば、従来のアプローチの段階的な説明で説明されている符号化器のステップ１から９を使用して、機能８１０、８１４、８１８、８４０、８４４、８４８、８５２、８５６、８６０、８６４、８６８、および８６９を実装することができる。従来のアプローチの段階的な説明で上述した符号化器のステップ１、２、４、５、６、７ａ、７ｃ、７ｅおよび８は、例えば、機能８１０、８１４、８１８、８２２、８７０、８７４、８７８、８８６、８９０、８９４および８９６を実装するために、本発明の実施形態にかかるオーディオ符号化器においても使用されることができる（例えば、新たな第２のモードで動作するとき）。

復号器のステップ１、２、３、３ａ、３ｂ、３ｃ、４、５、６、７はまた、例えば、ステップ９１０、９１４、９１８、９３０、９３４、９３８、９４２、９４４、９４８、９８０を実装するために、「第１のモード」で動作するときに、本発明にかかるオーディオ復号において使用されることもできる。

さらに、復号器のステップ１、２、３、３ａ、３ｃ、４、５および７はまた、本発明の復号器に機能９１０、９１４、９１８、９５０、９５８、９６２、９６８および９８０を実装するために使用されることもできる（例えば、「第２のモード」で動作するとき）。

１１．３）．提案された発明の態様
以下では、従来のアプローチで使用される符号化器のステップおよび復号器のステップに対する改善および拡張について説明する。

高ビットレートでは、符号化器のステップ１から４において計算された量子化ＭＤＣＴスペクトルＸ_ｑ［ｎ］が高振幅の係数を含むことがわかっている。したがって、これらの係数の振幅（符号化器ステップ７ａ）を表すために必要な最小ビット数は高く、ほとんどの場合は２を超えることがわかっている。その結果、符号化器ステップ７ｄにおいて説明したように、ほとんどの場合、係数ごとに少なくとも１つの最下位ビット（ＬＳＢ）がサイド情報として符号化される。これらの最下位ビット（ＬＳＢ）は、下位情報であり、ＳＮＲへの比較的小さな影響によって削除できることがわかっている。実際の影響は、従来のアプローチのように、係数全体を０に設定する（すなわち、最上位ビットＭＳＢおよび最下位ビットＬＳＢの双方を０に設定する）よりもはるかに小さいことがわかっている。

したがって、提案された発明にかかる実施形態は、量子化されたＭＤＣＴデータを符号化するために消費されるビット数がビットバジェットを超える場合、高周波係数を切り捨てるよりも最下位ビットＬＳＢを切り捨てる方が効率的であるというアイデアに基づいている。しかしながら、これは、量子化されたＭＤＣＴスペクトル係数が高い振幅を有する場合、したがってビットレートが高い場合にのみ有利である（または可能であるのみ）。その結果、提案された発明は、サイド情報として１つのシグナリングビットをビットストリームに追加する（前記シグナリングビットは、例えば、「第１のモード」または「第２のモード」のどちらが使用されるかを記述することができる）。このビットは、従来のアプローチ（例えば、従来のアプローチの段階的な説明のセクションで説明されている）または新たなアプローチ（例えば、提案された発明の実施形態の段階的な説明のセクションで説明されている）のどちらかが使用されるかを示す。消費されたビット数がビットバジェットを下回る場合、新たなアプローチは不要であり、シグナリングビットが設定されて従来のアプローチをトリガーすることができることに留意されたい。例えば、新たなアプローチは、消費されたビット数がビットバジェットを超えており且ついくつかの基準が満たされている（例えば、高ビットレート）場合にのみ使用される。

図１３では、提案された発明にかかる実施形態が１２８ｋｂｐｓの高ビットレートの場合に使用されたことを除き、前の図（図１２）と同じ実験が行われた。１２８ｋｂｐｓでのＳＮＲは、はるかに一貫性があるように見え、全ての下落がなくなった。

１１．４）．提案された発明の実施形態の段階的説明
以下、本発明にかかる実施形態について段階的に説明する。この説明では、従来のアプローチのステップのいくつかを引き継ぐことができるため、セクション１１．２において提供される従来のアプローチの段階的な説明も参照する。

換言すれば、セクション１１．２（従来のアプローチ）で説明されているこれらのステップのほとんどは、ここでも同じである。したがって、ここでは異なるステップのみを説明する。

符号化器
・ステップ３：このステップは、量子化されたスペクトル

を符号化するために必要なビット数をさらに計算する。さらに、このステップはまた、従来のアプローチを使用するかまたは新たなアプローチを使用するかを決定する必要がある（すなわち、前のセクションで説明したシグナリングビットを設定する）。

・新たなアプローチの場合：ビットバジェットを超える消費ビットといくつかの基準が満たされている（例えば、高ビットレート）
・先行技術の場合：ビットバジェットを下回る消費ビット、または基準が満たされていない
最後に、ステップは、最後の非ゼロの符号化係数ｌａｓｔｎｚを見つける。それは、セクション１１．２において説明したように（すなわち、スペクトルを切り捨てるために）、従来のアプローチが選択された場合にのみ見つかる。新たなアプローチが選択された場合、スペクトルは切り捨てられず、ｌａｓｔｎｚは、単純に最後の非ゼロ係数に対応する。

・ステップ６：さらに、このステップは、シグナリングビットもサイド情報としてここで符号化する
他の符号化器のステップは、先行技術のアプローチが選択された場合と同じである。新たなアプローチが選択された場合、次のステップが追加／変更される。

○ステップ７ａ－ｂｉｓ：これは、ステップ７ａの直後の追加ステップであり、ｎｕｍｂｉｔｓ＞２の場合に実行される。各係数の最下位ビットが保存され、そのＬＳＢが現在ゼロになるように係数が変更される。係数が元々非ゼロであり且つＬＳＢをゼロに設定した後にゼロになる場合、係数の符号も保存される。
if (numbits > 2)
{
bit = abs(

[n]) & 1;
lsbs[nlsbs++] = bit;
if (bit != 0 && (abs(

[n]) & FFFE) == 0)
{
bit = 0;
if (

[n] < 0) {
bit = 1;
}
lsbs[nlsbs++] = bit;
}

[n] =

;
bit = abs(

[n+1]) & 1;
lsbs[nlsbs++] = bit;
if (bit != 0 && (abs(

[n+1]) & FFFE) == 0)
{
bit = 0;
if (

[n+1] < 0) {
bit = 1;
}
lsbs[nlsbs++] = bit;
}

[n+1] =

;
}

○ステップ７ｄ：最下位ビットを除く残りのビットを符号化する
for (b = 1; b < numbits-2; b++) {
bit0 = (abs(

[n]) >> b) & 1;
Encode bit0 as side-information
bit1 = (abs(

[n+1]) >> b) & 1;
Encode bit1 as side-information
}
・ステップ９：新たなアプローチが選択された場合、残差量子化／符号化は使用されない。未使用のビットがある場合、これらは、ｌｓｂｓ［］に保存されたｎｌｓｂｓビットの符号化に使用される（ステップ７ａ－ｂｉｓを参照）。

復号器
・ステップ２：さらに、このステップは、シグナリングビットもここで復号する
他の復号器ステップは、先行技術のアプローチが選択された場合と同じである。新たなアプローチが選択された場合、次のステップが追加／変更される。

○ステップ３ａ－ｂｉｓ：これは、ステップ３ａの直後の追加ステップである。それは、ｎｕｍｂｉｔｓを配列ｎｕｍｂｉｔｓ［ｎ］に保存するため、後でステップ６において再利用されることができる。

○ステップ３ｂ：最下位ビットを除く残りのビットを復号する
for (b = 1; b < numbits-2; b++) {
Decode bit0

[n] += bit0 << b
Decode bit1

[n+1] += bit1 << b
}

・ステップ６：未使用のビットがある場合、ｎｌｓｂｓビットを復号してｌｓｂｓ［］に格納する。次に、ｎｕｍｂｉｔｓ［ｎ］＞２の場合、復号されたＬＳＢビットを使用して係数（ｎ，ｎ＋１）を精緻化する。
k = 0;
for (n = 0; n < lastnz; n+=2) {
if (numbits[n] > 2) {
if (k == nlsbs) {
break;
}
bit0 = lsbs[k++];
if (bit0 == 1) {
if (

[n] > 0) {

[n] += 1;
} else if (

[n] < 0) {

[n] -= 1;
} else {
if (k == nlsbs) {
break;
}
bit1 = lsbs[k++];

[n] = 1 - 2*bit1;
}
}
if (k == nlsbs) {
break;
}
bit0 = lsbs[k++];
if (bit0 == 1) {
if (

[n+1] > 0) {

[n+1] += 1;
} else if (

[n+1] < 0) {

[n+1] -= 1;
} else {
if (k == nlsbs) {
break;
}
bit1 = lsbs[k++];

[n+1] = 1 - 2*bit1;
}
}
}
}

１２．図１４から図１８にかかる方法
図１４から図１５は、本発明の実施形態にかかるオーディオ復号の方法のフローチャートを示している。

図１６から図１８は、本発明の実施形態にかかるオーディオ復号の方法のフローチャートを示している。

本方法は、個別にまたは組み合わせて、対応する装置に関して本明細書で説明される特徴および機能のいずれかによって、および言及された機能のいずれかによって補足されることができることに留意されたい。

１３．実装の代替
いくつかの態様が装置の文脈で説明されたが、これらの態様はまた、対応する方法の説明も表すことは明らかであり、ブロックまたは装置は、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明される態様は、対応する装置の対応するブロックまたは項目または特徴の説明も表す。本方法ステップの一部または全ては、例えば、マイクロプロセッサ、プログラム可能なコンピュータまたは電子回路などのハードウェア装置によって（または使用して）実行されることができる。いくつかの実施形態では、最も重要な方法ステップの１つ以上は、そのような装置によって実行されることができる。

本発明の符号化されたオーディオ信号は、デジタル記憶媒体に格納されることができ、または無線送信媒体もしくはインターネットなどの有線送信媒体などの送信媒体で送信されることができる。

特定の実装要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実装されることができる。実装は、例えば、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協働する（または協働することができる）、電子的に読み取り可能な制御信号が格納されたフロッピーディスク、ＤＶＤ、ブルーレイ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはフラッシュメモリなどのデジタル記憶媒体を使用して実行されることができる。したがって、デジタル記憶媒体は、コンピュータ可読とすることができる。

本発明にかかるいくつかの実施形態は、本明細書に記載の方法の１つが実行されるように、プログラム可能なコンピュータシステムと協働することができる電子的に読み取り可能な制御信号を有するデータキャリアを含む。

一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装されることができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに方法の１つを実行するように動作する。プログラムコードは、例えば、機械可読キャリアに格納されてもよい。

他の実施形態は、機械可読キャリアに記憶された、本明細書に記載された方法の１つを実行するためのコンピュータプログラムを含む。

換言すれば、本発明の方法の実施形態は、したがって、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書で説明される方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法のうちの１つを実行するためのコンピュータプログラムが記録されたデータキャリア（またはデジタル記憶媒体、またはコンピュータ可読媒体）である。データキャリア、デジタル記憶媒体、または記録媒体は、通常、有形および／または非一時的である。

したがって、本発明の方法のさらなる実施形態は、本明細書で説明される方法の１つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、インターネットなどのデータ通信接続を介して転送されるように構成されてもよい。

さらなる実施形態は、本明細書に記載されている方法の１つを実行するように構成または適合された処理手段、例えばコンピュータ、またはプログラム可能な論理装置を備える。

さらなる実施形態は、本明細書に記載される方法の１つを実行するためのコンピュータプログラムがインストールされているコンピュータを備える。

本発明にかかるさらなる実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを（例えば、電子的または光学的に）受信機に転送するように構成された装置またはシステムを備える。受信機は、例えば、コンピュータ、モバイル装置、メモリ装置などとすることができる。装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを備えることができる。

いくつかの実施形態では、プログラマブル論理装置（例えば、フィールドプログラマブルゲートアレイ）を使用して、本明細書に記載されている方法の機能の一部または全てを実行することができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書で説明される方法の１つを実行するために、マイクロプロセッサと協働することができる。一般に、本方法は、好ましくは、任意のハードウェア装置によって実行される。

本明細書で説明する装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータとの組み合わせを使用して実装されることができる。

本明細書で説明される装置、または本明細書で説明される装置の任意の構成要素は、少なくとも部分的にハードウェアおよび／またはソフトウェアで実装されることができる。

本明細書で説明する方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータとの組み合わせを使用して実行されることができる。

本明細書で説明される方法、または本明細書で説明される装置の任意の構成要素は、ハードウェアおよび／またはソフトウェアによって少なくとも部分的に実行されることができる。

上述した実施形態は、本発明の原理を単に例示するものである。本明細書に記載された構成および詳細の変更および変形は、当業者にとって明らかであろうことが理解される。したがって、差し迫った特許請求の範囲によってのみ限定され、本明細書の実施形態の説明および説明として提示された特定の詳細によって限定されないことが意図されている。

Claims

入力オーディオ情報（３１０；４１０；５１０；６１０）に基づいて符号化されたオーディオ情報（３１２；４１２；５１２；６１２）を提供するオーディオ符号化器（３００；４００；５００；６００）であって、
前記オーディオ符号化器が、前記入力オーディオ情報のオーディオコンテンツを表すスペクトル値（３３０、６６２、Ｘ_ｑ［ｎ］）を取得（６２０、６３０、６４０、６５０、６６０）するように構成されており、
前記オーディオ符号化器が、前記スペクトル値を表す符号化情報（３５０、４５０、５５０、６７２；ｓｙｍ、ｌｓｂｓ［］）を取得するために、少なくとも複数の前記スペクトル値を符号化（６７０；８００）するように構成されており、
前記オーディオ符号化器が、スペクトル値の量子化の量子化ステップを決定し、前記量子化されたスペクトル値（３３０；６６２；Ｘ_ｑ［ｎ］）を符号化するためのビット需要を決定するゲイン情報を取得（８１０、８１４，８１８、８２２）するように構成されており、
前記オーディオ符号化器が、算術符号化を使用して複数の前記スペクトル値（Ｘｑ［０］…Ｘｑ［ｌａｓｔｎｚ－１］）についてのそれぞれのシンボルコード（ｓｙｍ）を使用して１つ以上の最上位ビットを符号化（８７８、８８６、８９０；１０００ａ、１０２０ａ、１０４０ａ－１０４０ｄ）し、１つ以上の前記スペクトル値についての１つ以上の最下位ビットを符号化するように構成されており、
それぞれのシンボルコード（ｓｙｍ）が、１つ以上のスペクトル値のスペクトル値ごとに１つ以上の最上位ビットを表し、
前記オーディオ符号化器が、利用可能なビットバジェットに応じて前記スペクトル値の１つ以上に関連する１つ以上の最下位ビットを符号化（８８２；８９８；１０１０ａ－１０１０ｅ、１０１１ａ－１０１１ｅ）するように構成されており、
そのため、前記スペクトル値の１つ以上に関連付けられた１つ以上の最下位ビットが符号化されるが、１つ以上の最上位ビットが符号化され且つ前記１つ以上の最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値の最下位ビットが符号化されず、
前記オーディオ符号化器が、前記スペクトル値を表す前記符号化情報を使用して前記符号化されたオーディオ情報を提供するように構成されている、オーディオ符号化器。
前記オーディオ符号化器が、スペクトル値のグループのエネルギーに基づいて前記ゲイン情報の第１の推定値を取得（８１０）し、
前記ゲイン情報の第１の推定値を使用してスペクトル値のセットを量子化（８１４）し、
前記ゲイン情報の第１の推定値を使用して、または精緻化されたゲイン情報を使用して、前記量子化されたスペクトル値のセットを符号化するために必要なビット数を計算または推定（８１８）し、
必要なビット数に応じて、第１のモードと第２のモードとのどちらを使用するかを決定（８３０）するように構成されている、請求項１に記載のオーディオ符号化器。
前記オーディオ符号化器が、
－低周波数範囲のスペクトル値の符号化によって利用可能なビットバジェットが使い果たされ且つ最下位ビットが１つ以上の最上位ビットが符号化され且つ前記最上位ビットよりも多くのビットを含む全てのスペクトル値について符号化される場合、高周波数範囲の非ゼロスペクトル値の符号化が省略される第１のモードと、
－１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが符号化されるが、１つ以上の最上位ビットが符号化され且つ前記最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値についての最下位ビットは符号化されない第２のモードとの間で切り替え可能に構成されており、
前記オーディオ符号化器が、必要なビット数および前記１つ以上の最上位ビットよりも多くのビットを含むスペクトル値の数を示す基準に応じて、前記第１のモードまたは前記第２のモードのどちらを使用するかを決定するように構成されている、請求項１または請求項２に記載のオーディオ符号化器。
前記オーディオ符号化器が、
－低周波数範囲のスペクトル値の符号化によって利用可能なビットバジェットが使い果たされ且つ最下位ビットが１つ以上の最上位ビットが符号化され且つ前記最上位ビットよりも多くのビットを含む全てのスペクトル値について符号化される場合、高周波数範囲の非ゼロスペクトル値の符号化が省略される第１のモードと、
－１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが符号化されるが、１つ以上の最上位ビットが符号化され且つ前記最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値についての最下位ビットは符号化されない第２のモードとの間で切り替え可能に構成されており、
前記オーディオ符号化器が、ビットレートが閾値ビットレート以上であり且つ前記スペクトル値のセットを符号化するために必要な計算または推定されたビット数がビットバジェットよりも高い場合、前記第２のモードが選択されるように、必要なビット数とビットレートとに応じて前記第１のモードと前記第２のモードのどちらを使用するかを決定するように構成されている、請求項１または請求項２に記載のオーディオ符号化器。
前記算術符号化が、前記１つ以上の最上位ビットのビット位置を決定し、算術符号化表現に前記ビット位置を記述する情報を含めるように構成されている、請求項１から４のいずれかに記載のオーディオ符号化器。
前記オーディオ符号化器が、前記少なくとも１つのスペクトル値の少なくとも２つの最上位ビットを、前記少なくとも１つのスペクトル値の前記少なくとも２つの最上位ビットを表す算術符号化表現の１つのシンボルにマッピングするように構成されている、請求項１から５のいずれかに記載のオーディオ符号化器。
前記オーディオ符号化器が、１つ以上の最上位ビットが符号化され且つ前記１つ以上の最上位ビットよりも多くのビットを含む全てのスペクトル値について、そのビット位置が前記最下位ビットと前記１つ以上の最上位ビットとの間にある中間ビットを符号化するように構成されている、請求項１から６のいずれかに記載のオーディオ符号化器。
前記オーディオ符号化器が、第１の符号化フェーズにおいて、
－スペクトル値ごとに１つ以上の最上位ビット、および
－１つ以上の最上位ビットが符号化され且つ前記１つ以上の最上位ビットおよび最下位ビットよりも多くのビットを含む全てのスペクトル値について、そのビット位置が前記最下位ビットと前記１つ以上の最上位ビットとの間にある１つ以上の中間ビット、および
－１つ以上の最上位ビットが符号化され且つ前記１つ以上の最上位ビットと中間ビットが存在する限りは任意の中間ビットとが非ゼロ値を示す全てのスペクトル値について、符号を符号化するように構成されており、
前記オーディオ符号化器が、前記第１の符号化フェーズにおいて、前記１つ以上の最上位値と中間ビットが存在する限りは任意の中間ビットとがゼロ値を示すスペクトル値の符号の符号化を選択的に省略するように構成されており、
前記オーディオ符号化器が、前記第１の符号化フェーズに続く第２の符号化フェーズにおいて、前記１つ以上の最上位値と中間ビットが存在する限りは任意の中間ビットとがゼロ値を示し且つ最下位ビット情報が非ゼロ値を示すスペクトル値の符号情報を選択的に符号化するように構成されている、請求項１から７のいずれかに記載の音声符号化器。
前記オーディオ符号化器が、最下位ビットだけゼロとは異なるスペクトル値の最下位ビットが実際に符号化される場合に前記最下位ビットだけゼロとは異なるスペクトル値について、前記符号化されたオーディオ表現に符号情報のみを含むように構成されている、請求項１から８のいずれかに記載のオーディオ符号化器。
前記オーディオ符号化器が、前記スペクトル値に関連する最下位ビット値を符号化するために、最下位ビット情報ビットシーケンスの後続のビットを順次提供するように構成されている、請求項１から９のいずれかに記載のオーディオ符号化器。
前記オーディオ符号化器が、前記１つ以上の最上位値と任意の中間ビットが存在する限りは任意の中間ビットとが非ゼロ値を示すそれぞれのスペクトル値の最下位ビット情報ビットシーケンスの単一ビットを提供するように構成されており、前記最下位ビット情報ビットシーケンスの前記使用された単一ビットが、最下位ビット値を符号化するために使用され、
前記オーディオ符号化器が、１つ以上の最上位値と中間ビットが存在する限りは任意の中間ビットとがゼロ値を示し且つ前記提供された最下位ビット情報ビットシーケンスの単一のビットがゼロ値を確認するそれぞれのスペクトル値について、最下位ビット情報ビットシーケンスの単一ビットを提供するように構成されており、
前記オーディオ符号化器が、１つ以上の最上位値と中間ビットが存在する限りは任意の中間ビットがゼロ値を示し且つ前記最下位ビット情報ビットシーケンスの前記提供されたビットの第１のビットが、ゼロ値から最下位ビット値までの偏差を示すそれぞれのスペクトル値について、前記最下位ビット情報ビットシーケンスの後続の２ビットを提供するように構成されており、前記最下位ビット情報ビットシーケンスの前記提供された第２のビットが、前記それぞれのスペクトル値の符号を符号化する、請求項１０に記載のオーディオ符号化器。
前記オーディオ符号化器が、最低周波数のスペクトル値に関連する最下位ビットから始まり、次第により高い周波数に関連するスペクトル値に向かって進む最下位ビットを符号化するように構成されており、
そのため、最下位ビット情報によってスペクトル値を精緻化するための符号化情報が、最低周波数スペクトル値から最後の最下位ビット情報が提供されるスペクトル値までの範囲で提供され、
最後の最下位ビット情報が提供される前記スペクトル値に関連する周波数よりも高い関連周波数を有するスペクトル値について、最下位ビット情報によってスペクトル値を精緻化するための符号化情報が提供されない、請求項１から１１のいずれかに記載のオーディオ符号化器。
前記オーディオ符号化器が、
－低周波数範囲のスペクトル値の符号化によって利用可能なビットバジェットが使い果たされ且つ最下位ビットが１つ以上の最上位ビットが符号化され且つ前記最上位ビットよりも多くのビットを含む全てのスペクトル値について符号化される場合、高周波数範囲の非ゼロスペクトル値の符号化が省略される第１のモードと、
－１つ以上のスペクトル値に関連付けられた１つ以上の最下位ビットが符号化されるが、１つ以上の最上位ビットが符号化され且つ前記最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値についての最下位ビットは符号化されない第２のモードとの間で切り替え可能に構成されている、請求項１から１２のいずれかに記載のオーディオ符号化器。
前記オーディオ符号化器が、前記オーディオ符号化器が前記第１のモードで動作するか前記第２のモードで動作するかを示すために、前記符号化されたオーディオ情報に含まれるビットストリームフラグを提供するように構成されている、請求項１３に記載のオーディオ符号化器。
前記オーディオ符号化器が、それぞれのシンボルコードを使用して、少なくとも２つのスペクトル値のスペクトル値ごとに１つ以上の最上位ビットを一緒に符号化するように構成されており、
それぞれのシンボルコードが、少なくとも２つのスペクトル値のスペクトル値ごとに１つ以上の最上位ビットを表す、請求項１から１４のいずれかに記載のオーディオ符号化器。
前記オーディオ符号化器が、前記第２のモードで動作するとき、実際の最高周波数の非ゼロスペクトル値を決定し、全ての非ゼロスペクトル値、またはスペクトル値の全ての非ゼログループの少なくとも１つ以上の最上位ビットを符号化するように構成されている、請求項３または４または１３または１４のいずれかに記載のオーディオ符号化器。
前記オーディオ符号化器が、前記第２のモードで動作するとき、全ての非ゼロスペクトル値の最下位ビットを除く全てのビットを符号化するように構成されており、
前記オーディオ符号化器が、ビットバジェットが使い果たされるまで、スペクトル値の最下位ビットを符号化するように構成されている、請求項３または４または１３または１４または１６のいずれかに記載のオーディオ符号化器。
前記オーディオ符号化器が、スペクトル値の量子化の量子化ステップを決定し、前記量子化されたスペクトル値を符号化するためのビット需要を決定するゲイン情報を取得するように構成されている、請求項１から１７のいずれかに記載のオーディオ符号化器。
入力オーディオ情報（３１０；４１０；５１０；６１０）に基づいて符号化されたオーディオ情報（３１２；４１２；５１２；６１２）を提供する方法であって、
前記方法が、前記入力オーディオ情報のオーディオコンテンツを表すスペクトル値（３３０、６６２、Ｘ_ｑ［ｎ］）を取得（６２０、６３０、６４０、６５０、６６０）することを備え、
前記方法が、前記スペクトル値を表す符号化情報（３５０、４５０、５５０、６７２；ｓｙｍ、ｌｓｂｓ［］）を取得するために、少なくとも複数の前記スペクトル値を符号化（６７０；８００）することを備え、
前記方法が、スペクトル値の量子化の量子化ステップを決定し、前記量子化されたスペクトル値を符号化するためのビット需要を決定するゲイン情報を取得（８１０、８１４，８１８、８２２）することを備え、
前記方法が、算術符号化を使用して複数の前記スペクトル値（Ｘｑ［０］…Ｘｑ［ｌａｓｔｎｚ－１］）についてのそれぞれのシンボルコード（ｓｙｍ）を使用して１つ以上の最上位ビットを符号化（８７８、８８６、８９０；１０００ａ、１０２０ａ、１０４０ａ－１０４０ｄ）し、１つ以上の前記スペクトル値についての１つ以上の最下位ビットを符号化することを備え、
それぞれのシンボルコード（ｓｙｍ）が、１つ以上のスペクトル値のスペクトル値ごとに１つ以上の最上位ビットを表し、
前記方法が、利用可能なビットバジェットに応じて、前記１つ以上のスペクトル値に関連する１つ以上の最下位ビットを符号化（８８２；８９８；１０１０ａ－１０１０ｅ、１０１１ａ－１０１１ｅ）することを備え、
そのため、前記スペクトル値の１つ以上に関連付けられた１つ以上の最下位ビットが符号化されるが、１つ以上の最上位ビットが符号化され且つ前記１つ以上の最上位ビットよりも多くのビットを含む１つ以上の他のスペクトル値の最下位ビットが符号化されず、
前記方法が、前記スペクトル値を表す前記符号化情報を使用して前記符号化されたオーディオ情報を提供することを備える、方法。
コンピュータ上で実行されるときに請求項１９に記載の方法を実行するコンピュータプログラム。