JP7218329B2

JP7218329B2 - オーディオ信号のスペクトルのスペクトル係数のコード化

Info

Publication number: JP7218329B2
Application number: JP2020133541A
Authority: JP
Inventors: ギライメ・フックス; マッティアス・ノイジンガー; マルクス・ムルトゥルス; シュテファン・ドエーラ
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2013-10-18
Filing date: 2020-08-06
Publication date: 2023-02-06
Anticipated expiration: 2034-10-17
Also published as: CA2925734A1; JP2017501427A; KR20160060085A; AU2014336097B2; JP2018205758A; PL3058566T3; SG11201603046RA; US20160307576A1; JP2020190751A; RU2016118776A; US20190043513A1; ES2660392T3; PT3058566T; CN111009249B; TW201521015A; EP3058566B1; JP6748160B2; US10847166B2; MY181965A; AU2014336097A1

Description

本出願は、例えば、様々な変換ベースオーディオコーデックにおいて使用可能なオーディオ信号のスペクトルのスペクトル係数のコード化方式に関する。

コンテキストベースの算術コード化は、変換ベースコード化器のスペクトル係数を雑音なく符号化する効率的な方法である［１］。コンテキストは、スペクトル係数と、その近傍に存在するすでにコード化された係数との間の相互情報を利用する。コンテキストは、符号化器側及び復号器側の両方において利用可能であり、いかなる追加の情報も送信される必要はない。このように、コンテキストベースのエントロピーコード化は、無記憶エントロピーコード化よりも高い利得を提供する可能性がある。しかしながら、実際には、中でもメモリ要件、計算複雑度及びチャネル誤差に対する堅牢性（robustness）に起因して、コンテキストの設計には厳しい制約がある。これらの制約は、コンテキストベースのエントロピーコード化の効率を制限し、特に、コンテキストが信号の調和構造を利用するために過度に制限されなければならないトーナル信号に対して、コード化利得をより低くする。

その上、低遅延オーディオ変換ベースのコード化において、アルゴリズム遅延を低減するために、低オーバーラップ窓が使用される。直接の結果として、ＭＤＣＴでの漏れがトーナル信号にとって重大になり、結果として量子化雑音がより大きくなる。トーナル信号は、変換に、MPEG2/4-AAC [２]に対してなされるように周波数領域における予測を組み合わせるか、又は時間領域における予測［３］を組み合わせることによって、処理することができる。

[1] Fuchs, G.; Subbaraman, V.; Multrus, M., "Efficient context adaptive entropy coding for real-time applications," Acoustics, Speech and Signal Processing (ICASSP), 2011 IEEE International Conference on , vol., no., pp.493,496, 22-27 May 2011 [2] ISO/IEC 13818, Part 7, MPEG-2 AAC [3] Juin-Hwey Chen; Dongmei Wang, "Transform predictive coding of wideband speech signals," Acoustics, Speech, and Signal Processing, 1996. ICASSP-96. Conference Proceedings., 1996 IEEE International Conference on , vol.1, no., pp.275,278 vol. 1, 7-10 May 1996

コード化効率を増大させるコード化概念が利用可能であることが好ましい。したがって、本発明の目的は、コード化効率を増大させるオーディオ信号のスペクトルのスペクトル係数のコード化概念を提供することである。この目的は、出願中の独立請求項の主題によって達成される。

本出願の基本的な知見は、スペクトルの形状に関する情報に依存して、前もって符号化／復号されたスペクトル係数と、現在符号化／復号されているスペクトル係数との間の相対スペクトル距離を調整しながら、エントロピー符号化／復号によって現在符号化／復号すべきスペクトル係数を符号化／復号することによって、また、これを行うにあたって、コンテキスト適応的に、前もって符号化／復号されたスペクトル係数に依存してエントロピー符号化／復号を実施するために、オーディオ信号のスペクトルのスペクトル係数をコード化するコード化効率を増大させることができることである。スペクトルの形状に関する情報は、オーディオ信号のピッチ又は周期性の測度、オーディオ信号のスペクトルの高調波間距離の測度、並びに／又は、スペクトルのスペクトル包絡線のフォルマント及び／若しくはバレーの相対位置を含んでもよく、この知識に基づいて、現在符号化／復号すべきスペクトル係数のコンテキストを形成するために利用される近接スペクトルを、このように決定されたスペクトル形状に適合することができ、それによって、エントロピーコード化効率が向上する。

有利な実施態様は、従属請求項の主題であり、本出願の好ましい実施形態は、図面に関連して本明細書において下記に説明される。

スペクトル係数符号化器、及びオーディオ信号のスペクトルのスペクトル係数の符号化におけるその動作モードを示す概略図である。図１のスペクトル係数符号化器に適合しているスペクトル係数復号器を示す概略図である。一実施形態による図１のスペクトル係数符号化器の可能性のある内部構造のブロック図である。一実施形態による図２のスペクトル係数復号器の可能性のある内部構造のブロック図である。オーディオ信号のピッチ若しくは周期性の測度又は高調波間距離の測度に依存した相対スペクトル距離の適合を示すためにその係数を符号化／復号すべきスペクトルのグラフを概略的に示す図である。一実施形態によるフォルマント間距離測度に依存した相対スペクトル距離の適合が示されている、ＬＰベースの知覚的に重み付けされた合成フィルタ、すなわちその逆に従ってスペクトルがスペクトル的に整形されている、そのスペクトル係数が一実施形態に従って符号化／復号すべきスペクトルを示す概略図である。一実施形態による、現在符号化／復号すべきスペクトル係数を取り巻くコンテキストテンプレート、及び、スペクトルの形状に関する情報に依存したコンテキストテンプレートのスペクトル分散の適合を示すために、スペクトルの一部分を概略的に示す図である。一実施形態による現在のスペクトル係数の符号化／復号に使用されるべき確率分布推定値を導出するようにスカラー関数を使用したコンテキストテンプレート８１の基準スペクトル係数の１つ又は複数の値からのマッピングを示す概略図である。符号化器と復号器との間の相対スペクトル距離の適合を同期させるための黙示的シグナリングの使用を概略的に示す図である。符号化器と復号器との間の相対スペクトル距離の適合を同期させるための明示的シグナリングの使用を示す概略図である。一実施形態による変換ベースオーディオ符号化器のブロック図である。図１０ａの符号化器に適合している変換ベースオーディオ復号器のブロック図である。一実施形態による周波数領域スペクトル整形を使用する変換ベースオーディオ符号化器のブロック図である。図１１ａの符号化器に適合している変換ベースオーディオ復号器のブロック図である。一実施形態による線形予測ベース変換コード化励起オーディオ符号化器のブロック図である。図１２ａの符号化期に適合している線形予測ベース変換コード化励起オーディオ復号器を示す図である。さらなる実施形態による変換ベースオーディオ符号化器のブロック図である。図１３の実施形態に適合している変換ベースオーディオ復号器のブロック図である。現在符号化／復号すべきスペクトル係数の近傍をカバーする従来のコンテキスト又はコンテキストテンプレートを示す概略図である。本出願の実施形態による修正されたコンテキストテンプレート構成又はマッピングされたコンテキストを示す図である。本出願の実施形態による修正されたコンテキストテンプレート構成又はマッピングされたコンテキストを示す図である。本出願の実施形態による修正されたコンテキストテンプレート構成又はマッピングされたコンテキストを示す図である。高調波スペクトルについて、図１６ａ～図１６ｃのいずれかのマッピングされたコンテキストを使用することの、図１５のコンテキストテンプレート定義にまさる利点を示すように、高調波スペクトルのグラフを概略的に示す図である。一実施形態によるコンテキストマッピングのために相対スペクトル距離Ｄを最適化するためのアルゴリズムの流れ図である。

図１は、一実施形態によるスペクトル係数符号化器１０を示す。符号化器は、オーディオ信号のスペクトルのスペクトル係数を符号化するように構成されている。図１は、スペクトログラム１２の形態の連続スペクトルを示す。より正確に言うと、スペクトル係数１４は、時間軸ｔ及び周波数軸ｆに沿ってスペクトル時間的に配置されているボックスとして示されている。スペクトル時間分解能は一定に維持することが可能であるが、図１は、スペクトル時間分解能が経時的に変化し得ることを示しており、１つのそのような時刻が図１において１６で示されている。このスペクトログラム１２は、スペクトル分解変換の結果であり得る。スペクトル分解変換は、例えば、ＭＤＣＴ又は何らかの他の実数値臨界サンプル変換のような臨界サンプル変換等の、重複変換のような、複数の異なる時刻においてオーディオ信号１８に適用される。その限りにおいて、スペクトログラム１２は、それぞれが同じ時刻に属する変換係数の系列から構成されるスペクトル２０の形態で、スペクトル係数符号化器１０によって受信され得る。したがって、スペクトル２０はスペクトログラムのスペクトルスライスを表し、図１では、スペクトログラム１２の個々の列として示されている。各スペクトルは、変換係数１４の系列によって構成され、例えば、何らかの窓関数２４を使用してオーディオ信号１８の対応する時間フレーム２２から導出されている。特に、時間フレーム２２は、前述した時刻に連続して配置されており、スペクトル２０の時間系列と関連付けられている。それらは、図１において示されているように、ちょうど対応する変換窓２４がそうであり得るように、互いに重なり得る。すなわち、本明細書において使用される場合、「スペクトル」とは、同じ時刻に属するスペクトル係数を指し、したがって、周波数分解である。「スペクトログラム」は、連続スペクトルから作成される時間周波数分解であり、「Spectra」は複数のスペクトルである。ただし、「スペクトル」がスペクトログラムの同意語として使用されることがある。元の信号が時間領域にあり、変換が周波数変換である場合、「変換係数」は「スペクトル係数」の同意語として使用される。

ちょうど概説したように、スペクトル係数符号化器１０は、オーディオ信号１８のスペクトログラム１２のスペクトル係数１４を符号化するためのものである。この目的のために、符号化器は所定のコード化／復号順序を適用することができる。当該順序は、例えば、図１において２６で概ね示されているように、１つのスペクトル２０内で低周波数から高周波数へとスペクトル的にスペクトル係数１４を走査し、その後、時間的に後続するスペクトル２０のスペクトル係数へ進むスペクトル時間経路に沿ってスペクトル係数１４を通過する。

下記により詳細に概説するように、符号化器１０は、図１において小さい円によって例示的に示されている１つ又は複数の前もって符号化されたスペクトル係数にコンテキスト適応的に依存してエントロピー符号化することによって、現在符号化すべきスペクトル係数を符号化するように構成されている。現在符号化すべきスペクトル係数は図１において小さいｘ印によって示されている。特に、符号化器１０は、スペクトルの形状に関する情報に依存して、以前符号化されたスペクトル係数と現在符号化されているスペクトル係数との間の相対スペクトル距離を調整するように構成されている。その依存関係及びスペクトルの形状に関する情報に関して、詳細を、ちょうど言及した情報に依存した相対スペクトル距離２８の適合によって得られる利点に関する考慮事項とともに、以下において説明される。

言い換えれば、スペクトル係数符号化器１０は、スペクトル係数１４を連続的に符号化してデータストリーム３０にする。以下により詳細に概説するように、スペクトル係数符号化器１０は、変換ベース符号化器の一部分であってもよい。変換ベース符号化器は、データストリーム３０がオーディオ信号１８を再構築することを可能にするように、スペクトル係数１４に加えて、さらなる情報をデータストリーム３０に符号化する。

図２は、図１のスペクトル係数符号化器１０に適合しているスペクトル係数復号器４０を示す。スペクトル係数復号器４０の機能は、実質的に図１のスペクトル係数符号化器１０の逆である。スペクトル係数復号器４０は、スペクトル１２のスペクトル係数１４を、例えば復号順序２６を使用して、連続的に復号する。図２内で小さいｘ印を使用して例示的に示されている、エントロピー復号による現在復号すべきスペクトル係数の復号において、スペクトル係数復号器４０は、同じく図２において小さい円を使用して示されている１つ又は複数の前もって復号されたスペクトル係数にコンテキスト適応的に依存してエントロピー復号を実施する。これを行うにあたって、スペクトル係数復号器４０は、スペクトル１２の形状に関する前述した情報に依存して、前もって復号されたスペクトル係数と現在復号すべきスペクトル係数との間の相対スペクトル距離２８を調整する。上記で示したのと同じように、スペクトル係数復号器４０は、データストリーム３０からオーディオ信号１８を再構築するように構成されている変換ベース復号器の一部分であってもよく、スペクトル係数復号器４０は、エントロピー復号を使用してデータストリーム３０からスペクトル係数１４を復号する。後者の変換ベース復号器は、再構築の一環として、スペクトル１２に、例えば逆重複変換のような逆変換を受けさせることができる。逆変換は、例えば、例として重畳加算プロセスによって、スペクトル分解変換からもたらされるエイリアシングを除去するオーバーラップ窓時間フレーム２２の系列の再構築をもたらす。

以下においてより詳細に説明するように、スペクトル１２の形状に関する情報に依存した相対スペクトル距離２８の調整によりもたらされる利点は、現在のスペクトル係数ｘをエントロピー符号化／復号するために使用される確率分布推定値を改善することができるかどうかによる。確率分布推定値が良好であればあるほど、エントロピーコード化はより効率的になる、すなわち、より圧縮される。「確率分布推定値」は、現在のスペクトル係数１４の実際の確率分布の推定値、すなわち、現在のスペクトル係数１４が仮定し得る値の領域の各値に確率を割り当てる関数である。スペクトル１２の形状に関する情報を利用することによって現在のスペクトル係数ｘの近接スペクトルから確率分布推定値を導出することが可能になり、これによって現在のスペクトル係数ｘの確率分布のより正確な推定が可能になるため、距離２８の適合がスペクトル１２の形状に依存することに起因して、実際の確率分布により近密に対応するように、確率分布推定値を決定することができる。これに関連する詳細は、スペクトル１２の形状に関する情報の例とともに以下に提示する。

前述したスペクトル１２の形状に関する情報の具体例に進む前に、図３及び図４は、それぞれスペクトル係数符号化器１０及びスペクトル係数復号器４０の可能性のある内部構造を示す。特に、図３に示すように、スペクトル係数符号化器１０は、確率分布推定値導出器４２及びエントロピー符号化エンジン４４から構成することができ、同様に、スペクトル係数復号器４０は、確率分布推定値導出器５２及びエントロピー復号エンジン５４から構成することができる。確率分布推定値導出器４２及び５２は、同じように動作する。すなわち、それらは、１つ又は複数の前もって復号／符号化されたスペクトル係数oの値に基づいて、現在のスペクトル係数ｘをエントロピー復号／符号化するための確率分布推定値５６を導出する。特に、エントロピー符号化／復号エンジン４４／５４は、導出器４２／５２から確率分布推定値を受信し、それに従って、現在のスペクトル係数ｘについてエントロピー符号化／復号を実施する。

エントロピー符号化／復号エンジン４４／５４は、現在のスペクトル係数ｘの符号化／復号のための、例えばハフマン符号化のような可変長符号化を使用することができ、これに関連して、エンジン４４／５４は、異なる確率分布推定値５６に対して異なるＶＬＣ（可変長符号化）テーブルを使用することができる。代替的に、エンジン４４／５４は、確率分布推定値５６を用いて、現在のスペクトル係数ｘについて算術符号化／復号を使用してもよい。確率分布推定値５６は、算術コード化／復号エンジン４４／５４の内部状態を表す現在の確率区間の確率区間分割を制御する。各部分区間が、現在のスペクトル係数ｘによって仮定され得る値の目標範囲からの異なる可能な値に割り当てられる。以下において詳細に概説するように、エントロピー符号化エンジン４４及びエントロピー復号エンジン５４は、スペクトル係数１４の値範囲全体を、限定された整数値区間、すなわち、[0...2^N-1]のような目標範囲にマッピングするために、エスケープメカニズムを使用することができる。目標範囲内の整数値の集合、すなわち、{0,...,2^N-1}が、エスケープシンボル{esc}とともに、算術符号化／復号エンジン４４／５４のシンボル文字、すなわち、{0,...,2^N-1, esc}を定義する。例えば、エントロピー符号化エンジン４４は、入来スペクトル係数ｘを前述した目標間隔[0...2^N-1] 内に入れるために、必要であれば、当該スペクトル係数ｘに必要な回数だけ２による除算を受けさせ、除算する毎に、エスケープシンボルがデータストリーム３０へと符号化され、その後、除算した余り、又は、除算が必要でない場合は元のスペクトル値がデータストリーム３０へと算術符号化される。翻って、エントロピー復号エンジン５４は、以下のようにエスケープメカニズムを実施する。すなわち、エントロピー復号エンジン５４は、データストリーム３０から現在のスペクトル係数ｘを、０個、１個又はより多くのエスケープシンボルesc及びそれに後続する非エスケープシンボルの系列、すなわち、{a}，{esc, a}，{esc, esc, a}．．．のうちの１つとして復号する。ａは非エスケープシンボルである。エントロピー復号エンジン５４は、例えば、非エスケープシンボルを算術復号することによって目標範囲[0...2^N-1]内の値ａを求め、現在のスペクトル係数の値を、エスケープシンボルの数のａ＋２倍に等しくなるように計算することによって、ｘの係数値を導出する。

確率分布推定値５６の使用、及び現在のスペクトル係数ｘを表すために使用されるシンボルの系列への確率分布推定値５６の適用について、異なる可能性が存在する。すなわち、確率分布推定値は、例えば、スペクトル係数ｘのためにデータストリーム３０内で搬送される任意のシンボル、すなわち、非エスケープシンボルはもちろん、存在する場合は任意のエスケープシンボルに適用されてもよい。代替的に、確率分布推定値５６は、０個以上のエスケープシンボルの系列の最初のシンボル又は最初の２つのシンボル又は最初のｎ＜Ｎ個のシンボルのみに使用され、その後非エスケープシンボルでシンボルの系列の任意の後続するシンボルについては、例えば、等しい確率分布のような何らかのデフォルトの確率分布推定値が使用される。

図５は、スペクトログラム１２からの例示的なスペクトル２０を示す。特に、スペクトル係数の大きさが、図５においてｙ軸に沿って任意の単位でプロットされ、一方で、水平ｘ軸は任意の単位の周波数に対応する。すでに述べたように、図５におけるスペクトル２０は、特定の時刻におけるオーディオ信号のスペクトログラム上のスペクトルスライスに対応し、スペクトログラム１２は、そのようなスペクトル２０の系列から構成される。図５はまた、現在のスペクトル係数ｘのスペクトル位置をも示す。

以下において詳細に概説するように、スペクトル２０はオーディオ信号の重み付けされていないスペクトルであってもよいが、以下においてさらに概説する実施形態によれば、例えば、スペクトル２０は、知覚合成フィルタ関数の逆関数（inverse）に対応する伝達関数を使用してすでに知覚的に重み付けされている。しかしながら、本出願は、以下においてさらに概説する特定の事例には限定されない。

いずれにせよ、図５は、周波数軸に沿った特定の周期を有するスペクトル２０を示す。周波数軸は、周波数方向に沿ったスペクトルにおける極大及び極小の略等距離配置となっている。例示のみを目的として、図５は、その間に現在のスペクトル係数ｘが位置付けられているスペクトルの極大の間のスペクトル距離によって定義されるものとして、オーディオ信号のピッチ又は周期性の測度６０を示す。当然ながら、測度６０は、極大及び／若しくは極小の間の平均ピッチ、又は時間領域信号１８の自己相関関数において測定される時間遅延最大値に相当する周波数距離のように、別様に定義され、決定されてもよい。

一実施形態によれば、測度６０は、スペクトルの形状に関する情報であるか、又はスペクトルの形状に関する情報によって構成される。符号化器１０及び復号器４０、又はより正確に言うと、確率分布推定値導出器４２／５２は、例えば、この測度６０に依存して、以前のスペクトル係数ｏと現在のスペクトル係数ｘとの間の相対スペクトル距離を調整し得る。例えば、相対スペクトル距離２８は、測度６０が増大するのに伴って距離２８が増大するように、測度６０に依存して変化し得る。例えば、距離２８を、測度６０に等しくなるように、又は、その整数倍になるように設定することが好適であり得る。

以下において詳細に説明するように、スペクトル１２の形状に関する情報がどのようにして復号器に利用可能になるかについては複数の別の可能性がある。通常、測度６０のようなこの情報は、スペクトルの形状に関する情報を実際に決定する符号化器１０又は確率分布推定値導出器４２のみによって明示的に復号器にシグナリングすることができ、又は、スペクトルの形状に関する情報の決定は、スペクトルの前もって復号された部分に基づいて符号器側及び復号器側で並行して実施されるか、又は、すでにビットストリーム内に書き込まれている別の情報から推定することができる。

異なる用語を使用すると、測度６０は、スペクトル内の前述した極大又は山が互いに高調波を形成することができるため、「高調波間距離の測度」として解釈することもできる。

図６は、スペクトルの形状に関する情報の他の例を示す。スペクトル距離２８は、スペクトルの形状に関する情報に基づいて、単独で、又は前述したような測度６０のような別の測度とともに調整することができる。特に、図６は、符号化器１０及び復号器４０によって符号化／復号されたスペクトル係数によって表されるスペクトル１２が、知覚的に重み付けされた合成フィルタ関数の逆関数を使用して重み付けされている例示的な事例を示す。スペクトル１２のスペクトルスライスは図６に示されている。すなわち、元のオーディオ信号及び最終的に再構築されたオーディオ信号のスペクトルが、図６において６２で示されている。プリエンファシスされたバージョン（pre-emphasized version）が、点線により６４で示されている。プリエンファシスされたバージョン６４の線形予測推定スペクトル包絡線が一点鎖線６６で示されており、その知覚的に修正されたバージョン、すなわち、知覚によって動機付けられた合成フィルタ関数の伝達関数が、二点鎖線を使用して図６において６８で示されている。スペクトル１２は、知覚的に重み付けされた合成フィルタ関数６８の逆関数を用いて、元のオーディオ信号スペクトル６２のプリエンファシスされたバージョンをフィルタリングした結果であり得る。いずれにせよ、符号化器及び復号器の両方がスペクトル包絡線６６にアクセスすることができ、このとき、スペクトル包絡線６６は、おおよそ明白なフォルマント７０又はバレー７２を有し得る。本出願の代替的な実施形態によれば、スペクトルの形状に関する情報は、少なくとも部分的に、スペクトル１２のスペクトル包絡線６６のこれらのフォルマント７０及び／又はバレー７２の相対位置に基づいて定義される。例えば、フォルマント７０の間のスペクトル距離７４を使用して、現在のスペクトル係数ｘと以前のスペクトル係数ｏとの間の前述した相対スペクトル距離２８を設定することができる。例えば、距離２８は好ましくは、距離７４に等しくなるように、又は、その整数倍になるように設定することができるが、代替形態も実現可能である。

図６に示されているようなＬＰベースの包絡線の代わりに、スペクトル包絡線はまた、別様に定義されてもよい。例えば、包絡線は、スケール係数を用いて定義され、データストリーム内で送信されてもよい。包絡線を送信する他の方法もまた使用されてもよい。

図５及び図６に関連して上記で概説した様式での距離２８の調整に起因して、「基準」スペクトル係数ｏの値は、例えば、スペクトル的に現在のスペクトル係数ｘのより近くに存在する他のスペクトル係数と比較して、現在のスペクトル係数ｘの確率分布推定値を推定するための、実質的に良好なヒントを表す。これに関連して、コンテキストモデル化はほとんどの事例において、一方のエントロピーコード化複雑度と、他方のコード化効率との間の妥協点であることが留意されるべきである。したがって、これまで説明してきた実施形態は、例えば、測度６０の増大及び／又はフォルマント間距離７４の増大に伴って距離２８が増大するような、スペクトルの形状に関する情報に依存した相対スペクトル距離２８の適合を提案する。しかしながら、それに基づいてエントロピーコード化／復号のコンテキスト適合が実施される以前の係数ｏの数は一定であってもよい。すなわち、増大しなくてもよい。それに基づいてコンテキスト適合が実施される以前のスペクトル係数ｏの数は、例えば、スペクトルの形状に関する情報の変化にかかわりなく一定であってもよい。これは、上記で概説した様式における相対スペクトル距離２８の適合が、コンテキストモデル化の実施のオーバヘッドを大幅に増大させることなく、エントロピー符号化／復号をより良好に又はより効率的なものへと導くことを意味する。スペクトル距離２８の適合自体だけが、コンテキストモデル化オーバヘッドを増大させる。

ちょうど言及した問題をより詳細に例示するために、図７を参照する。図７は、スペクトログラム１２からのスペクトル時間部分を示しており、当該スペクトル時間部分は、コード化／復号すべき現在のスペクトル係数１４を含む。さらに、図７は、例示的に５つの以前コード化／復号されたスペクトル係数ｏのテンプレートを示しており、それに基づいて、現在のスペクトル係数ｘのエントロピーコード化／復号のためのコンテキストモデル化が実施される。テンプレートは、現在のスペクトル係数ｘの位置に位置付けられており、近接する基準スペクトル係数ｏを表す。前述したスペクトルの形状に関する情報に依存して、これらの基準スペクトル係数ｏのスペクトル位置のスペクトル拡散が適合される。これは、図７において、双頭矢印８０、及び、例えば、適合８０に依存して基準スペクトル係数のスペクトル位置のスペクトル拡散をスケーリングする事例において基準スペクトル係数の位置を例示的に示す網掛けの小さい円を使用して示されている。すなわち、図７は、コンテキストモデル化に寄与する基準スペクトル係数の数、すなわち、現在のスペクトル係数ｘの周囲にあって基準スペクトル係数ｏを識別するテンプレートの基準スペクトル係数の数が、スペクトルの形状に関する情報のいかなる変化にもかかわりなく一定のままであることを示している。これらの基準スペクトル係数と現在のスペクトル係数との間の相対スペクトル距離のみが、８０に従って、かつ基準スペクトル係数自体の間の距離に本質的に従って、適合される。しかしながら、基準スペクトル係数ｏの数は必ずしも一定のままであるとは限らないことが留意される。一実施形態によれば、基準スペクトル係数の数は、相対スペクトル距離が増大するのに伴って増大し得る。一方、その反対も実現可能である。

図７は、現在のスペクトル係数ｘのコンテキストモデル化が、先行するスペクトル／時間フレームに対応して前もってコード化／復号されたスペクトル係数をも含む例示的な事例を示していることが留意される。しかしながら、これはまた、単に一例として理解されるべきでもあり、そのような時間的に先行する前もってコード化／復号されたスペクトル係数に対する依存は、さらなる実施形態によれば放棄されてもよい。図８は、確率分布推定値導出器４２／５２が、１つ又は複数の基準スペクトル係数ｏに基づいて、現在のスペクトル係数の確率分布推定値をどのように決定することができるかを示す。図８に示すように、この目的のために、１つ又は複数の基準スペクトル係数ｏは、スカラー関数８２に従い得る。スカラー関数に基づいて、例えば、１つ又は複数の基準スペクトル係数ｏが、利用可能な確率分布推定値の集合からの、現在のスペクトル係数ｘに使用されるべき確率分布推定値をインデックス付けするインデックスにマッピングされる。すでに上述したように、利用可能な確率分布推定値は、例えば、算術コード化の事例においてはシンボル文字の異なる確率区間分割に、又は、可変長符号化を使用する事例においては異なる可変長符号化テーブルに対応し得る。

上述したスペクトル係数符号化器／復号器の、それぞれの変換ベース符号化器／復号器への可能な統合の説明に進む前に、本明細書では、以下において、これまで説明してきた実施形態がどのように変更され得るかに関するいくつかの可能性を論じる。例えば、図３及び図４に関連して上記で簡潔に概説したエスケープメカニズムは例示のみを目的として選択されており、代替的な実施形態によれば放棄されてもよい。下記に説明する実施形態においては、エスケープメカニズムは使用される。その上、以下において概説するさらに限定的な実施形態の説明から明らかになるように、スペクトル係数を個々に符号化／復号する代わりに、スペクトル係数はｎタプル単位で、すなわち、スペクトル的に直に近接するｎ個のスペクトル係数の単位で符号化／復号されてもよい。この事例において、相対スペクトル距離の決定はまた、そのようなｎタプル単位で、又は、個々のスペクトル係数の単位で決定されてもよい。図８のスカラー関数８２に関連して、スカラー関数は算術関数又は論理関数であってもよいことが留意される。その上、基準スカラー係数ｏに対し特別な測度が利用され得る。その基準スカラー係数ｏは、例えばスペクトルの周波数範囲を超えていることに起因して、又は、例えば現在のスペクトル係数に対応する時刻においてスペクトルがサンプリングされたスペクトル時間分解能とは異なるスペクトル時間分解能においてスペクトル係数によってサンプリングされたスペクトルの部分内に存在することに起因して利用不可能なものである。利用不可能な基準スペクトル値ｏの値は、例えば、デフォルト値に置き換えられ、その後、他の（利用可能な）基準スペクトル係数とともにスカラー関数８２に入力されてもよい。上記で概説したスペクトル距離適合を使用してエントロピーコード化／復号が機能し得る別の方法は以下の通りである。すなわち、例えば、現在のスペクトル係数が２値化を受け得る。例えば、スペクトル係数ｘは、ビンの系列にマッピングされ得、これらのビンはその後、相対スペクトル距離適合の適合を使用してエントロピー符号化される。復号されるとき、ビンは、有効なビン系列に行き当たるまで連続的にエントロピー復号されることになり、その後、現在のスペクトル係数ｘのそれぞれの値に再マッピングされ得る。

さらに、１つ又は複数の以前のスペクトル係数ｏに依存したコンテキスト適合は、図８に示すものとは別様に実施されてもよい。特に、スカラー関数８２は、利用可能なコンテキストの集合から１つのコンテキストをインデックス付けするために使用することができ、各コンテキストは、それと関連付けられている確率分布推定値を有していてもよい。その事例において、特定のコンテキストと関連付けられる確率分布推定値は、現在符号化／復号されているスペクトル係数ｘがそれぞれのコンテキストに割り当てられるたびに、すなわち、この現在のスペクトル係数ｘの値を使用して、実際のスペクトル係数統計に適合され得る。

最後に、図９ａ及び図９ｂは、スペクトルの形状に関する情報の導出が符号化器と復号器との間でどのように同期され得るかに関する異なる可能性を示す。図９ａは、それに従って、符号化器と復号器との間でスペクトルの形状に関する情報の導出を同期させるように、黙示的シグナリングが使用される可能性を示す。ここで、符号化側及び復号側の両方において、情報の導出は、それぞれビットストリーム３０の以前コード化された部分又は前もって復号された部分に基づいて実施され、符号化側における導出は参照符号８３を使用して示されており、復号側における導出は参照符号８４を使用して示されている。両方の導出は、例えば、導出器４２及び５２自体によって実施されてもよい。

図９ｂは、それに従って、スペクトルの形状に関する情報を符号化器から復号器へと搬送するために明示的シグナリングが使用される可能性を示している。符号化側における導出８３はさらには、コード化損失に起因して復号側では利用可能でないその成分を含む元のオーディオ信号の分析さえも伴う場合がある。そうではなく、データストリーム３０内での明示的シグナリングは、スペクトルの形状に関する情報を、復号側で利用可能にするために使用される。言い換えれば、復号側における導出８４は、スペクトルの形状に関する情報にアクセスすることができるように、データストリーム３０内での明示的シグナリングを使用する。明示的シグナリング３０は、差別的にコード化することを含み得る。以下において詳細に概説するように、例えば他の目的のためにデータストリーム３０内ですでに利用可能なＬＴＰ（長期予測）ラグパラメータを、スペクトルの形状に関する情報として使用することができる。一方、代替的に、図９ｂの明示的シグナリングは、すでに利用可能なＬＴＰラグパラメータに関係して、すなわちＬＴＰラグパラメータに対して差別的に、測度６０を差別的にコード化してもよい。スペクトルの形状に関する情報を、復号側にとって利用可能にするために、多くの他の可能性が存在する。
上記で提示した代替的な実施形態に加えて、スペクトル係数の符号化／復号は、エントロピー符号化／復号に加えて、現在符号化／復号すべきスペクトル係数をスペクトル的に及び／又は時間的に予測することを含み得ることが留意される。その後、予測残差が、上述したようなエントロピー符号化／復号を受け得る。

スペクトル係数符号化器及び復号器の様々な実施形態を説明した後、以下において、当該符号化器及び復号器が変換ベース符号化器／復号器にどのように有利に組み込まれ得るかについて、いくつかの実施形態を説明する。

図１０ａは、例えば、本出願の一実施形態による変換ベースオーディオ符号化器を示す。図１０ａの変換ベースオーディオ符号化器は、全体的に参照符号１００を使用して示されており、スペクトルコンピュータ１０２を備え、図１のスペクトル係数符号化器１０がそれに後続している。スペクトルコンピュータ１０２はオーディオ信号１８を受信し、これに基づいてスペクトル１２を計算し、そのスペクトル係数が、上述したようにスペクトル係数符号化器１０によってデータストリーム３０に符号化される。図１０ｂは、対応する復号器１０４の構造を示す。復号器１０４は、上記で概説したように形成される、連結されたスペクトル係数復号器４０を備え、図１０ａ及び図１０ｂの事例において、スペクトルコンピュータ１０２は、例えば、スペクトル２０への重複変換を実施するだけであってもよく、スペクトル－時間領域コンピュータ１０６は、それに対応して重複変換の逆を実施するだけである。スペクトル係数符号化器１０は、入力されるスペクトル２０を損失なく符号化するように構成することができる。それに比べると、スペクトルコンピュータ１０２は、量子化に起因するコード化損失をもたらす場合がある。

量子化雑音をスペクトル的に整形するために、スペクトルコンピュータ１０２は、図１１ａに示すように具現化することができる。ここで、スペクトル１２は、スケール係数を使用してスペクトル的に整形される。特に、図１１ａによれば、スペクトルコンピュータ１０２は、連結された変換器１０８及びスペクトル整形器１１０を備え、そのうち、変換器１０８は、入力されたオーディオ信号１８に、オーディオ信号１８の未整形スペクトル１１２を得るようにスペクトル分解変換を受けさせ、スペクトル整形器１１０は、最終的にスペクトル係数符号化器１０によって符号化されるスペクトル１２を得るように、スペクトルコンピュータ１０２のスケール係数決定器１１６から得られるスケール係数１１４を使用してこの未整形スペクトル１１２をスペクトル的に整形する。例えば、スペクトル整形器１１０は、スケール係数決定器１１６からスケール係数帯域あたり１つのスケール係数１１４を取得し、スペクトル１２を受信するように、それぞれのスケール係数帯域の各スペクトル係数を、それぞれのスケール係数帯域と関連付けられるスケール係数で除算する。スケール係数決定器１１６は、オーディオ信号１８に基づいてスケール係数を決定するように、知覚モデルによって駆動されてもよい。代わりに、線形予測係数情報によって定義される線形予測合成フィルタに依存した伝達関数をスケール係数が表すように、スケール係数決定器１１６が線形予測分析に基づいてスケール係数を決定してもよい。線形予測係数情報１１８は、スペクトル２０のスペクトル係数とともに符号化器１０によってデータストリーム３０にコード化される。完全を期すために、その後スペクトル係数符号化器１０によって損失なくコード化される量子化スペクトル係数を用いてスペクトル１２を得るように、図１１ａは、量子化器１２０をスペクトル整形器１１０の下流に位置付けられているものとして示している。

図１１ｂは、図１０ａの符号化器に対応する復号器を示す。ここで、スペクトル－時間領域コンピュータ１０６はスケール係数決定器１２２を備える。スケール係数決定器１２２は、スケール係数が線形予測係数情報１１８によって定義される線形予測合成フィルタに依存した伝達関数を表すように、データストリーム３０内に含まれる線形予測係数情報１１８に基づいてスケール係数１１４を再構築する。スペクトル整形器は、スケール係数１１４に従って、データストリーム３０から復号器４０によって復号されるものとしてのスペクトル１２をスペクトル的に整形する。すなわち、スペクトル整形器１２４は、それぞれのスケール係数帯域のスケール係数を使用して各スペクトル帯域内のスケール係数をスケーリングする。したがって、スペクトル整形器１２４の出力において、結果としてオーディオ信号１８の未整形スペクトル１１２が再構築される。そして、図１１ｂにおいて破線で示されているように、オーディオ信号１８を時間領域において再構築するように逆変換器１２６によってスペクトル１１２への逆変換を適用することは任意である。

図１２ａは、線形予測ベースのスペクトル整形を使用する事例における、図１１ａの変換ベースオーディオ符号化器のより詳細な実施形態を示す。図１１ａに示す構成要素に加えて、図１２ａの符号化器は、入力されるオーディオ信号１８に、最初にプリエンファシスフィルタリングを受けさせるプリエンファシスフィルタ１２８を備える。プリエンファシスフィルタ１２８は、例えば、ＦＩＲフィルタとして実装されてもよい。プリエンファシスフィルタ１２８の伝達関数は、例えば、ハイパス伝達関数を表してもよい。一実施形態によれば、プリエンファシスフィルタ１２８は、例えば、伝達関数Ｈ（ｚ）＝１－ αｚ^－１を有する一次ハイパスフィルタのようなｎ次ハイパスフィルタとして具現化され、αは例えば、0.68に設定されている。したがって、プリエンファシスフィルタ１２８の出力において、オーディオ信号１８のプリエンファシスされたバージョン１３０がもたらされる。さらに、図１２ａは、ＬＰ（線形予測）分析器１３２及び線形予測係数－スケール係数変換器１３４から構成されているものとして、スケール係数決定器１１６を示す。ＬＰＣ分析器１３２は、オーディオ信号１８のプリエンファシスされたバージョンに基づいて線形予測係数情報１１８をコンピュータ（computer）する。したがって、情報１１８の線形予測係数は、オーディオ信号１８の線形予測ベースのスペクトル包絡線、又はより正確に言うと、オーディオ信号１８のプリエンファシスされたバージョン１３０の線形予測ベースのスペクトル包絡線を表す。ＬＰ分析器１３２の動作モードは、例えば、ＬＰ分析されるべき信号１３０のウィンドウィング部分の系列を得るための、入力される信号１３０のウィンドウィングと、各ウィンドウィング部分の自己相関を決定するための自己相関決定と、ラグウィンドウ関数を自己相関へと適用するための、任意なラグウィンドウィングと、を含んでいてもよい。その後、自己相関、又はラグウィンドウ出力、すなわちウィンドウィングされた自己相関関数に対し、線形予測パラメータ推定が実施されてもよい。線形予測パラメータ推定は、例えば、自己相関ごとに、すなわち信号１３０のウィンドウィング部分ごとに線形予測係数を導出するための、（ラグウィンドウィングされた）自己相関に対するWiener-Levinson-Durbin又は他の適切なアルゴリズムの実施を含んでもよい。すなわち、ＬＰ分析器１３２の出力において、ＬＰＣ係数１１８がもたらされる。ＬＰ分析器１３２は、線形予測係数を、データストリーム３０に挿入するために量子化するように構成されていてもよい。線形予測係数の量子化は、例えば、線スペクトル対又は線スペクトル周波数領域のような、線形予測係数領域とは別の領域において実施されてもよい。しかし、Wiener-Levinson-Durbinアルゴリズム以外のアルゴリズムもまた使用されてもよい。

線形予測係数－スケール係数変換器１３４は、線形予測係数をスケール係数１１４に変換する。変換器１３４は、線形予測係数情報１１８によって定義されるものである線形予測合成フィルタの逆数１/Ａ（ｚ）に対応するように、スケール係数１４０を決定してもよい。代わりに、変換器１３４は、例えば、例として１/Ａ(γ・ｚ)、γ = ０．９２ ± １０％、のような、この線形予測合成フィルタの知覚によって動機付けられた改変に従うように、スケール係数を決定する。線形予測合成フィルタの知覚によって動機付けられた改変、すなわち、１/Ａ(γ・ｚ)は、「知覚モデル」と呼ばれる場合がある。

例示を目的として、図１２ａは別の要素を示すが、これは図１２ａの実施形態にとっては任意である。この要素は、オーディオ信号が長期予測を受けるように、変換器１０８から上流に位置付けられているＬＴＰ（長期予測）フィルタ１３６である。好ましくは、ＬＰ分析器１３２は、非長期予測フィルタリングバージョンに対して動作する。言い換えれば、ＬＴＰフィルタ１３６は、オーディオ信号１８又はそのプリエンファシスされたバージョン１３０に対してＬＴＰ予測を実施し、ＬＴＰ残差バージョン１３８を出力し、それによって、変換器１０８がプリエンファシス及びＬＴＰ予測された残差信号１３８に対して変換を実施する。ＬＴＰフィルタは、例えば、ＦＩＲフィルタとして実装されてもよく、ＬＴＰフィルタ１３６は、例えば、ＬＴＰ予測利得及びＬＴＰラグを含むＬＴＰパラメータによって制御することができる。両方のＬＴＰパラメータ１４０がデータストリーム３０にコード化される。以下において詳細に概説するように、ＬＴＰ利得は、ＬＴＰフィルタリングなしでそれ自体をスペクトル１２で完全に明示するピッチ又は周期性を示し、ＬＴＰフィルタリングを使用して、ＬＴＰフィルタ１３６によってＬＴＰフィルタリングの強度を制御するＬＴＰ利得パラメータに依存した低減の度合いで徐々に低減する強度において、スペクトル１２内に生じるため、測度６０の一例を表す。

図１２ｂは、完全を期すために、図１２ａの符号化器に適合する復号器を示す。図１１ｂの構成要素に加えて、さらには、スケール係数決定器１２２がＬＰＣ－スケール係数変換器１４２として具現化されるという事実に加えて、図１２ｂの復号器は、逆変換器１２６の下流に、逆変換器１２６によって出力される逆変換に重畳加算プロセスを受けさせる重畳加算段１４４を備え、それによって、プリエンファシスされＬＴＰフィルタリングされたバージョン１３８の再構築が得られる。この再構築はその後、ＬＴＰポストフィルタリングを受ける。ここで、ＬＴＰポストフィルタ１４６は、その伝達関数がＬＴＰフィルタ１３６の伝達関数の逆関数に対応する。ＬＴＰポストフィルタ１４６は、例えば、ＩＩＲフィルタの形態で実装されてもよい。ＬＴＰポストフィルタ１４６に続いて、図１２ｂの復号器は、図１２ｂにおいて例示的に、その下流にディエンファシスフィルタ１４８を備える。ディエンファシスフィルタ１４８は、プリエンファシスフィルタ１２８の伝達関数の逆関数に対応する伝達関数を使用して、時間領域信号に対してディエンファシスフィルタリングを実施する。ディエンファシスフィルタ１４８もまた、ＩＩＲフィルタの形態で具現化されてもよい。オーディオ信号１８が、エンファシスフィルタ１４８の出力においてもたらされる。

言い換えれば、上述した実施形態は、算術コード化器コンテキストのようなエントロピーコード化器コンテキストの設計を、信号の周期性のような信号のスペクトルの形状に適合させることによって、トーナル信号及び周波数領域をコード化する可能性を提供する。上述した実施形態は、率直に言えば、近接の概念を超えてコンテキストを拡張し、ピッチ情報に基づくような、オーディオ信号スペクトルの形状に基づいた適応的コンテキスト設計を提案する。そのようなピッチ情報は、加えて復号器に送信されてもよいし、上述したＬＴＰ利得のように、他のコード化モジュールからすでに利用可能であってもよい。コンテキストはその後、すでにコード化された係数を指摘するためにマッピングされる。その係数は、入力信号の基本周波数の倍数又はそれに比例する距離によってコード化するために、現在の係数に関係付けられる。

図１２及び図１２ｂに従って使用されるＬＴＰプレ／ポストフィルタ概念は、高調波ポストフィルタ概念に置き換えられてもよいことに留意すべきである。当該高調波ポストフィルタ概念によれば、復号器にある高調波ポストフィルタは、符号化器からデータストリーム３０を介して復号器に送信されるピッチ（又はピッチ－ラグ）を含むＬＴＰパラメータによって制御される。ＬＴＰパラメータは、前述したスペクトルの形状に関する情報を、明示的シグナリングを使用して復号器に別様に送信するための基準として使用することができる。

上記で概説した実施形態の方法により、トーナル信号についての予測を放棄することができ、それによって、例えば、望ましくないフレーム間依存が導入されることが回避される。他方、予測残差は依然として何らかの高調波構造を示すため、上記のスペクトル係数のコード化／復号の概念はまた、任意の予測技法と組み合わせることもできる。

他の文言を使用して、上述した実施形態を、添付の図面を参照して再び例示する。中でも、図１３は、上記で概説したスペクトル距離適合概念を使用した符号化プロセスの一般的なブロック図を示す。以下の説明とこれまで行ってきた説明との間の一致を容易にするために、参照符号は部分的に再使用する。

入力信号１８は、まずＴＤ（ＴＤ＝時間領域）モジュール２００内の雑音整形／予測に送られる。モジュール２００は、例えば、図１２ａの要素１２８及び１３６の一方又は両方を包含する。このモジュール２００は回避することができ、又は、ＬＰＣコード化の使用による短期予測及び／若しくは図１２ａに示すような長期予測を実行することができる。すべての種類の予測を構想することができる。それらの時間領域処理の１つが、ＬＴＰフィルタ１３６によって出力されるＬＴＰラグパラメータを用いて上記で簡潔に概説したようなピッチ情報を利用し送信する場合、ピッチベースのコンテキストマッピングのために、そのような情報をその後コンテキストベース算術コード化器モジュールに搬送ことができる。

その後、残差及び整形済み時間領域信号２０２が、変換器１０８によって、時間－周波数変換を用いて周波数領域へと変換される。ＤＦＴ又はＭＤＣＴを使用することができる。変換長は適用性のあるものとなることができ、遅延を低くするために、先行する変換窓及び次の変換窓との低オーバーラップ領域（ｃｐ．２４）が使用される。本明細書の残りの部分においては、ＭＤＣＴを説明例として使用する。

変換済み信号１１２はその後、モジュール２０４によって周波数領域において整形される。したがって、モジュール２０４は、例えば、スケール係数決定器１１６及びスペクトル整形器１１０を使用して実現される。これは、ＬＰＣ係数の周波数応答によってなすことができ、かつ心理音響モデルによって駆動されるスケール係数によってなすことができる。時間雑音整形（ＴＮＳ）、又はピッチ情報を利用し送信する周波数領域予測を適用することも可能である。そのような事例において、ピッチ情報は、ピッチベースのコンテキストマッピングに照らしてコンテキストベース算術コード化モジュールに搬送ことができる。後者の可能性はまた、それぞれ図１０ａ～図１２ｂの上記の実施形態に適用されてもよい。

出力スペクトル係数はその後、量子化段１２０によって量子化された後、コンテキストベースエントロピーコード化器１０によって雑音なくコード化される。上述したように、この最後のモジュール１０は、例えば、オーディオ信号のスペクトルに関する情報として、入力信号のピッチ推定値を使用する。そのような情報は、時間領域又は周波数領域のいずれかにおいて事前に実施されている雑音整形／予測モジュール２００又は２０４の一方から引き継ぐことができる。情報が利用可能でない場合、ピッチ推定モジュール２０６などによって、専用ピッチ推定を入力信号に対して実施することができる。ピッチ推定モジュール２０６はその後、ピッチ情報をビットストリーム３０に入れて送信する。

図１４は、図１３に対応した復号プロセスの一般的なブロック図を示す。このプロセスは、図１３に記載されているものと逆の処理から構成される。スペクトルの形状に関する情報の一例として、図１３及び図１４の事例で使用されているピッチ情報が最初に復号され、算術復号器４０に搬送される。必要であれば、情報は、この情報を必要とする他のモジュールにさらに搬送される。

特に、データストリーム３０からピッチ情報を復号し、図９ｂにおける導出プロセス８４を担うピッチ情報復号器２０８に加え、図１４の復号器は、コンテキストベース復号器４０の後に、逆量子化器２１０、ＦＤ（周波数領域）における逆雑音整形／予測モジュール２１２、逆変換器２１４、及びＴＤにおける逆雑音整形／予測モジュール２１６を、その順に備えている。これらはすべて、そのスペクトル係数が復号器４０によってビットストリーム３０から復号されるスペクトル１２からオーディオ信号１８を時間領域で再構築するために、互いに直列に接続される。図１４の要素の、例えば、図１２ｂに示されているものへのマッピングにおいて、逆変換器２１４は、図１２ｂの逆変換器１２６及び重畳加算段１４４を包含する。加えて、図１４は、例えば、すべてのスペクトル線にとって等しい量子化ステップ関数を使用して符号化器４０により出力される復号済みスペクトル係数に対し、逆量子化が適用され得ることを示している。さらに、図１４は、ＴＮＳ（時間雑音整形）モジュールのようなモジュール２１２が、スペクトル整形器１２４と１２６との間に位置づけられ得ることを示している。時間領域逆雑音整形／予測モジュール２１６は、図１２ｂの要素１４６及び／又は１４８を包含する。

本出願の実施形態によって提供される利点を再び動機付けるために、図１５は、スペクトル係数のエントロピーコード化のための従来のコンテキストを示す。コンテキストは、コード化すべき現在の係数の過去の近接した係数の制限範囲を網羅する。すなわち、図１５は、例えば、ＭＰＥＧＵＳＡＣにおいて使用されるものとしての、コンテキスト適合を使用したスペクトル係数のエントロピーコード化の一例を示す。したがって、図１５は、図１及び図２と同様にスペクトル係数を示すが、スペクトル的に近接するスペクトル係数が、スペクトル係数のｎタプルと呼ばれるクラスタにグループ分け又は分割されている。上記で提示した説明との一貫性をそれにもかかわらず維持しながら、そのようなｎタプルを個々のスペクトル係数から区別するために、これらのｎタプルは参照符号１４’を使用して示される。図１５は、一方においてすでに符号化／復号されたｎタプルと、まだコード化／復号されていないｎタプルとを、前者の形状を矩形輪郭で、後者の形状を円形輪郭で描くことによって区別する。さらに、現在復号／コード化すべきｎタプル１４’は網掛けの円形輪郭で描かれている。一方、現在処理すべきｎタプルに位置付けられている固定近接テンプレートによって位置特定される、すでにコード化／復号されているｎタプル１４’も網掛けを使用して示されているが、これらは矩形輪郭を有する。したがって、図１５の例によれば、近接するコンテキストテンプレートは、現在処理すべきｎタプルに近接する６つのｎタプル１４’、すなわち、同じ時刻にあるが直に近接するより低いスペクトル線（複数可）にあるｎタプル、すなわちc₀、同じスペクトル線（複数可）にあるが、直に先行する時刻にあるｎタプル、すなわちc₁、直に近接するより高いスペクトル線にあり、直に先行する時刻にあるｎタプル、すなわちc₂などを識別している。すなわち、図１５に従って使用されるコンテキストテンプレートは、現在処理すべきｎタプルに対して固定相対距離にある基準ｎタプル１４’、すなわち、直に近接するｎタプルを識別する。図１５によれば、スペクトル係数は例示的に、ｎタプルと呼ばれるｎ個のブロック内で考慮される。ｎ個の連続する値を組み合わせることによって、係数間依存関係を利用することが可能になる。次元がより高くなると、コード化すべきｎタプルの文字サイズ、それゆえ、コードブックサイズが指数関数的に増大する。ｎ＝２の次元が本明細書の残りの部分において例示的に使用され、コード化利得とコードブックサイズとの間の妥協点を表す。すべての実施形態において、コード化は、例えば、符号を別個に考慮する。その上、各係数の２つの最上位ビット及び残りの最下位ビットも、別個に処理され得る。コンテキスト適合は、例えば、符号なしのスペクトル値の２つの最上位ビット（ＭＳＢ）のみに適用され得る。符号及び最下位ビットは均一に分散されていると仮定され得る。２タプルのＭＳＢの１６通りの組み合わせとともに、１つの追加のＬＳＢが復号器によって予測されなければならないことを示すために、エスケープシンボルＥＳＣが文字に追加される。追加のＬＳＢと同じ数のＥＳＣシンボルが送信される。合計で、１７個のシンボルがコードの文字を形成する。本発明は、上述したシンボルを生成する方法には限定されない。

後者の具体的な詳細を図３及び図４の記載に転用すると、これは、エントロピー符号化／復号エンジン４４及び５４のシンボル文字が、値{0, 1, 2, 3}＋エスケープシンボルを包含することができ、符号化すべき入力スペクトル係数（inbound spectral coefficient）が、３を超える場合に、４よりも小さくなるようにするために必要な回数だけ４で除算され、除算ごとにエスケープシンボルが符号化されることを意味する。したがって、０以上のエスケープシンボル及び後続する実際の非エスケープシンボルが各スペクトル係数について符号化され、これらのシンボルの最初の２つのみが、例えば、本明細書において前述したようなコンテキスト適合性を使用してコード化される。この着想を２タプル、すなわち、スペクトル的に直に近接する係数の対に転用すると、シンボル文字はこの２タプルについて１６の値の対、すなわち、{(0, 0), (0, 1), (1, 0), ..., (1, 1)}、及び、エスケープシンボルｅｓｃ（ｅｓｃはエスケープシンボルの略語である）、すなわち、全部で１７個のシンボルを含み得る。３を超える少なくとも１つの係数を含むすべての入力スペクトル係数のｎタプルは、それぞれの２タプルの各係数に適用される４によって除算される。復号側において、存在する場合、エスケープシンボルの数×４が、非エスケープシンボルから得られる余りの値に加えられる。

図１６は、上記で概説した概念に従って図１５の概念を修正することにより得られるマッピング済みコンテキストマッピングの構成を示す。それによれば、基準スペクトル係数の相対スペクトル距離２８は、例えば、信号の周期性又はピッチ情報を考慮に入れることなどによって、スペクトルの形状に関する情報に応じて適合される。特に、図１６ａ～図１６ｃは、コンテキスト内の前述した相対スペクトル距離２８に対応する距離Ｄを、以下の式によって与えられるＤ０によっておおまかに推定することができることを示している。

ここで、ｆ_ｓはサンプリング周波数であり、ＮはＭＤＣＴサイズでありＬはサンプルにおける遅延期間である。図１６（ａ）の例において、コンテキストは、コード化すべき現在のｎタプルに対してＤの倍数だけ離れているｎタプルを指摘する。図１６（ｂ）は、従来の近接するコンテキストを、高調波関連コンテキストと組み合わせる。最後に、図１６（ｃ）は、先行するフレームと依存関係を有しないフレーム間マッピング済みコンテキストの一例を示す。すなわち、図１６ａは、図７を参照して上記で述べた可能性に加えて、スペクトルの形状に関する情報に依存した相対スペクトル距離の適合を、コンテキストテンプレートに属する固定数の基準スペクトル係数のすべてに適用することができることを示している。図１６ｂは、異なる例に従って、例えば、コンテキストテンプレートの低周波数側にあるスペクトル的に最も外側のもののみ、ここではC₃及びC₅のみのような、これらの基準スペクトル係数の部分集合のみが適合性８０による変位を受けることを示している。残りの基準スペクトル係数、ここではC₀～C₄は、現在処理されているスペクトル係数に対する固定位置、すなわち、現在処理すべきスペクトル係数に対して直に近接するスペクトル時間位置に位置付けられ得る。最後に、図１６ｃは、前もってコード化されたスペクトル係数のみが、現在処理すべきスペクトル係数と同じ時刻に位置付けられるコンテキストテンプレートの基準係数として使用される可能性を示している。

図１７は、図１６ａ～ｃのマッピング済みコンテキストが、高調波の多いスペクトルＸ（ｃｐ．２０）のトーンを予測することができない図１５による従来のコンテキストよりも、どのように効率的であり得るかの例示を与える。

その後に、距離Ｄを効率的に推定及びコード化するための可能なコンテキストマッピングメカニズム及び本発明の例示的な実施形態を詳細に説明する。例示を目的として、以下のセクションにおいて、図１６ｃによるフレーム間マッピング済みコンテキストを使用する。

第１の実施形態：２タプルコード化及びマッピング

最初に、最適な距離は、サイズＮの現在量子化されているスペクトルｘ[]をコード化するために必要とされるビット数を最大限に低減するような検索である。初期距離を、以前実施されたピッチ推定において見出された遅延期間ＬのＤ０関数によって推定することができる。検索範囲は以下のようにすることができる。
Ｄ０－Δ＜Ｄ＜Ｄ０＋Δ

代わりに、Ｄ０の倍数を考慮することによって範囲を補正してもよい。拡大範囲は以下のようになる。
{Ｍ．Ｄ０－Δ＜Ｄ＜Ｍ．Ｄ０＋Δ：Ｍ ∈Ｆ}
ここで、Ｍは、例えば、有限集合Ｆに属する乗法係数である。例えば、Ｍは、半分及び２倍のピッチを探索するために０．５、１及び２の値を得ることができる。最後に、Ｄの全数検索も行うことができる。実際には、この最後の手法は複雑になりすぎる場合がある。図１８に検索アルゴリズムの一例を示す。この検索アルゴリズムは、例えば、導出プロセス８２又は復号側及び符号化側における導出プロセス８２及び８４の両方の一部分であってもよい。

コストは、コンテキストに対するマッピングが実施されていないときのコストに初期化される。より良好なコストをもたらす距離がない場合、マッピングは実施されない。マッピングが実施される場合をシグナリングするためのフラグが、復号器に送信される。

最適な距離Ｄｏｐｔが見つかった場合にはこれを送信する必要がある。Ｌが符号化器の別のモジュールによってすでに送信されている場合、図９ｂの前述した明示的なシグナリングに対応する調整パラメータｍ及びｄは、以下のように送信される必要がある。
Ｄｏｐｔ＝ｍ．Ｄ０＋ｄ

そうでない場合、Ｄｏｐｔの絶対値が送信されなければならない。両方の代替形態は、図９ｂを参照して上述されている。例えば、サイズＮ＝２５６及びｆｓ＝１２８００ＨｚのＭＤＣＴを考慮した場合、Ｄを２～１７に制限することによって、３０Ｈｚ～２５６Ｈｚのピッチ周波数をカバーすることができる。整数分解能によって、Ｄを４ビットでコード化することができ、０．５の分解能について５ビットでコード化することができ、０．２５の分解能によって６ビットでコード化することができる。

ｘ[]をコード化するために必要とされるビット数としてコスト関数を計算することができ、コンテキストマッピングを生成するためにＤが使用される。コスト関数は、スペクトルを算術コード化すること、又は少なくとも、必要とするビット数の良好な推定値を有することを必要とすることから、コスト関数を得ることは通常複雑である。各候補Ｄについてコスト関数を計算することは複雑になり得るため、代替形態として、値Ｄからのコンテキストマッピングの導出から直にコストの推定値を得ることを提案する。コンテキストマッピングを導出している間、近接するマッピング済みコンテキストのノルムの差を容易に計算することができる。コンテキストは、算術コード化器において、符号化すべきｎタプルを予測するために使用されるため、また、コンテキストは、Ｌ１ノルムに基づいて本発明の好ましい実施形態において計算されるため、近接するマッピング済みコンテキスト間のノルムの差の合計は、Ｄを所与としたマッピングの効率の良好な指標である。最初に、ｘ[]の各２タプルのノルムが以下のように計算される。

ここで、本発明ではコンテキスト計算においてＬ１ノルムを考慮するため、好ましい実施形態においてはＮＯＲＭ＝１である。このセクションにおいては、２の分解能、すなわち、２タプルあたり１つのマッピングで機能するコンテキストマッピングを説明している。分解能はｒ＝２であり、コンテキストマッピングテーブルはｎ／２のサイズを有する。コンテキストマッピング生成及び費用関数計算の擬似コードは下記の通り与えられる。

入力：分解能ｒ
入力：normVect[N/r]
出力：contextMapping[N/r]

最適な距離Ｄが計算されると、スペクトルの高調波位置、バレー及びテールを与えるインデックス置換表も推定される。その後、コンテキストマッピング規則が以下のように推定される。

これは、スペクトル内のインデックスｉの２タプル（ｘ［２＊ｉ］,ｘ［２＊ｉ＋１］）について、インデックスcontextMapping[i-1], contextMapping[i-2]... contextMapping[i-l]の２タプルを用いて過去のコンテキストが考慮されることを意味する。ここで、lは２タプルに関するコンテキストのサイズである。１つ又は複数の先行するスペクトルもコンテキストについて考慮される場合、過去のコンテキストに組み込まれているこれらのスペクトルの２タプルはインデックスとしてcontextMapping[i+l],...,contextMapping[i+1],contextMapping[i],contextMapping[i-1], contextMapping[i-l]を有することになり、ここで、２ｌ＋１は先行するスペクトルあたりのコンテキストのサイズである。

インデックス置換表はまた、トーナル成分のインデックス、及びそれに続く非トーナル成分のインデックスを収集するため、さらなる興味深い情報をも与える。それゆえ、本発明では、対応する振幅が低減していると期待することができる。これは、非ゼロ２タプルに対応する、IndexPermutaion内の最後のインデックスを検出することによって利用することができる。このインデックスは（ｌａｓｔＮｚ／２―１）に対応し、ｌａｓｔＮｚは以下のように計算される。

ｌａｓｔＮｚ／２は、スペクトル成分の前のｃｅｉｌ（ｌｏｇ２（ｎ／２））ビット上でコード化される。

算術符号化器の擬似コードは以下の通りである。
入力：スペクトルx[N]
入力：contextMapping[N/2]
入力：lastNz
出力：コード化ビットストリーム

ｃｕｍ＿ｐｒｏｂａ［］テーブルは大きいトレーニングセットに対するオフライントレーニング中に得られる異なる累積モデルである。これは、この特定の事例において１７個のシンボルを含む。ｐｒｏｂａ＿ｍｏｄｅｌ＿ｌｏｏｋｕｐ［］は、コンテキストインデックスｔを累積確率モデルｐｋｉにマッピングするルックアップテーブルである。このテーブルはまた、トレーニング段階を通じても得られる。ｃｕｍ＿ｅｑｕｉｐｒｏｂ［］は、確率が等しい２つのシンボルの文字についての累積確率テーブルである。

第２の実施形態：１タプルマッピングによる２タプル

この第２の実施形態において、スペクトル成分は依然としてコード化２タプル×２タプルであるが、コンテキストマッピング（contextMapping）はここでは１タプルの分解能を有する。これは、コンテキストのマッピングにおいてはるかにより多くの可能性及び柔軟性があることを意味する。このとき、マッピング済みコンテキストが所与の信号により良好に適応することができる。最適な距離はセクション３において行われたものと同じように検索されるが、今回の分解能はｒ＝１である。そのためには、ＭＤＣＴラインごとにnormVect[]が計算されなければならない。

このとき、結果としてもたらされるコンテキストマッピングは、次元Ｎの表によって与えられる。ＬａｓｔＮｚが先行するセクションにおけるように計算され、符号化は以下のように記述することができる。

入力：lastNz
入力：contextMapping[N]
入力：スペクトルx[N]
出力：コード化ビットストリーム
ローカル：context[N/2]

先行するセクションとは逆に、２つの非連続スペクトル係数を同じ２タプル内でまとめることができる。この理由から、２タプルの２つの要素についてのコンテキストマッピングは、コンテキストテーブル内の２つの異なるインデックスを指摘する可能性がある。好ましい実施形態において、本発明では、最低インデックスを有するマッピング済みコンテキストを選択するが、２つのマッピング済みコンテキストの平均のような、異なる規則を有することもできる。同じ理由から、コンテキストの更新も別様に処理されるべきである。２つの要素がスペクトル内で連続している場合、本発明ではコンテキストを計算する従来の方法を使用する。そうでない場合、コンテキストは、それ自体の大きさのみを考慮して、２つの要素について別個に更新される。

復号は、以下のステップから構成される。

・コンテキストマッピングが実施されるか否かを知るためにフラグを復号する。
・Ｄｏｐｔ、又はＤ０についてのＤｏｐｔを得るためのパラメータ調整パラメータのいずれかを復号することによって、コンテキストマッピングを復号する。
・ｌａｓｔＮｚを復号する。
・量子化スペクトルを以下のように復号する。

入力：lastNz
入力：contextMapping[N]
入力：コード化ビットストリーム
ローカル：context[N/2]
出力：量子化スペクトルx[N]

このように、上記の実施形態はとりわけ、例えば、トーナル信号の算術コード化のようなエントロピーコード化のためのピッチベースのコンテキストマッピングを明らかにした。

いくつかの態様が装置の側面で説明されているが、これらの態様はまた、対応する方法の説明をも表すことは明らかであり、ブロック又はデバイスは、方法ステップ又は方法ステップの特徴に対応する。同様に、方法ステップの側面で説明されている態様はまた、対応する装置の対応するブロック又は項目又は特徴の説明をも表す。方法ステップのいくつか又はすべては、例えば、マイクロプロセッサ、プログラム可能コンピュータ又は電子回路のような、ハードウェア装置によって実行されてもよい（又は使用していてもよい）。いくつかの実施形態において、もっとも重要な方法ステップの何らかの１つ又は複数は、そのような装置によって実行されてもよい。

本発明の符号化オーディオ信号は、デジタル記憶媒体上に記憶することができ、又は、インターネットのような、無線送信媒体又は有線送信媒体のような送信媒体上で送信することができる。

特定の実施要件に依存して、本発明の実施形態は、ハードウェア又はソフトウェアにおいて実現することができる。実施態様は、それぞれの方法が実施されるようにプログラム可能なコンピュータシステムと協働する（又は協働することが可能である）電子可読制御信号を記憶したデジタル記憶媒体、例えば、フロッピーディスク、ＤＶＤ、Ｂｌｕ－Ｒａｙ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ又はフラッシュメモリを使用して実施することができる。したがって、デジタル記憶媒体は、コンピュータによって読取り可能であってよい。

本発明によるいくつかの実施形態は、本明細書に記載されている方法の１つが実施されるようにプログラム可能なコンピュータシステムと協働することが可能である電子可読制御信号を有するデータキャリアを含む。

一般的に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実現することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で動作するときに、本方法の１つを実施するように動作可能である。プログラムコードは、例えば、機械が読取り可能なキャリア上に記憶されてもよい。

他の実施形態は、機械が読取り可能なキャリア上に記憶され、本明細書に記載されている方法の１つを実施するためのコンピュータプログラムを含む。

言い換えれば、本発明の方法の一実施形態は、コンピュータプログラムがコンピュータ上で動作するときに、本明細書に記載されている方法の１つを実施するためのプログラムコードを有するコンピュータプログラムである。

それゆえ、本発明のさらなる実施形態は、本明細書に記載されている方法の１つを実施するためのコンピュータプログラムを記録されて含むデータキャリア（又はデジタル記憶媒体、又はコンピュータが読取り可能な媒体）である。データキャリア、デジタル記憶媒体又は記録媒体は一般的に、有形かつ／又は持続性である。

それゆえ、本発明の方法のさらなる実施形態は、本明細書に記載されている方法の１つを実施するためのコンピュータプログラムを表すデータストリーム又は信号系列である。データストリーム又は信号系列は、例えば、データ通信接続、例えば、インターネットを介して転送されるように構成することができる。

さらなる実施形態は、本明細書に記載されている方法の１つを実施するように構成又は適合されている処理手段、例えば、コンピュータ又はプログラム可能な論理デバイスを含む。

さらなる実施形態は、本明細書に記載されている方法の１つを実施するためのコンピュータプログラムがインストールされたコンピュータを含む。

本発明によるさらなる実施形態は、本明細書に記載されている方法の１つを実施するためのコンピュータプログラムを受信機に（例えば、電子的に又は光学的に）転送するように構成されている装置又はシステムを含む。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであってもよい。装置又はシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを含んでもよい。

いくつかの実施形態において、プログラム可能な論理デバイス（例えば、フィールドプログラマブルゲートアレイ）が、本明細書に記載されている方法の機能のいくつか又はすべてを実施するために使用されてもよい。いくつかの実施形態において、フィールドプログラマブルゲートアレイは、本明細書に記載されている方法の１つを実施するためにマイクロプロセッサと協働してもよい。一般的に、方法は好ましくは、ハードウェア装置によって実施される。

上述した実施形態は、本発明の原理の例示にすぎない。本明細書に記載されている構成及び詳細の改変及び変形が当業者には明らかになることが理解される。それゆえ、本明細書における実施形態の記載及び説明によって提示されている特定の詳細によってではなく、添付の特許請求項の範囲のみによって限定されることが意図されている。

Claims

スペクトルの系列から構成されたオーディオ信号のスペクトログラムのスペクトル係数を復号するための復号器であって、
１つのスペクトル内でスペクトル係数を走査し、その後に時間的に後続するスペクトルのスペクトル係数に進むスペクトル時間経路に沿って、データストリームからスペクトル係数を復号するように構成されているとともに、
現在のスペクトルの現在復号すべき（currently to be decoded）スペクトル係数を、現在のスペクトルに属するスペクトル係数を含んでいる前もって復号された（previously decoded）スペクトル係数のテンプレートであって、現在復号すべきスペクトル係数の位置に位置付けられるテンプレートに依存して、コンテキスト適応エントロピー復号によって復号し、現在のスペクトルに属するスペクトル係数と現在復号すべきスペクトル係数との間の相対スペクトル距離をスペクトルの形状に関する情報に依存して調整するように構成されており、
前記復号器は、前記オーディオ信号のピッチの測度から前記スペクトルの形状に関する前記情報を導出するように構成されており、
前記復号器は、前記相対スペクトル距離がピッチの増大に伴って増大するように、前記ピッチの前記測度に依存して前記相対スペクトル距離を調整するように構成されている、復号器。
前記復号器が前記スペクトルの形状に関する前記情報を前記オーディオ信号の周期性の測度からさらに導出するように構成され、かつ、前記復号器が、前記相対スペクトル距離が周期性の増大に伴って低減するように、前記周期性の測度に依存して前記相対スペクトル距離を調整するように構成されているか、
前記復号器が前記スペクトルの形状に関する前記情報を前記オーディオ信号の前記スペクトルの高調波間距離の前記測度からさらに導出するように構成され、かつ、前記復号器が、前記相対スペクトル距離が高調波間距離の増大に伴って増大するように、前記高調波間距離の前記測度に依存して前記相対スペクトル距離を調整するように構成されているか、又は、
前記復号器が前記スペクトルの形状に関する前記情報を前記スペクトルのスペクトル包絡線のフォルマント及び／又はバレーの相対位置からさらに導出するように構成され、かつ、前記復号器が、前記相対スペクトル距離が、前記スペクトル包絡線内の前記バレーの間及び／又は前記スペクトル包絡線の前記フォルマント間のスペクトル距離の増大に伴って増大するように、前記位置に依存して前記相対スペクトル距離を調整するように構成されている、請求項１に記載の復号器。
スペクトルの系列から構成されたオーディオ信号のスペクトログラムのスペクトル係数を復号するための復号器であって、
１つのスペクトル内でスペクトル係数を走査し、その後に時間的に後続するスペクトルのスペクトル係数に進むスペクトル時間経路に沿って、データストリームからスペクトル係数を復号するように構成されているとともに、
現在のスペクトルの現在復号すべき（currently to be decoded）スペクトル係数を、現在のスペクトルに属するスペクトル係数を含んでいる前もって復号された（previously decoded）スペクトル係数のテンプレートであって、現在復号すべきスペクトル係数の位置に位置付けられるテンプレートに依存して、コンテキスト適応エントロピー復号によって復号し、現在のスペクトルに属するスペクトル係数と現在復号すべきスペクトル係数との間の相対スペクトル距離をスペクトルの形状に関する情報に依存して調整するように構成されており、
前記復号器は、前記データストリームにおいて信号化された、
前記オーディオ信号のピッチ又は周期性の測度、
前記オーディオ信号のスペクトルの高調波間距離の測度、
前記スペクトルのスペクトル包絡線のフォルマント及び／又はバレーの相対位置、の少なくとも１つから前記スペクトルの形状に関する前記情報を導出するように構成されており、
エントロピー復号による前記現在復号すべきスペクトル係数の復号において、前記テンプレートの前記前もって復号されたスペクトル係数をスカラー関数に従わせることによって、前記現在復号すべきスペクトル係数のための確率分布推定値を求め、前記エントロピー復号に前記確率分布推定値を使用するように構成されている、復号器。
エントロピー復号として算術復号を使用するように構成されている、請求項３に記載の復号器。
前記復号器は、前記現在復号すべきスペクトル係数をスペクトル的に及び／又は時間的に予測し、前記エントロピー復号を介して得られる予測残差で前記スペクトル的な及び／又は時間的な予測を補正することにより、前記現在復号すべきスペクトル係数を復号するように構成されている、請求項３に記載の復号器。
スペクトルの系列から構成されたオーディオ信号のスペクトログラムのスペクトル係数を復号するように構成されている復号器を備えている変換ベースオーディオ復号器であって、
前記復号器は、
１つのスペクトル内でスペクトル係数を走査し、その後に時間的に後続するスペクトルのスペクトル係数に進むスペクトル時間経路に沿って、データストリームからスペクトル係数を復号するように構成されているとともに、
現在のスペクトルの現在復号すべき（currently to be decoded）スペクトル係数を、現在のスペクトルに属するスペクトル係数を含んでいる前もって復号された（previously decoded）スペクトル係数のテンプレートであって、現在復号すべきスペクトル係数の位置に位置付けられるテンプレートに依存して、コンテキスト適応エントロピー復号によって復号し、現在のスペクトルに属するスペクトル係数と現在復号すべきスペクトル係数との間の相対スペクトル距離をスペクトルの形状に関する情報に依存して調整するように構成されており、
前記復号器は、前記データストリームにおいて信号化された、
前記オーディオ信号のピッチ又は周期性の測度、
前記オーディオ信号のスペクトルの高調波間距離の測度、
前記スペクトルのスペクトル包絡線のフォルマント及び／又はバレーの相対位置、の少なくとも１つから前記スペクトルの形状に関する前記情報を導出するように構成されている、変換ベースオーディオ復号器。
前記復号器は、スケール係数を使用して前記スペクトルをスケーリングすることによって、前記スペクトルをスペクトル的に整形するように構成されている、請求項６に記載の変換ベースオーディオ復号器。
前記スケール係数が線形予測係数情報によって規定される線形予測合成フィルタに依存した伝達関数を表すように、線形予測分析に基づいて前記スケール係数を決定するように構成されている、請求項７に記載の変換ベースオーディオ復号器。
前記線形予測係数情報によって規定される前記線形予測合成フィルタに対する前記伝達関数の依存性は、前記伝達関数が知覚的に重み付けされるようなものである、請求項８に記載の変換ベースオーディオ復号器。
前記線形予測係数情報によって規定される前記線形予測合成フィルタ1/A(z)に対する前記伝達関数の依存性は、前記伝達関数が1/A(k・z)の伝達関数であるようなものであり、kは定数である、請求項９に記載の変換ベースオーディオ復号器。
前記変換ベースオーディオ復号器は、明示的にシグナリングされた長期予測パラメータによって制御される長期予測高調波又はポストフィルタリングをサポートし、前記変換ベースオーディオ復号器は、前記明示的にシグナリングされる長期予測パラメータから前記スペクトルの形状に関する情報を導出するように構成されている、請求項６に記載の変換ベースオーディオ復号器。
スペクトルの系列から構成されたオーディオ信号のスペクトログラムのスペクトル係数を符号化するための符号化器であって、
１つのスペクトル内でスペクトル係数を走査し、その後に時間的に後続するスペクトルのスペクトル係数に進むスペクトル時間経路に沿って、データストリームにおいてスペクトル係数を符号化し、
現在のスペクトルの現在符号化すべきスペクトル係数を、現在のスペクトルに属するスペクトル係数を含んでいる前もって符号化されたスペクトル係数のテンプレートであって、現在符号化すべきスペクトル係数の位置に位置付けられるテンプレートに依存して、エントロピー符号化によって符号化し、現在のスペクトルに属するスペクトル係数と現在符号化すべきスペクトル係数との間の相対スペクトル距離をスペクトルの形状に関する情報に依存して調整するように構成され、
前記符号化器は、前記オーディオ信号のピッチの測度から前記スペクトルの形状に関する前記情報を前記データストリーム内で提供するように構成されており、
前記符号化器は、前記相対スペクトル距離がピッチの増大に伴って増大するように、前記ピッチの前記測度に依存して前記相対スペクトル距離を調整するように構成されている、符号化器。
スペクトルの系列から構成されたオーディオ信号のスペクトログラムのスペクトル係数を復号するための方法であって、
１つのスペクトル内でスペクトル係数を走査し、その後に時間的に後続するスペクトルのスペクトル係数に進むスペクトル時間経路に沿って、データストリームからスペクトル係数を復号することと、
現在のスペクトルの現在復号すべきスペクトル係数を、現在のスペクトルに属するスペクトル係数を含んでいる前もって復号されたスペクトル係数のテンプレートであって、現在復号すべきスペクトル係数の位置に位置付けられるテンプレートに依存して、エントロピー復号によって復号し、現在のスペクトルに属するスペクトル係数と現在復号すべきスペクトル係数との間の相対スペクトル距離をスペクトルの形状に関する情報に依存して調整することと、を含み、
前記スペクトルの形状に関する前記情報は、前記オーディオ信号のピッチの測度から導出され、
前記方法は、前記相対スペクトル距離がピッチの増大に伴って増大するように、前記ピッチの前記測度に依存して前記相対スペクトル距離を調整することを含む、方法。
スペクトルの系列から構成されたオーディオ信号のスペクトログラムのスペクトル係数を符号化するための方法であって、
１つのスペクトル内でスペクトル係数を走査し、その後に時間的に後続するスペクトルのスペクトル係数に進むスペクトル時間経路に沿って、データストリーム内へスペクトル係数を符号化することと、
現在のスペクトルの現在符号化すべきスペクトル係数を、現在のスペクトルに属するスペクトル係数を含んでいる前もって符号化されたスペクトル係数のテンプレートであって、現在符号化すべきスペクトル係数の位置に位置付けられるテンプレートに依存して、コンテキスト適応エントロピー符号化によって符号化し、現在のスペクトルに属するスペクトル係数と現在符号化すべきスペクトル係数との間の相対スペクトル距離をスペクトルの形状に関する情報に依存して調整することと、を含み、
前記スペクトルの形状に関する前記情報は、前記オーディオ信号のピッチの測度から前記データストリーム内で提供され、
前記方法は、前記相対スペクトル距離がピッチの増大に伴って増大するように、前記ピッチの前記測度に依存して前記相対スペクトル距離を調整することを含む、方法。
コンピュータ上で動作しているときに、請求項１３又は１４に記載の方法を実施するためのプログラムコードを有するコンピュータプログラム。