JP6224233B2

JP6224233B2 - 分配量子化及び符号化を使用したオーディオ信号包絡の分割によるオーディオ信号包絡符号化、処理及び復号化の装置と方法

Info

Publication number: JP6224233B2
Application number: JP2016518977A
Authority: JP
Inventors: ベックストローム，トム; シューベルト，ベンヤミン; ムルトルス，マルクス; デッシュ，サッシャ; シュミット，コンスタンチン; ピートルチック，グルツェゴルツ
Original assignee: フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 2013-06-10
Filing date: 2014-06-10
Publication date: 2017-11-01
Anticipated expiration: 2034-06-10
Also published as: ES2635026T3; MX353188B; US20160148621A1; KR101789085B1; JP2016524186A; EP3008725B1; BR112015030672A2; ZA201600080B; BR112015030672B1; AU2014280256A1; KR20160028420A; SG11201510164RA; EP3008725A1; RU2015156587A; CN105340010A; HK1223726A1; CA2914418C; MY170179A; CA2914418A1; AU2014280256B2

Description

本発明はオーディオ信号包絡符号化、処理及び復号化の装置及び方法に関し、特に、分配量子化（distribution quantization）及び符号化を使用したオーディオ信号包絡符号化、処理ならびに復号化の装置と方法に関する。

線形予測符号化（ＬＰＣ）は、スピーチコーデックにおいてコア帯域幅のスペクトル包絡をモデル化するための伝統的なツールである。ＬＰＣモデルを量子化する際の最も一般的なドメインは線スペクトル周波数（ＬＳＦ）ドメインである。それはＬＰＣ多項式を、根が単位円上にある２つの多項式へと分解することに基づいており、それら根が角度又は周波数だけで記述される得る。

[1] Makhoul, John. "Linear prediction: A tutorial review." Proceedings of the IEEE 63.4 (1975): 561-580. [2] Soong, Frank, and B. Juang. "Line spectrum pair (LSP) and speech data compression." Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP'84.. Vol. 9. IEEE, 1984. [3] Pan, Davis. "A tutorial on MPEG/Audio compression." Multimedia, IEEE 2.2 (1995): 60-74. [4] M. Neuendorf, P. Gournay, M. Multrus, J. Lecomte, B. Bessette, R. Geiger, S. Bayer, G. Fuchs, J. Hilpert, N. Rettelbach, R. Salami, G. Schuller, R. Lefebvre, B. Grill. "Unified speech and audio coding scheme for high quality at low bitrates". In Acoustics, Speech and Signal Processing, 2009. ICASSP 2009. IEEE International Conference on (pp. 1-4). IEEE. April, 2009. [5] Kuntz, A., Disch, S., Baeckstrom, T., & Robilliard, J. "The Transient Steering Decorrelator Tool in the Upcoming MPEG Unified Speech and Audio Coding Standard". In Audio Engineering Society Convention 131, October 2011. [6] Herre, Juergen, and James D. Johnston. "Enhancing the performance of perceptual audio coders by using temporal noise shaping (TNS)." Audio Engineering Society Convention 101. 1996.

本発明の目的は、オーディオ信号包絡符号化及び復号化のための改善された概念を提供することである。本発明の目的は、請求項１に記載の装置と、請求項５に記載の装置と、請求項１７に記載の装置と、請求項２２に記載の方法と、請求項２３に記載の方法と、請求項２４に記載の方法と、請求項２５に記載のコンピュータプログラムとによって達成される。

再生オーディオ信号包絡(reconstructed audio signal envelope)を得るために復号化する装置が提供される。この装置は、１つ以上の分割点に依存して再生オーディオ信号包絡を生成する信号包絡再生部と、再生オーディオ信号包絡を出力する出力インターフェースと、を含む。信号包絡再生部は、１つ以上の分割点が再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように、再生オーディオ信号包絡を生成するよう構成されており、予め定義された割当規則が、２つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記信号包絡部分に依存して定義している。更に、信号包絡再生部は、２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように、再生オーディオ信号包絡を生成するよう構成されている。

一実施形態によれば、信号包絡再生部は、例えば２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の９０％よりも大きくなるように、再生オーディオ信号包絡を生成するよう構成されている。

一実施形態において、信号包絡再生部は、例えば２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の９９％よりも大きくなるように、再生オーディオ信号包絡を生成するよう構成されてもよい。

他の実施形態において、信号包絡再生部１１０は、例えば２つ以上の信号包絡部分の各々の信号包絡部分値がそれら２つ以上の信号包絡部分の他の信号包絡部分の各々の信号包絡部分値と等しくなるように、再生オーディオ信号包絡を生成するよう構成されてもよい。

一実施形態によれば、２つ以上の信号包絡部分の各信号包絡部分の信号包絡部分値は、例えば前記信号包絡部分の１つ以上のエネルギー値、又は１つ以上のパワー値に依存してもよい。又は、２つ以上の信号包絡部分の各信号包絡部分の信号包絡部分値は、オーディオ信号包絡のオリジナルレベル又は目標レベルを再生するために適切な他の如何なる値に依存してもよい。

包絡のスケーリングは、種々の方法で実行されてもよい。特に、そのスケーリングは信号エネルギー、スペクトルマス（spectral mass）若しくは類似の値（絶対サイズ）に対応することができ、又は、スケーリングファクタ若しくはゲインファクタ（相対サイズ）でもあり得る。従って、包絡のスケーリングは、絶対値又は相対値として符号化されることができ、又は、先行値もしくは先行値の組合せに対する差によって符号化されることができる。幾つかの場合、スケーリングはまた、他の使用可能なデータから独立していてもよく、又はそのデータから導出されてもよい。包絡はそのオリジナルレベル又は目標レベルへと再生されるべきである。従って、一般的に、信号包絡部分値は、オーディオ信号包絡のオリジナルレベル又は目標レベルを再生するために適切な任意の値に依存する。

一実施形態において、この装置は、ある復号化規則に従って１つ以上の符号化された点を復号化して１つ以上の分割点の各々の位置を取得する、分割点復号器を更に含む。分割点復号器は、可能な分割点位置の全体数を示す全体位置数と、１つ以上の分割点の数を示す分割点数と、分割点状態数とを分析するよう構成されてもよい。更に、分割点復号器は、例えば全体位置数と分割点数と分割点状態数とを使用して、１つ以上の分割点の各々の位置の指示を生成するよう構成されてもよい。

一実施形態によれば、信号包絡再生部は、例えば再生オーディオ信号包絡の全体エネルギーを示す全体エネルギー値に依存して、又はオーディオ信号包絡のオリジナル若しくは目標レベルを再生するのに適切な他の如何なる値にも依存して、再生オーディオ信号包絡を生成するよう構成されてもよい。

更に、再生オーディオ信号包絡を得るために復号化する、他の実施形態に係る装置が提供される。この装置は、再生オーディオ信号包絡を１つ以上の分割点に依存して生成する信号包絡再生部と、再生オーディオ信号包絡を出力する出力インターフェースと、を含む。信号包絡再生部は、１つ以上の分割点が再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように、再生オーディオ信号包絡を生成するよう構成されており、予め定義された割当規則が、２つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を前記信号包絡部分に依存して定義している。所定の包絡部分値が２つ以上の信号包絡部分の各々に対して割り当てられる。信号包絡再生部は、２つ以上の信号包絡部分の各信号包絡部分について、前記信号包絡部分の信号包絡部分値の絶対値が前記信号包絡部分に割り当てられた所定の包絡部分値の絶対値の９０％よりも大きくなるように、かつ前記信号包絡部分の信号包絡部分値の絶対値が前記信号包絡部分に割り当てられた所定の包絡部分値の絶対値の１１０％よりも小さくなるように、再生オーディオ信号包絡を生成するよう構成されている。

一実施形態において、信号包絡再生部は、２つ以上の信号包絡部分の各々の信号包絡部分値が前記信号包絡部分に割り当てられた所定の包絡部分値と等しくなるように、再生オーディオ信号包絡を生成するよう構成されている。

一実施形態において、信号包絡部分の少なくとも２つの所定の包絡部分値は互いに異なっている。

他の実施形態において、信号包絡部分の各々の所定の包絡部分値は他の信号包絡部分の各々の所定の包絡部分値と異なっている。

更に、オーディオ信号を再生する装置が提供される。この装置は、オーディオ信号の再生オーディオ信号包絡を得るために、上述の実施形態の１つに従って復号化する装置と、オーディオ信号のオーディオ信号包絡に依存しかつオーディオ信号の更なる信号特性に依存して、オーディオ信号を生成する信号生成部と、を含み、その更なる信号特性はオーディオ信号包絡とは異なるものである。

更に、オーディオ信号包絡を符号化する装置が提供される。この装置は、オーディオ信号包絡を受信するオーディオ信号包絡インターフェースと、予め定義された割当規則に依存して、少なくとも２つの分割点構成の各々のために、２つ以上のオーディオ信号包絡部分の少なくとも１つのオーディオ信号包絡部分についての信号包絡部分値を決定する分割点決定部と、を含む。少なくとも２つの分割点構成の各々は１つ以上の分割点を含み、その２つ以上の分割点構成の各々の１つ以上の分割点は、オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割する。分割点決定部は、少なくとも２つの分割点構成の１つの１つ以上の分割点を、オーディオ信号包絡を符号化するための１つ以上の選択された分割点として選択するよう構成されており、その分割点決定部は、少なくとも２つの分割点構成の各々の２つ以上のオーディオ信号包絡部分の少なくとも１つのオーディオ信号包絡部分の各々の信号包絡部分値に依存して、１つ以上の分割点を選択するよう構成されている。

一実施形態によれば、２つ以上の信号包絡部分の各信号包絡部分の信号包絡部分値は、例えば前記信号包絡部分の１つ以上のエネルギー値又は１つ以上のパワー値に依存してもよい。あるいは、２つ以上の信号包絡部分の各信号包絡部分の信号包絡部分値は、オーディオ信号包絡のオリジナルレベル又は目標レベルを再生するために適切な他の任意の値に依存する。

上述したように、包絡のスケーリングは様々な方法で実行され得る。特に、包絡のスケーリングは、信号エネルギー若しくはスペクトルマス又は類似の値（絶対サイズ）に対応することができ、又は、それはスケーリング若しくはゲインのファクタ（相対サイズ）であり得る。従って、包絡のスケーリングは、絶対値又は相対値として符号化されることができ、又はそれは、先行値もしくは先行値の組合せに対する差によって符号化されることができる。幾つかの場合、スケーリングはまた、他の使用可能なデータから独立していてもよく、又はそこから導出されてもよい。包絡はそのオリジナルレベル又は目標レベルへと再生されるべきである。従って、一般的に信号包絡部分値は、オーディオ信号包絡のオリジナルレベル又は目標レベルを再生するための適切な任意の値に依存する。

一実施形態において、この装置は、例えば１つ以上の符号化された点を得るために、１つ以上の分割点の各々の位置を符号化する分割点符号器を更に含んでもよい。その分割点符号器は、例えば分割点状態数を符号化することにより、１つ以上の分割点の各々の位置を符号化するよう構成されてもよい。更に、分割点符号器は、例えば可能な分割点位置の全体数を示す全体位置数と、１つ以上の分割点の数を示す分割点数とを提供するよう構成されてもよい。分割点状態数と全体位置数と分割点数とは共に、１つ以上の分割点の各々の位置を示す。

一実施形態によれば、この装置は、例えばオーディオ信号包絡の全体エネルギーを決定し、かつオーディオ信号包絡のその全体エネルギーを符号化するためのエネルギー決定部を更に含んでもよい。あるいは、この装置は、例えばオーディオ信号包絡のオリジナルレベル又は目標レベルを再生するのに適した他の任意の値を決定するようさらに構成されてもよい。

更に、オーディオ信号を符号化する装置が提供される。この装置は、オーディオ信号のオーディオ信号包絡を符号化するための上述した実施形態の１つに従って符号化する装置と、オーディオ信号の更なる信号特性を符号化するための二次的信号特性符号器とを含み、その更なる信号特性は、オーディオ信号包絡とは異なるものである。

更に、再生オーディオ信号包絡を得るために復号化する方法が提供される。その方法は、
−１つ以上の分割点に依存して再生オーディオ信号包絡を生成するステップと、
−再生オーディオ信号包絡を出力するステップと、
を含む。

再生オーディオ信号包絡を生成するステップは、１つ以上の分割点が再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように実行され、予め定義された割当規則が、２つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を前記信号包絡部分に依存して定義する。更に、再生オーディオ信号包絡を生成するステップは、２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように、実行される。

再生オーディオ信号包絡を生成するステップは、１つ以上の分割点が、再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように実行され、予め定義された割当規則が、２つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記信号包絡部分に依存して定義する。所定の包絡部分値が２つ以上の信号包絡部分の各々に対して割り当てられる。更に、再生オーディオ信号包絡を生成するステップは、２つ以上の信号包絡部分の各信号包絡部分について、前記信号包絡部分の信号包絡部分値の絶対値が前記信号包絡部分に割り当てられた所定の包絡部分値の絶対値の９０％よりも大きくなるように、かつ前記信号包絡部分の信号包絡部分値の絶対値が前記信号包絡部分に割り当てられた所定の包絡部分値の絶対値の１１０％よりも小さくなるように、実行される。

更に、オーディオ信号包絡を符号化する方法が提供される。その方法は、
−オーディオ信号包絡を受信するステップと、
−予め定義された割当規則に依存して、少なくとも２つの分割点構成の各々のために、２つ以上のオーディオ信号包絡部分の少なくとも１つのオーディオ信号包絡部分についての信号包絡部分値を決定するステップであって、少なくとも２つの分割点構成の各々は１つ以上の分割点を含み、その２つ以上の分割点構成の各々の１つ以上の分割点はオーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割する、ステップと、
−少なくとも２つの分割点構成の１つの１つ以上の分割点を、オーディオ信号包絡を符号化するための１つ以上の選択された分割点として選択するステップであって、前記１つ以上の分割点を選択するステップは、少なくとも２つの分割点構成の各々の２つ以上のオーディオ信号包絡部分の少なくとも１つのオーディオ信号包絡部分の各々の信号包絡部分値に依存して実行されるステップと、
を含む。

更に、コンピュータ又は信号プロセッサ上で実行されたとき、上述した方法の１つを行うためのコンピュータプログラムが提供される。

１つ以上の符号化値からオーディオ信号包絡を生成する装置が提供される。この装置は、１つ以上の符号化値を受信する入力インターフェースと、１つ以上の符号化値(coding value)に依存してオーディオ信号包絡を生成する包絡生成部と、を含む。包絡生成部は、１つ以上の符号化値に依存して集計関数（aggregation function)を生成するよう構成され、集計関数は複数の集計点（aggregation points)を含み、集計点の各々は引数値（argument values)と集計値（aggregated value)とを含み、集計関数は単調増加し、１つ以上の符号化値の各々は、集計関数の集計点の１つの引数値及び集計値の少なくとも１つを示す。更に、包絡生成部は、オーディオ信号包絡が複数の包絡点(envelope point)を含むようにオーディオ信号包絡を生成するよう構成されており、その場合、包絡点の各々が引数値と包絡値(envelope value)とを含み、包絡点の引数値が集計点の引数値と等しくなるように、オーディオ信号包絡の１つの包絡点が集計関数の集計点の各々に対して割り当てられる。更に、包絡生成部は、オーディオ信号包絡の包絡点の各々の包絡値が集計関数の少なくとも１つの集計点の集計値に依存するように、オーディオ信号包絡を生成するよう構成されている。

一実施形態によれば、包絡生成部は、例えば１つ以上の符号化値の各々について、集計点の１つを前記符号化値に依存して決定することにより、かつ１つ以上の符号化値の各々の集計点に依存して集計関数を得るために補間を適用することにより、集計関数を決定するよう構成されてもよい。

一実施形態において、包絡生成部は、例えば集計関数の複数の集計点において、集計関数の一次導関数（first derivate）を決定するよう構成されてもよい。

一実施形態によれば、包絡生成部は、例えば集計関数が連続的な一次導関数（first derivative）を持つように、符号化値に依存して集計関数を生成するよう構成されてもよい。

一実施形態において、包絡生成部は、例えば次式を適用することでオーディオ信号包絡を決定するよう構成されてもよい。
［数１］

ここで、tilt(k)はｋ番目の符号化値における集計信号包絡の導関数を示し、c(k)は集計関数のｋ番目の集計点の集計値であり、f(k)は集計関数のｋ番目の集計点の引数値である。

一実施形態によれば、入力インターフェースは、１つ以上の分割値を１つ以上の符号化値として受信するよう構成されてもよい。包絡生成部は、１つ以上の分割値に依存して集計関数を生成するよう構成されてもよく、１つ以上の分割値の各々は集計関数の集計点の１つの集計値を示す。更に、包絡生成部は、１つ以上の分割点が、再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように、再生オーディオ信号包絡を生成するよう構成されてもよく、予め定義された割当規則が、前記信号包絡部分に依存して、２つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を定義している。更に、包絡生成部は、２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように、再生オーディオ信号包絡を生成するよう構成されてもよい。

オーディオ信号包絡を符号化するための１つ以上の符号化値を決定する装置が提供される。この装置は、複数の引数値の各々について集計値を決定するための集計部（aggregator)を含み、複数の引数値は、それら複数の引数値の第１引数値とそれら複数の引数値の第２引数値とが異なる場合、前記第１引数値が前記第２引数値に先行又は後続するように順序付けられており、引数値の各々に対してある包絡値が割り当てられ、引数値の各々の包絡値はオーディオ信号包絡に依存し、集計部は、複数の引数値の各引数値のための集計値を、前記引数値の包絡値に依存し、かつ前記引数値に先行する複数の引数値の各々の包絡値に依存して、決定するよう構成されている。さらに、この装置は、複数の引数値の１つ以上の集計値に依存して１つ以上の符号化値を決定する符号化ユニットを含む。

一実施形態に従えば、集計部は、例えば複数の引数値の各引数値についての集計値を、その引数値の包絡値とその引数値に先行する引数値の包絡値とを加算することで、決定するよう構成されてもよい。

一実施形態において、引数値の各々の包絡値は、例えばオーディオ信号包絡を信号包絡として有する、オーディオ信号包絡のエネルギー値を示してもよい。

一実施形態に従えば、引数値の各々の包絡値は、例えばオーディオ信号包絡を信号包絡として有する、オーディオ信号包絡のスペクトル値のｎ乗（n-th power）を示してもよく、ここで、ｎはゼロよりも大きい整数の偶数である。

一実施形態において、引数値の各々の包絡値は、例えば時間ドメインで表現されかつオーディオ信号包絡を信号包絡として有する、オーディオ信号包絡の振幅値のｎ乗を示してもよく、ここで、ｎはゼロよりも大きい整数の偶数である。

一実施形態によれば、符号化ユニットは、例えば、引数値の１つ以上の集計値に依存し、かつ１つ以上の符号化値として何個の値が符号化ユニットによって決定されるべきかを示す符号化値の数（coding values number）に依存して、１つ以上の符号化値を決定するよう構成されてもよい。

一実施形態において、符号化ユニットは、例えば前記１つ以上の符号化値を次式に従って決定してもよく、
［数２］

ここで、c(k)は符号化ユニットによって決定されるべきｋ番目の符号化値を示し、ｊは複数の引数値のｊ番目の引数値を示し、a(j)はそのｊ番目の引数値に割り当てられた集計値を示し、max(a)は引数値のうちの１つに割り当てられた集計値のうちの１つである最大値であり、引数値のうちの１つに割り当てられた集計値はいずれも前記最大値を上回らず、
［数１１］

は、
［数１２］

が最小となる、前記引数値のうちの１つである最小値を示す。

さらに、１つ以上の符号化値からオーディオ信号包絡を生成する方法が提供される。この方法は、
−１つ以上の符号化値を受信するステップと、
−１つ以上の符号化値に依存してオーディオ信号包絡を生成するステップと、
を含む。

オーディオ信号包絡を生成するステップは、１つ以上の符号化値に依存して集計関数を生成することにより実行され、その集計関数は複数の集計点を含み、それら集計点の各々は引数値と集計値とを含み、集計関数は単調に増大するものであり、１つ以上の符号化値の各々は、集計関数の集計点のうちの１つの引数値及び集計値の少なくとも１つを示す。更に、オーディオ信号包絡を生成するステップは、オーディオ信号包絡が複数の包絡点を含むように実行され、包絡点の各々が引数値と包絡値とを含み、前記包絡点の引数値が前記集計点の引数値と等しくなるように、オーディオ信号包絡の１つの包絡点が集計関数の集計点の各々に割り当てられる。更に、オーディオ信号包絡を生成するステップは、オーディオ信号包絡の包絡点の各々の包絡値が集計関数の少なくとも１つの集計点の集計値に依存するように、実行される。

さらに、オーディオ信号包絡を符号化するための１つ以上の符号化値を決定する方法が提供される。この方法は、
−複数の引数値の各々について集計値を決定するステップであって、複数の引数値は、それら複数の引数値の第１引数値とそれら複数の引数値の第２引数値とが異なる場合、前記第１引数値が前記第２引数値に先行又は後続するように、順序付けられており、引数値の各々に対して１つの包絡値が割り当てられ、引数値の各々の包絡値はオーディオ信号包絡に依存しており、集計部は、前記引数値の包絡値に依存し、かつ前記引数値に先行する複数の引数値の各々の包絡値に依存して、複数の引数値の各引数値についての集計値を決定するステップと、
−複数の引数値の１つ以上の集計値に依存して１つ以上の符号化値を決定するステップと、
を含む。

更に、コンピュータ又は信号プロセッサ上で作動されたとき、上述した方法の１つを実行するためのコンピュータプログラムが提供される。

線スペクトル周波数５（ＬＳＦ５）の発見的ではあるがやや不正確な記述は、周波数軸に沿った信号エネルギーの分配を記述している。ＬＳＦ５は、高い確率で、信号が大きなエネルギーを有する周波数において存在するであろう。実施形態は、この発見的な記述を文字通りにとらえ、信号エネルギーの実際の分配を量子化するという知見に基づいている。ＬＳＦ（複数）はこのアイデアを近似的にだけ適用するので、実施形態によれば、ＬＳＦの概念は省略されて、代わりに周波数の分配が量子化され、滑らかな包絡形状がその分配から構築され得るようになる。このような発見的な概念は、以下においては分配量子化と称される。

実施形態は、スピーチ及びオーディオ符号化において使用されるべきスペクトル包絡の量子化及び符号化に基づいている。実施形態は、例えばコア帯域幅及び帯域幅拡張方法の両方の包絡において適用されてもよい。

実施形態にしたがって、スケールファクタバンド（非特許文献３、４）及び線形予測モデル（非特許文献１）のような標準的な包絡モデル化技術を、例えば置き換え及び／又は改善することが可能である。

実施形態の目的は、線形予測の手法とスケールファクタバンド・ベースの手法との両方の利点を組み合わせた量子化を達成し、他方でそれらの欠点を排除することである。

実施形態によれば、滑らかではあるがやや正確なスペクトル包絡を持つ一方で、他方では低量のビットで（任意選択的には固定ビットレートで）符号化することができ、更には合理的な演算量で実現できる、概念が提供される。

以下に、本発明の実施形態を、図面を参照しながらより詳細に説明する。

再生オーディオ信号包絡を得るための一実施形態に係る復号化装置を示す。他の実施形態に係る復号化装置であって、分割点復号器を更に含む装置を示す。オーディオ信号包絡を符号化する、一実施形態に係る装置を示す。オーディオ信号包絡を符号化する他の実施形態に係る装置であって、分割点符号器を更に含む装置を示す。オーディオ信号包絡を符号化する別の実施形態に係る装置であって、エネルギー決定部を更に含む、オーディオ信号包絡の符号化装置を示す。実施形態に係る、一定のエネルギーブロックによって表された３つの信号包絡を示す。実施形態に係る、図６のスペクトルの累積表現を示す。オリジナル表現と累積マスドメイン表現との両方における補間されたスペクトルマス包絡を示す。一実施形態に従って分割点位置を復号化する復号化処理を示す。一実施形態に従って分割点位置の復号化を実行する疑似コードを示す。分割点位置を符号化するための一実施形態にかかる符号化処理を示す。分割点位置の符号化を実行する、本発明の一実施形態にかかる疑似コードを示す。一実施形態に係る分割点復号器を示す。一実施形態に係るオーディオ信号を符号化する装置を示す。一実施形態に係るオーディオ信号を再生する装置を示す。１つ以上の符号化値からオーディオ信号包絡を生成する、一実施形態に係る装置を示す。オーディオ信号包絡を符号化するために１つ以上の符号化値を決定する、一実施形態に係る装置を示す。第１の実施例に係る集計関数を示す。第２の実施例に係る集計関数を示す。

図３は、オーディオ信号包絡を符号化する一実施形態に係る装置を示す。

この装置は、オーディオ信号包絡を受信するオーディオ信号包絡インターフェース２１０を含む。

更に、この装置は、予め定義された割当規則に依存して、少なくとも２つの分割点構成の各々のために、２つ以上のオーディオ信号包絡部分の少なくとも１つのオーディオ信号包絡部分についての信号包絡部分値を決定する、分割点決定部２２０を含む。

少なくとも２つの分割点構成の各々は１つ以上の分割点を含み、その２つ以上の分割点構成の各々の１つ以上の分割点は、オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割する。分割点決定部２２０は、少なくとも２つの分割点構成の１つの１つ以上の分割点を、オーディオ信号包絡を符号化するための１つ以上の選択された分割点として選択するよう構成されており、その分割点決定部２２０は、１つ以上の分割点を、少なくとも２つの分割点構成の各々の２つ以上のオーディオ信号包絡部分の少なくとも１つのオーディオ信号包絡部分の各々の信号包絡部分値に依存して、選択するよう構成されている。

１つの分割点構成は１つ以上の分割点を含み、分割点構成はその分割点によって定義される。例えば、１つのオーディオ信号包絡が２０個のサンプル０，…，１９を含んでもよく、２つの分割点を有する１つの構成が、サンプル３の位置にあるその第１分割点とサンプル８の位置にあるその第２分割点とによって定義されてもよく、例えばその分割点構成が組（３，８）によって示されてもよい。１つの分割点だけが決定されるべきである場合には、単一の分割点がその分割点構成を示すことになる。

適切な１つ以上の分割点が１つ以上の選択された分割点として決定されるべきである。この目的のために、少なくとも２つの分割点構成であって各々が１つ以上の分割点を含むものが考慮される。最適な分割点構成の１つ以上の分割点が選択される。ある分割点構成が他の分割点構成よりも適切かどうかの判断は、決定された信号包絡部分値であってそれ自身が予め定義された割当規則に依存する信号包絡部分値に依存して、決定される。

各分割点構成がＮ個の分割点を有する実施形態において、分割点を有する全ての可能な各分割点構成が考慮されてもよい。しかしながら、幾つかの実施形態においては、全ての可能な分割点構成ではなく、２つの分割点構成だけが考慮され、最適な分割点構成の分割点が１つ以上の選択された分割点として選択される。

ただ１つの分割点だけが決定されるべき実施形態では、各分割点構成は単一の分割点だけを含む。２つの分割点が決定されるべき実施形態では、各分割点構成は２つの分割点を含む。同様に、Ｎ個の分割点が決定されるべき実施形態では、各分割点構成はＮ個の分割点を含む。

単一の分割点を有する分割点構成は、オーディオ信号包絡を２つのオーディオ信号包絡部分へと分割する。２つの分割点を有する分割点構成は、オーディオ信号包絡を３つのオーディオ信号包絡部分へと分割する。Ｎ個の分割点を有する分割点構成は、オーディオ信号包絡をＮ＋１個のオーディオ信号包絡部分へと分割する。

１つの信号包絡部分値をオーディオ信号包絡部分の各々に割り当てる、予め定義された割当規則が存在する。その予め定義された割当規則は、オーディオ信号包絡部分に依存する。

幾つかの実施形態においては、オーディオ信号包絡を分割している１つ以上の分割点から生じるオーディオ信号包絡部分の各々が予め定義された割当規則によって割り当てられた凡そ等しい信号包絡部分値を有するように、分割点が決定される。このように、１つ以上の分割点がオーディオ信号包絡と割当規則とに依存するので、割当規則と分割点とが復号器において既知である場合、オーディオ信号包絡が復号器で推定され得る。これは、例えば図６によって示される。

図６（ａ）において、信号包絡６１０のための単一の分割点が決定される。そのため、この実施例においては、異なる可能な分割点構成が単一の分割点によって定義される。図６（ａ）の実施形態においては、分割点６３１が最良の分割点として見出される。分割点６３１は、オーディオ信号包絡６１０を２つの信号包絡部分へと分割する。矩形ブロック６１１は、分割点６３１によって定義される第１信号包絡部分のエネルギーを表す。矩形ブロック６１２は、分割点６３１によって定義される第２信号包絡部分のエネルギーを表す。図６（ａ）の実施形態において、ブロック６１１と６１２の上縁は信号包絡６１０の推定を表す。そのような推定は、例えば情報としての分割点６３１（例えば唯一の分割点が値ｓ＝１２を有する場合には、分割点ｓは位置１２に配置される）と、どこで信号包絡が開始するかについての情報（ここでは点６３８）と、どこで信号包絡が終了するかについての情報（ここでは点６３９）とを使用しながら、復号器において実行され得る。信号包絡は固定値で開始及び終了してもよく、この情報は固定情報として受信機で使用可能であってもよい。又は、この情報は受信機に対して伝達されてもよい。復号器側において、オーディオ信号包絡を分割している分割点６３１からもたらされる信号包絡部分が、予め定義された割当規則から割り当てられた同じ値を得るように、復号器は信号包絡の推定を再生してもよい。図６（ａ）において、ブロック６１１と６１２の上縁によって定義されている信号包絡の信号包絡部分は、割当規則によって割り当てられた同じ値を持ち、信号包絡６１０の良好な推定を表している。分割点６３１を使用する代わりに、値６２１もまた分割点として使用されてもよい。更に、開始値６３８の代わりに値６２８が開始値として使用されてもよく、また、終了値６３９の代わりに終了値６２９が終了値として使用されてもよい。しかしながら、横座標の値だけでなく縦座標の値をも符号化することは、より多くの符号化資源を要求することになり、必ずしも必要でない。

図６（ｂ）においては、信号包絡６４０のための３個の分割点が決定される。従って、この実施例において、異なる可能な分割点構成が３個の分割点によって定義される。図６（ｂ）の実施形態において、分割点６６１，６６２，６６３が最良の分割点として見出される。分割点６６１，６６２，６６３は、オーディオ信号包絡６４０を４個の信号包絡部分へと分割する。矩形ブロック６４１は、分割点によって定義される第１信号包絡部分のエネルギーを表している。矩形ブロック６４２は、分割点によって定義される第２信号包絡部分のエネルギーを表す。矩形ブロック６４３は、分割点によって定義される第３信号包絡部分のエネルギーを表す。そして、矩形ブロック６４４は、分割点によって定義される第４信号包絡部分のエネルギーを表す。図６（ｂ）の実施例では、ブロック６４１，６４２，６４３，６４４の上縁は信号包絡６４０の推定を表す。そのような推定は、例えば情報としての分割点６６１，６６２，６６３と、どこで信号包絡が開始するかについての情報（ここでは点６６８）と、どこで信号包絡が終了するかについての情報（ここでは点６６９）とを使用しながら、復号器において実行され得る。信号包絡は、固定値で開始及び終了してもよく、この情報は固定情報として受信機において使用可能であってもよい。又は、この情報は受信機に対して伝達されてもよい。復号器側において、オーディオ信号包絡を分割している分割点６６１，６６２，６６３からもたらされる信号包絡部分が、予め定義された割当規則から割り当てられた同じ値を得るように、復号器は信号包絡の推定を再生してもよい。図６（ｂ）では、ブロック６４１，６４２，６４３，６４４の上縁によって定義されている信号包絡の信号包絡部分は、割当規則によって割り当てられた同じ値を持ち、信号包絡６４０の良好な推定を表している。分割点６６１，６６２，６６３を使用する代わりに、値６５１，６５２，６５３もまた分割点として使用され得る。更に、開始値６６８の代わりに値６５８が開始値として使用されてもよく、また、終了値６６９の代わりに終了値６５９が終了値として使用されてもよい。しかしながら、横座標の値だけでなく縦座標の値をも符号化することは、より多くの符号化資源を要求することになり、必ずしも必要でない。

図６（ｃ）においては、信号包絡６７０のための４個の分割点が決定される。従って、この実施例において、異なる可能な分割点構成が４個の分割点によって定義される。図６（ｃ）の実施形態において、分割点６９１，６９２，６９３，６９４は最良の分割点として見出される。分割点６９１，６９２，６９３，６９４は、オーディオ信号包絡６７０を５個の信号包絡部分へと分割する。矩形ブロック６７１は、分割点によって定義される第１信号包絡部分のエネルギーを表している。矩形ブロック６７２は、分割点によって定義される第２信号包絡部分のエネルギーを表す。矩形ブロック６７３は、分割点によって定義される第３信号包絡部分のエネルギーを表す。矩形ブロック６７４は、分割点によって定義される第４信号包絡部分のエネルギーを表す。更に、矩形ブロック６７５は、分割点によって定義される第５信号包絡部分のエネルギーを表す。図６（ｃ）において、ブロック６７１，６７２，６７３，６７４，６７５の上縁は、信号包絡６７０の推定を表す。そのような推定は、情報としての分割点６９１，６９２，６９３，６９４と、どこで信号包絡が開始するかについての情報（ここでは点６９８）と、どこで信号包絡が終了するかについての情報（ここでは点６９９）と、を使用しながら、復号器において実行され得る。信号包絡は、固定値で開始及び終了してもよく、この情報は固定情報として受信機において使用可能であってもよい。又は、この情報は受信機に対して伝達されてもよい。復号器側において、オーディオ信号包絡を分割している分割点６９１，６９２，６９３，６９４からもたらされる信号包絡部分が、予め定義された割当規則から割り当てられた同じ値を得るように、復号器は信号包絡の推定を再生してもよい。図６（ｃ）では、ブロック６７１，６７２，６７３，６７４の上縁によって定義されている信号包絡の信号包絡部分は、割当規則によって割り当てられた同じ値を持ち、信号包絡６７０の良好な推定を表している。分割点６９１，６９２，６９３，６９４を使用する代わりに、値６８１，６８２，６８３，６８４もまた分割点として使用されてもよい。更に、開始値６９８の代わりに値６８８が開始値として使用されてもよく、また、終了値６９９の代わりに終了値６８９が終了値として使用されてもよい。しかしながら、横座標の値だけでなく縦座標の値をも符号化することは、より多くの符号化資源を要求することになり、必ずしも必要でない。

更なる特別な実施形態として、以下の実施例が考慮されてもよい。

スペクトルドメインで表現された信号包絡が符号化される。その信号包絡は、例えばｎ個のスペクトル値を含んでもよい（例えばｎ＝３３）。

様々な信号包絡部分についてここで考察する。例えば、第１信号包絡部分は、最初の１０個のスペクトル値ν_i（ｉ＝０，…，９；但しｉはスペクトル値のインデックスである）を含み、第２信号包絡部分は、最後の２３個のスペクトル値ν_i（ｉ＝１０，…，３２）を含んでもよい。

一実施形態において、予め定義された割当規則は、例えば、スペクトル値ν₀，ν₁，…，ν_S-1を有するスペクトル信号包絡部分ｍの信号包絡部分値ｐ（ｍ）がスペクトル信号包絡部分のエネルギー、例えば
［数３］

である、としてもよい。ここで、「lowerbound」は信号包絡部分ｍの下限値であり、「upperbound」は信号包絡部分ｍの上限値である。

信号包絡部分値決定部１１０は、上記のような式に従う信号包絡部分値をオーディオ信号包絡部分の一つ又は複数に対して割り当ててもよい。

次に、分割点決定部２２０は、予め定義された割当規則に従って１つ以上の信号包絡部分値を決定するよう構成されている。特に、分割点決定部２２０は、２つ以上の信号包絡部分の各々の信号包絡部分値が２つ以上の信号包絡部分の他の信号包絡部分の各々の信号包絡部分値と（凡そ）等しくなるように、割当規則に依存して１つ以上の信号包絡部分値を決定するよう構成されている。

例えば、ある特別な実施形態において、分割点決定部２２０は単一の分割点だけを決定するよう構成されてもよい。そのような実施形態においては、２つの信号包絡部分、例えば信号包絡部分１（ｍ＝１）及び信号包絡部分２（ｍ＝２）が例えば次式に従って分割点ｓによって定義される。
［数４］

ここで、ｎはオーディオ信号包絡のサンプルの個数、例えばオーディオ信号包絡のスペクトル値の個数を示す。上述の実施例において、ｎは例えばｎ＝３３でもよい。

信号包絡部分値決定部１１０は、そのような信号包絡部分値ｐ（１）をオーディオ信号包絡部分１に対して割り当て、そのような信号包絡部分値ｐ（２）をオーディオ信号包絡部分２に対して割り当ててもよい。

幾つかの実施形態においては、両方の信号包絡部分値ｐ（１），ｐ（２）が決定される。しかし、ある実施形態においては、両方の信号包絡部分値の一方だけが考慮される。例えば、全体エネルギーが既知である場合、ｐ（１）が全体エネルギーのほぼ５０％となるように分割点を決定するだけで十分である。

幾つかの実施形態において、ｓ（ｋ）は、可能な値のセット、例えば整数のインデックス値のセット、例えば｛０；１；２；…；３２｝から選択されてもよい。他の実施形態において、ｓ（ｋ）は、可能な値のセット、例えば周波数帯域のセットを示す周波数値のセットから選択されてもよい。

２つ以上の分割点が決定されるべき実施形態では、サンプルエネルギーを分割点ｓの直前まで累積している累積エネルギーを表す式が考慮されてもよい。
［数５］

Ｎ個の分割点が決定されるべき場合には、その分割点ｓ（１），ｓ（２），…，ｓ（Ｎ）は次式を満足するように決定される。
［数６］

ここで、 totalenergy は信号包絡の全体エネルギーである。

一実施形態において、分割点ｓ（ｋ）は、
［数７］

が最小となるように選択されてもよい。

従って、一実施形態によれば、分割点決定部２２０は、次式が最小となるように１つ以上の分割点ｓ（ｋ）を決定するよう構成されてもよく、
［数８］

ここで、totalenergy は全体エネルギーを示し、ｋは１つ以上の分割点のｋ番目の分割点を示し、Ｎは１つ以上の分割点数を示す。

他の実施形態において、分割点決定部２２０が１つの分割点ｓだけを選択するよう構成されている場合には、その分割点決定部２２０は全ての可能な分割点ｓ＝１，…，３２を検査してもよい。

幾つかの実施形態において、分割点決定部２２０は、分割点ｓのための最良の値、例えば次式
［数９］

が最小となる分割点ｓを選択してもよい。

一実施形態によれば、２つ以上の信号包絡部分の各信号包絡部分の信号包絡部分値は、例えば前記信号包絡部分の１つ以上のエネルギー値又は１つ以上のパワー値に依存してもよい。又は、２つ以上の信号包絡部分の各信号包絡部分の信号包絡部分値は、例えば、オーディオ信号包絡のオリジナルレベル又は目標レベルを再生するために適切な他の如何なる値に依存してもよい。

一実施形態によれば、オーディオ信号包絡は、例えばスペクトルドメイン又は時間ドメインで表現されてもよい。

図４は、他の実施形態に係るオーディオ信号包絡を符号化する装置を示し、この装置は、１つ以上の分割点を例えばある符号化規則に従って符号化し、１つ以上の符号化された点を取得する、分割点符号器２２５を更に含む。

分割点符号器２２５は、例えば、１つ以上の分割点の各々の位置を符号化して１つ以上の符号化された点を取得するよう構成されてもよい。分割点符号器２２５は、例えば分割点状態数を符号化することにより、１つ以上の分割点の各々の位置を符号化するよう構成されてもよい。更に、分割点符号器２２５は、例えば、可能な分割点位置の全体数を示す全体位置数と、１つ以上の分割点の数を示す分割点数と、を提供するよう構成されてもよい。分割点状態数と全体位置数と分割点数とは共に、１つ以上の分割点の各々の位置を示す。

図５は、他の実施形態に係る、オーディオ信号包絡を符号化する装置を示し、そのオーディオ信号包絡を符号化する装置は、エネルギー決定部２３０を更に含む。

一実施形態によれば、この装置は、例えば、オーディオ信号包絡の全体エネルギーを決定しかつオーディオ信号包絡のその全体エネルギーを符号化するための、エネルギー決定部（２３０）を更に含んでもよい。

しかし、他の実施形態においては、この装置は、オーディオ信号包絡のオリジナルレベル又は目標レベルを再生するために適切な他の任意の値を決定するよう更に構成されてもよい。全体エネルギーの代わりに、複数の他の値がオーディオ信号包絡のオリジナルレベル又は目標レベルを再生するために適切と言える。例えば、上述したように、包絡のスケーリングは種々の方法で実行されてもよく、また、そのスケーリングは信号エネルギー若しくはスペクトルマス又は類似の値（絶対サイズ）に対応することができ、又は、それはスケーリング若しくはゲインのファクタ（相対サイズ）であり得ることから、包絡のスケーリングは絶対値又は相対値として符号化されることができ、又はそれは、先行値もしくは先行値の組合せに対する差によって符号化されることができる。幾つかの場合、そのスケーリングはまた、他の使用可能なデータとは無関係でもよく、又はそこから推論されてもよい。包絡はそのオリジナルレベル又は目標レベルへと再生されるべきである。

図１４は、オーディオ信号を符号化する装置を示す。この装置は、１つ以上の分割点を生成することにより、オーディオ信号のオーディオ信号包絡を上述した実施形態の１つに従って符号化する装置１４１０と、オーディオ信号の更なる信号特性を符号化するための二次的信号特性符号器１４２０とを含み、その更なる信号特性はオーディオ信号包絡とは異なるものである。当業者であれば、オーディオ信号の信号包絡及びオーディオ信号の更なる信号特性から、オーディオ信号それ自体を再生できることを知っているであろう。一例として、信号包絡は、例えばオーディオ信号のサンプルのエネルギーを示してもよい。更なる信号特性は、一例として、例えば時間ドメインオーディオ信号の各サンプルについて、そのサンプルが正の値又は負の値を持つかを示してもよい。

図１は、一実施形態に係る、再生オーディオ信号包絡を得るための復号化装置を示す。

この装置は、１つ以上の分割点に依存して再生オーディオ信号包絡を生成する信号包絡再生部１１０を含む。

更に、この装置は、再生オーディオ信号包絡を出力するための出力インターフェース１２０を含む。

信号包絡再生部１１０は、１つ以上の分割点が再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように、再生オーディオ信号包絡を生成するよう構成されている。

予め定義された割当規則は、２つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記各信号包絡部分に依存して定義する。

更に、信号包絡再生部１１０は、２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように、再生オーディオ信号包絡を生成するよう構成されている。

信号包絡部分値の絶対値に関し、ｘは、
ｘ≧０のときａ＝ｘ；
ｘ＜０のときａ＝−ｘ；
を意味する。

全ての信号包絡部分値が正の値である場合、上述した式は、２つ以上の信号包絡部分の各々について、その信号包絡部分値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように、再生オーディオ信号包絡が生成されることを意味している。

特別な実施形態において、信号包絡部分の各々の信号包絡部分値は、２つ以上の信号包絡部分の他の信号包絡部分の各々の信号包絡部分値と等しい。

しかしながら、図１のより一般的な実施形態においては、信号包絡部分の信号包絡部分値同士が必ずしも正確に等しい必要はないように、オーディオ信号包絡が再生される。その代わり、ある程度の許容度（いくらかの余裕）が許容されている。

「２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように」という記載は、例えば次のように理解されてもよい。即ち、全ての信号包絡部分値の最大絶対値が、全ての信号包絡部分値の最小絶対値の２倍のサイズを有しない限り、この要件が満たされるという意味である。

例えば、４つの信号包絡部分値｛０．２３；０．２８；０．１９；０．３０｝の組は、上述の要件を満足する。なぜなら、０．３０＜２×０．１９＝０．３８だからである。しかし、他の４つの信号包絡部分値｛０．２４；０．１６；０．３５；０．２５｝の組は、上述の要件を満足しない。なぜなら、０．３５＞２×０．１６＝０．３２だからである。

復号器側において、信号包絡再生部１１０は、再生オーディオ信号包絡を分割する分割点から生じるオーディオ信号包絡部分がほぼ等しい信号包絡部分値を持つように、再生オーディオ信号包絡を再生するよう構成されている。そのため、２つ以上の信号包絡部分の各々の信号包絡部分値は、２つ以上の信号包絡部分の他の信号包絡部分の各々の信号包絡部分値の半分よりも大きい。

そのような実施形態において、信号包絡部分の信号包絡部分値同士はほぼ等しくあるべきであるが、しかし必ずしも厳密に等しい必要はない。

信号包絡部分の信号包絡部分値が全く同一であるべきであると要求することは、復号器に対し、その信号がどのように再生されるべきであるかを指示することになる。信号包絡部分値が厳密に等しくなるように信号包絡部分が再生される場合には、復号器側においてその信号を再生する際の自由度が厳しく制限される。

信号包絡部分値の相互のずれが大きいほど、復号器側における仕様に沿って復号器がオーディオ信号包絡を調整する自由度が増大する。例えば、あるスペクトルオーディオ信号包絡が符号化された場合、ある復号器は低周波数帯域に対して例えばより大きなエネルギーを加えようとする一方で、他の復号器は高周波数帯域に対して例えばより大きなエネルギーを加えようとする可能性もある。ここで、ある程度の許容度を許可することで、例えば量子化及び／又は逆量子化に起因する限定的な量の丸め誤差も、許容可能となり得る。

信号包絡再生部１１０が非常に正確に再生しているような一実施形態において、信号包絡再生部１１０は、２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の９０％よりも大きくなるように、再生オーディオ信号包絡を生成するよう構成されている。

一実施形態において、信号包絡再生部１１０は、例えば、２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の９９％よりも大きくなるように、再生オーディオ信号包絡を生成するよう構成されてもよい。

しかし、他の実施形態において、信号包絡再生部１１０は、例えば、２つ以上の信号包絡部分の各々の信号包絡部分値がそれら２つ以上の信号包絡部分の他の信号包絡部分の各々の信号包絡部分値と等しくなるように、再生オーディオ信号包絡を生成するよう構成されてもよい。

一実施形態において、２つ以上の信号包絡部分の各信号包絡部分の信号包絡部分値は、例えば、その信号包絡部分の１つ以上のエネルギー値、又は１つ以上のパワー値に依存してもよい。

一実施形態によれば、再生オーディオ信号包絡は例えばスペクトルドメイン又は時間ドメインで表現されてもよい。

図２は、更なる実施形態に係る復号化装置を示し、この装置は、ある復号化規則に従って１つ以上の符号化された点を復号化して１つ以上の分割点を取得する、分割点復号器１０５を更に含む。

一実施形態によれば、信号包絡再生部１１０は、例えば、再生オーディオ信号包絡の全体エネルギーを示す全体エネルギー値に依存して、又はオーディオ信号包絡のオリジナルレベル若しくは目標レベルを再生するのに適切な他の如何なる値に依存して、再生オーディオ信号包絡を生成するよう構成されてもよい。

ここで、本発明をより詳細に説明するために、ある特別な実施形態を提供する。

ある特別な実施形態によれば、その概念は、周波数帯域を２つの部分へ、それら半分の両方が等しいエネルギーを持つように分割することである。この考えは図６（ａ）に示され、ここでは、包絡、即ち全体形状が一定のエネルギーブロックによって表されている。

次に、この考えは繰り返し適用可能であり、その結果、前記半分の両方がさらに２つの半分へ、それら２つの半分が等しいエネルギーを有するように分割される。この手法は図６（ｂ）に示される。

より一般的には、スペクトルは、各ブロックがエネルギーの１／Ｎを持つように、Ｎ個のブロックへと分割可能である。図６（ｃ）に、Ｎ＝５の場合の例が示されている。

これらブロック毎に一定のスペクトル包絡を復号器内で再生するために、ブロックの周波数境界と、例えば全体エネルギーとが、例えば伝送されてもよい。その場合、周波数境界は、発見的な意味においてだけであるが、ＬＰＣのＬＳＦ表現に対応する。

これまで信号ｘのエネルギー包絡abs(x)²に関して説明してきた。しかし、他の実施形態においては、振幅包絡(magnitude envelope) abs(x)、スペクトルの他の何らかのパワーabs(x)ⁿ、又は、知覚的に動機付けられた何らかの表現（例えばラウドネスなど）がモデル化される。エネルギーの代わりに、「スペクトルマス」という用語を、それがスペクトルの適切な表現を記述すると仮定した場合、使用することもできる。ただ重要な点は、スペクトル表現の累積和を計算できるという点、即ち、その表現が正の値だけを有する点である。

しかしながら、シーケンスが正でない場合、十分に大きな定数を加算すること、その累積和をとること、又は他の適切な操作によって、それを正のシーケンスへと変換することができる。同様に、複素数値のシーケンスは、以下のように変換することができる。例えば、
（１）２つのシーケンスであって、そのうちの１つは純粋に実数であり、１つは純粋に虚数である。又は
（２）２つのシーケンスであって、そのうちの１番目は振幅を表現し、２番目は位相を表現する。
次に、両方の場合におけるこれら２つのシーケンスは２つの別個の包絡としてモデル化され得る。

モデルはスペクトル包絡モデルに限定する必要もなく、如何なる包絡形状であっても現状のモデルを用いて記述可能である。例えば、時間的ノイズ整形(Temporal Noise Shaping：ＴＮＳ）（非特許文献６）はオーディオコーデックにおける標準的ツールであり、信号の時間的包絡をモデル化する。本発明の方法は包絡をモデル化するので、時間ドメイン信号に対しても同様に良好に適用可能である。

同様に、帯域幅拡張（ＢＷＥ）方法は、高周波のスペクトル形状をモデル化するためにスペクトル包絡を適用するので、本提案の方法はＢＷＥに対しても同様に適用可能である。

図１７は、オーディオ信号包絡を符号化して１つ以上の符号化値を決定するための、一実施形態に係る装置を示す。

この装置は、複数の引数値の各々について集計値を決定するための集計部１７１０を含む。複数の引数値は、それら複数の引数値の第１引数値と第２引数値とが異なる場合、前記第１引数値が前記第２引数値に先行又は後続するように、順序付けられている。

引数値の各々に対してある包絡値が割り当てられ、引数値の各々の包絡値はオーディオ信号包絡に依存し、集計部は、複数の引数値の各引数値のための集計値を、前記引数値の包絡値に依存し、かつ前記引数値に先行する複数の引数値の各々の包絡値に依存して、決定するよう構成されている。

更に、この装置は、複数の引数値の１つ以上の集計値に依存して１つ以上の符号化値を決定する符号化ユニット１７２０を含む。例えば、符号化ユニット１７２０は、上述したように１つ以上の分割点を１つ以上の符号化値として生成してもよい。

図１８は第１の実施例に係る集計関数１８１０を示す。

特に、図１８は、オーディオ信号包絡の１６個の包絡点を示す。例えば、オーディオ信号包絡の４番目の包絡点は参照符号１８２４によって示されており、８番目の包絡点は参照符号１８２８によって示されている。各包絡点は引数値と包絡値とを含む。換言すれば、ｘｙ座標系において、引数値は包絡点のｘ成分として考えることができ、包絡値は包絡点のｙ成分として考えることができる。よって、図１８に見られるように、４番目の包絡点１８２４の引数値は４であり、４番目の包絡点の包絡値は３である。他の例として、８番目の包絡点１８２８の引数値は８であり、８番目の包絡点の包絡値は２である。他の実施形態において、引数値は図１８内のようなインデックス数を示さなくてもよく、代わりに、引数値が例えばスペクトル帯域の中心周波数を示してもよい。例えば、第１引数値が３００Ｈｚであり、第２引数値が５００Ｈｚなどのように、スペクトル包絡が考慮される場合である。又は、例えば他の実施形態において、例えば時間的包絡が考慮される場合には、引数値が時点を示してもよい。

集計関数１８１０は複数の集計点を含む。例えば、４番目の集計点１８１４と８番目の集計点１８１８とについて考察する。各集計点は引数値と集計値とを含む。上述の説明と同様に、ｘｙ座標系において、引数値は集計点のｘ成分として考えることができ、集計値は集計点のｙ成分として考えることができる。図１８において、４番目の集計点１８１４の引数値は４であり、４番目の集計点１８１４の集計値は７である。他の例として、８番目の集計点の引数値は８であり、８番目の集計点の集計値は１３である。

集計関数１８１０の各集計点の集計値は、考慮対象の集計点と同じ引数値を有する包絡点の包絡値に依存し、更に、その引数値に先行する複数の引数値の各々の包絡値に依存する。図１８の実施例の場合、４番目の集計点１８１４に関し、その集計値は４番目の包絡点１８２４の包絡値に依存する。なぜなら、この包絡点はその集計点と同じ引数値を有するからである。４番目の集計点１８１４は更に、包絡点１８２１，１８２２，１８２３の包絡値にも依存する。なぜなら、これらの包絡点１８２１，１８２２，１８２３の引数値は包絡点１８２４の引数値に先行しているからである。

図１８の実施例において、各集計点の集計値は、対応する包絡点の包絡値とその先行する包絡点の包絡値とを合計することによって決定される。つまり、４番目の集計点の集計値は、１＋２＋１＋３＝７となる（なぜなら、１番目の包絡点の包絡値は１であり、２番目の包絡点の包絡値は２であり、３番目の包絡点の包絡値は１であり、４番目の包絡点の包絡値は３であるため）。これと同様に、８番目の集計点の集計値は、１＋２＋１＋３＋１＋２＋１＋２＝１３となる。

集計関数は単調増加している。これは、例えば、集計関数の（先行値を有する）各集計点が、その直前の先行する集計点の集計値以上の集計値を有することを意味する。例えば、集計関数１８１０に関し、例えば４番目の集計点１８１４の集計値は３番目の集計点の集計値以上であり、８番目の集計点１８１８の集計値は７番目の集計点１８１７の集計値以上である、等であり、このことは集計関数の全ての集計点について当てはまる。

図１９は集計関数の他の実施例、即ち集計関数１９１０を示す。図１９の実施例において、各集計点の集計値は、対応する包絡点の包絡値の二乗とその先行する包絡点の包絡値の二乗とを合計することで決定される。そのため、例えば、４番目の集計点１９１４の集計値を取得するために、対応する包絡点１９２４の包絡値の二乗と、その先行する包絡点１９２１，１９２２，１９２３の包絡値の二乗とが合計され、その結果が２²＋１²＋２²＋１²＝１０となる。従って、図１９における４番目の集計点１９１４の集計値は１０である。図１９において、参照符号１９３１，１９３３，１９３５，１９３６は、個々の包絡点の包絡値の二乗をそれぞれ示している。

図１８と図１９から更に分かることは、集計関数が分割点を決定するための効率的な方法を提供するということである。分割点は符号化値のための１つの例である。図１８において、全ての分割点の最大集計値（これは例えば全体エネルギーであってもよい）は２０である。

例えば、１つの分割点だけが決定されるべき場合には、例えば１０（２０の５０％）と同一又は近い集計点の引数値が分割点として選択されてもよい。図１８では、この引数値は６であり、単一の分割点は例えば６になるであろう。

３つの分割点が決定されるべき場合には、例えば５，１０及び１５（２０の２５％，５０％及び７５％）と同一又は近い集計点の引数値がそれぞれ分割点として選択されてもよい。図１８では、これらの引数値は３又は４，６及び１１となるであろう。従って、選択された分割点は、３，６及び１１、又は４，６及び１１となるであろう。他の実施形態において、非整数値が分割点として許可されてもよく、その場合、図１８では、決定された分割点は例えば３．３３，６及び１１となるであろう。

このように、幾つかの実施形態に従えば、集計部は、複数の引数値の各引数値についての集計値を、例えば前記引数値の包絡値と前記引数値に先行する引数値の包絡値とを加算することで、決定するよう構成されてもよい。

一実施形態において、引数値の各々の包絡値は、例えばオーディオ信号包絡を信号包絡として有するオーディオ信号包絡のエネルギー値を示してもよい。

一実施形態によれば、引数値の各々の包絡値は、例えばオーディオ信号包絡を信号包絡として有する、オーディオ信号包絡のスペクトル値のｎ乗を示してもよく、ここで、ｎはゼロより大きい整数の偶数である。

一実施形態において、引数値の各々の包絡値は、例えば時間ドメインで表現されかつオーディオ信号包絡を信号包絡として有する、オーディオ信号包絡の振幅値のｎ乗を示してもよく、ここで、ｎはゼロより大きい整数の偶数である。

一実施形態によれば、符号化ユニットは、例えば、引数値の１つ以上の集計値に依存し、かつ１つ以上の符号化値として何個の値が符号化ユニットによって決定されるべきかを示す符号化値の数に依存して、１つ以上の符号化値を決定するよう構成されてもよい。

一実施形態において、符号化ユニットは、例えば１つ以上の符号化値を次式に従って決定してもよい。
［数１０］

ここで、c(k)は符号化ユニットによって決定されるべきｋ番目の符号化値を示し、ｊは複数の引数値のｊ番目の引数値を示し、a(j)はそのｊ番目の引数値に割り当てられた集計値を示し、max(a)は引数値のうちの１つに割り当てられた集計値のうちの１つである最大値であり、引数値のうちの１つに割り当てられた集計値は、いずれも前記最大値を上回らず、
［数１１］

は、
［数１２］

図１６は、１つ以上の符号化値からオーディオ信号包絡を生成する、一実施形態に係る装置を示す。

この装置は、１つ以上の符号化値を受信する入力インターフェース１６１０と、その１つ以上の符号化値に依存してオーディオ信号包絡を生成する包絡生成部１６２０と、を含む。

包絡生成部１６２０は、１つ以上の符号化値に依存して集計関数を生成するよう構成されており、その集計関数は複数の集計点を含み、それら集計点の各々は引数値と集計値とを含み、集計関数は単調増加する。

１つ以上の符号化値の各々は、集計関数の集計点のうちの１つの引数値及び集計値の少なくとも１つを示す。これは、符号化値の各々が、集計点のうちの１つの引数値を特定するか、集計点のうちの１つの集計値を特定するか、又は、集計関数の集計点のうちの１つの引数値と集計値との両方を特定することを意味する。換言すれば、１つ以上の符号化値の各々は、集計関数の集計点のうちの１つの引数値及び／又は集計値を示す。

更に、包絡生成部１６２０は、オーディオ信号包絡が複数の包絡点を含むように、オーディオ信号包絡を生成するよう構成されており、その場合、包絡点の各々が引数値及び包絡値を含み、集計関数の集計点の各々について、前記包絡点の引数値が前記集計点の引数値と等しくなるように、オーディオ信号包絡の包絡点の１つが前記集計点に割り当てられる。更に、包絡生成部１６２０は、オーディオ信号包絡の包絡点の各々の包絡値が集計関数の少なくとも１つの集計点の集計値に依存するように、オーディオ信号包絡を生成するよう構成されている。

一実施形態によれば、包絡生成部１６２０は、例えば、１つ以上の符号化値の各々について、集計点の１つを前記符号化値に依存して決定することにより、かつ、１つ以上の符号化値の各々の集計点に依存して、集計関数を得るために補間を適用することにより、集計関数を決定するよう構成されてもよい。

一実施形態によれば、入力インターフェース１６１０は、１つ以上の分割値を１つ以上の符号化値として受信するよう構成されてもよい。包絡生成部１６２０は、１つ以上の分割値に依存して集計関数を生成するよう構成されてもよく、１つ以上の分割値の各々は、集計関数の集計点の１つの集計値を示す。更に、包絡生成部１６２０は、１つ以上の分割点が再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように、再生オーディオ信号包絡を生成するよう構成されてもよい。予め定義された割当規則が、前記信号包絡部分に依存して、２つ以上の信号包絡部分の各信号包絡部分のための信号包絡部分値を定義する。更に、包絡生成部１６２０は、２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように、再生オーディオ信号包絡を生成するよう構成されてもよい。

一実施形態によれば、包絡生成部１６２０は、例えば、集計関数の複数の集計点において、集計関数の一次導関数を決定するよう構成されてもよい。

一実施形態によれば、包絡生成部１６２０は、例えば、集計関数が連続的な一次導関数を持つように、符号化値に依存して集計関数を生成するよう構成されてもよい。

他の実施形態によれば、あるＬＰＣモデルが量子化されたスペクトル包絡から導出されてもよい。パワースペクトルabs(x)²の逆フーリエ変換を行うことで、自己相関が得られる。この自己相関から、ＬＰＣモデルが従来方法によって容易に計算され得る。そのようなＬＰＣモデルは、次に、滑らかな包絡を作成するために使用され得る。

幾つかの実施形態によれば、スプライン又は他の補間方法を用いてブロックをモデル化することで、滑らかな包絡を得ることができる。その補間法は、スペクトルマスの累積和をモデル化することにより、最も好都合に実行される。

図７は、図６と同じスペクトルを示すが、それらの累積マスを用いて表されている。線７１０は、オリジナル信号包絡の累積マス線を示す。（ａ）内の点７２１、（ｂ）内の点７５１，７５２，７５３、（ｃ）内の点７８１，７８２，７８３，７８４は、分割点がどこに配置されるべきかを示す。

（ａ）における点７３８，７２１，７２９の間のｙ軸上のステップサイズは一定である。同様に、（ｂ）における点７６８，７５１，７５２，７５３，７５９の間のｙ軸上のステップサイズは一定である。同様に、（ｃ）における点７９８，７８１，７８２，７８３，７８４，７８９の間のｙ軸上のステップサイズも一定である。点７２９と７３９の間の破線は全体値を示す。

（ａ）において、点７２１はｘ軸上の分割点７３１の位置を示す。（ｂ）において、点７５１，７５２，７５３はｘ軸上の分割点７６１，７６２，７６３の位置を示す。同様に、（ｃ）において、点７８１，７８２，７８３，７８４はｘ軸上の分割点７９１，７９２，７９３，７９４の位置をそれぞれ示す。点７２９と７３９の間、点７５９と７６９の間、点７８９と７９９の間の破線は、それぞれ全体値を示す。

分割点７３１；７６１，７６２，７６３; ７９１，７９２，７９３，７９４の位置を示す点７２１；７５１，７５２，７５３; ７８１，７８２，７８３，７８４は、それぞれ常にオリジナル信号包絡の累積マス線上にあること、及び、ｙ軸上のステップサイズは一定であることに留意されたい。

このドメインでは、累積スペクトルマスは従来の如何なる補間アルゴリズムによっても補間され得る。

オリジナルドメインにおける連続的な表現を得るために、累積ドメインは連続的な一次導関数を持つ必要がある。例えば、ｋ番目のブロックについて、スプラインの終点がｋＥ／Ｎと（ｋ＋１）Ｅ／Ｎであり、ここでＥがスペクトルの全体マスであるように、補間はスプラインを使用して実行することができる。更に、終点におけるスプラインの導関数が、オリジナルドメインにおいて連続的な包絡を得るために特定されてもよい。

１つの可能性は、分割点ｋについての導関数（傾き）を次式のように特定することである。
［数１３］

ここで、c(k)は分割点ｋにおける累積エネルギーであり、f(k)は分割点ｋの周波数である。

更に一般的には、点ｋ−１，ｋ，ｋ＋１は、如何なる種類の符号化値でもよい。

一実施形態によれば、包絡生成部１６２０は、第１差分と第２差分との比を決定することで、オーディオ信号包絡を決定するよう構成されてもよい。前記第１差分は、集計関数の（複数の）集計点のうちの第１集計点の第１集計値(c(k+1))と、集計関数の（複数の）集計点のうちの第２集計点の第２集計値(c(k-1)又はc(k))との差である。前記第２差分は、集計関数の（複数の）集計点のうちの第１集計点の第１引数値(f(k+1))と、集計関数の（複数の）集計点のうちの第２集計点の第２引数値(f(k-1)又はf(k))との差である。

ある特別な実施形態において、包絡生成部１６２０は、次式を適用することでオーディオ信号包絡を決定するよう構成されている。
［数１３］

ここで、tilt(k)はｋ番目の符号化値における集計関数の導関数を示し、c(k+1)は前記第１集計値であり、f(k+1)は前記第１引数値であり、c(k-1)は前記第２集計値であり、f(k-1)は前記第２引数値であり、ｋは１つ以上の符号化値のうちの１つのインデックスを示す整数であり、c(k+1)-c(k-1)は２つの集計値c(k+1)及びc(k-1)の第１差分であり、f(k+1)-f(k-1)は２つの引数値f(k+1)及びf(k-1)の第２差分である。

例えば、c(k+1)は前記第１集計値であり、ｋ＋１番目の符号化値に割り当てられている。f(k+1)は前記第１引数値であり、ｋ＋１番目の符号化値に割り当てられている。c(k-1)は前記第２集計値であり、ｋ−１番目の符号化値に割り当てられている。f(k-1)は前記第２引数値であり、ｋ−１番目の符号化値に割り当てられている。

他の実施形態において、包絡生成部１６２０は、次式を適用してオーディオ信号包絡を決定するよう構成されている。
［数１４］

ここで、tilt(k)はｋ番目の符号化値における集計関数の導関数を示し、c(k+1)は前記第１集計値であり、f(k+1)は前記第１引数値であり、c(k)は前記第２集計値であり、f(k)は前記第２引数値であり、c(k-1)は集計関数の（複数の）集計点のうちの第３集計点の第３集計値であり、f(k-1)は集計関数の（複数の）集計点のうちの第３集計点の第３引数値であり、ｋは１つ以上の符号化値のうちの１つのインデックスを示す整数であり、c(k+1)-c(k)は２つの集計値c(k+1)及びc(k)の第１差分であり、f(k+1)-f(k)は２つの引数値f(k+1)及びf(k)の第２差分である。

例えば、c(k+1)は前記第１集計値であり、ｋ＋１番目の符号化値に割り当てられている。f(k+1)は前記第１引数値であり、ｋ＋１番目の符号化値に割り当てられている。c(k)は前記第２集計値であり、ｋ番目の符号化値に割り当てられている。f(k)は前記第２引数値であり、ｋ番目の符号化値に割り当てられている。c(k-1)は前記第３集計値であり、ｋ−１番目の符号化値に割り当てられている。f(k-1)は前記第３引数値であり、ｋ−１番目の符号化値に割り当てられている。

ある集計値がｋ番目の符号化値に割り当てられていると特定することにより、例えば、そのｋ番目の符号化値が前記集計値を示すという意味になり、及び／又は、そのｋ番目の符号化値は、前記集計値が帰属する集計点の引数値を示すという意味になる。

ある引数値がｋ番目の符号化値に割り当てられていると特定することにより、例えば、そのｋ番目の符号化値が前記引数値を示すという意味になり、及び／又は、そのｋ番目の符号化値は、前記引数値が帰属する集計点の集計値を示すという意味になる。

特定の実施形態において、符号化値ｋ−１，ｋ，ｋ＋１は、例えば上述したような分割点である。

例えば、一実施形態において、図１の信号包絡再生部１１０は例えば１つ以上の分割点に依存して集計関数を生成するよう構成されてもよく、集計関数は複数の集計点を含み、それら集計点の各々は引数値と集計値とを含み、集計関数は単調増加し、１つ以上の分割点の各々は集計関数の集計点のうちの１つの引数値及び集計値の少なくとも１つを示す。

そのような実施形態において、信号包絡再生部１１０は、例えばオーディオ信号包絡が複数の包絡点を含むようにオーディオ信号包絡を生成するよう構成されてもよく、その場合、包絡点の各々が引数値と包絡値とを含み、前記包絡点の引数値が前記集計点の引数値と等しくなるように、オーディオ信号包絡の１つの包絡点が集計関数の集計点の各々に対して割り当てられる。

更に、そのような実施形態において、信号包絡再生部１１０は、例えばオーディオ信号包絡の包絡点の各々の包絡値が集計関数の少なくとも１つの集計点の集計値に依存するように、オーディオ信号包絡を生成するよう構成されてもよい。

ある特別な実施形態において、信号包絡再生部１１０は、例えば第１差分と第２差分との比を決定することで、オーディオ信号包絡を決定するよう構成されてもよく、第１差分は、集計関数の（複数の）集計点のうちの第１集計点の第１集計値(c(k+1))と、集計関数の（複数の）集計点のうちの第２集計点の第２集計値(c(k-1)；c(k))との差であり、第２差分は、集計関数の（複数の）集計点のうちの前記第１集計点の第１引数値(f(k+1))と、集計関数の（複数の）集計点のうちの第２集計点の第２引数値(f(k-1)；f(k))との差である。この目的で、信号包絡再生部１１０は、包絡生成部１６２０について説明したような上述の概念の１つを実現するよう構成されてもよい。

c(k)及びf(k)はそれらの定義の範囲外では使用できないため、最左端部と最右端部では上述した傾きについての式を使用できない。その場合、ｋの範囲外のそのようなc(k)及びf(k)は、端部自身における値によって次式のように置き換えられる。
［数１５］

及び
［数１６］

４個の制約（両端部における累積マスと傾き）があるので、対応するスプラインは４次多項式となるよう選択され得る。

図８は、補間されたスペクトルマス包絡の一例を（ａ）オリジナル及び（ｂ）累積のマスドメインで示す。

（ａ）において、オリジナル信号包絡は８１０により示され、補間されたスペクトルマス包絡は８２０により示される。分割点は８３１，８３２，８３３，８３４によりそれぞれ示される。８３８は信号包絡の始点を示し、８３９は信号包絡の終点を示す。

（ｂ）において、８４０は累積されたオリジナル信号包絡を示し、８５０は累積されたスペクトルマス包絡を示す。分割点は８６１，８６２，８６３，８６４によりそれぞれ示される。分割点の位置は、累積されたオリジナル信号包絡８４０上の点８５１，８５２，８５３，８５４によりそれぞれ示される。８６８はオリジナル信号包絡の始点を示し、８６９はオリジナル信号包絡のｘ軸上の終点を示す。８６９と８５９との間の線は、全体値を示す。

実施形態は、ブロックを分離している周波数の符号化のための概念を提供する。周波数はスカラーｆ_kの順序リストを表し、即ちｆ_k＜ｆ_k+1である。Ｋ＋１個のブロックがある場合、Ｋ個の分割点が存在する。

更に、Ｎ個の量子化レベルが存在する場合、

個の可能な量子化が存在する。例えば、３２個の量子化レベルと５個の分割点がある場合、１８ビットで符号化され得る２０１３７６個の可能な量子化が存在する。

ＭＰＥＧＵＳＡＣ（非特許文献５）における過渡ステアリング・デコリレータ（ＴＳＤ）ツールが、０〜Ｎ−１の領域を有するＫ個の位置を符号化する類似の問題を持つことに注目すべきである。従って、同一又は類似の計数技術が現在の問題の周波数を符号化するために使用されてもよい。この符号化アルゴリズムの利点は、一定のビット消費量を有することである。

代替的に、更に正確性を向上させるため、又はビットレートを低減するために、ＬＳＦの量子化に使用されるような従来のベクトル量子化技術が使用されてもよい。そのような手法により、更に多くの量子化レベルを達成することができ、平均歪みに関する量子化が最適化され得る。その場合の欠点は、例えばコードブックが記憶されなければならないことであり、その一方で、ＴＤＳの手法はコンステレーションの代数的な計数を使用する。

以下に、実施例に従うアルゴリズムについて説明する。

最初に、一般的なアプリケーションの場合を考察する。

特に、ＳＢＲ状シナリオにおけるスペクトル包絡を符号化するための提案された分配量子化方法の実際のアプリケーションについて以下に説明する。

幾つかの実施形態によれば、符号器は次のように構成される。
−オリジナルオーディオ信号からＨＦ帯域のスペクトル振幅（spectral magnitude)又はエネルギー値を計算すること、及び／又は、
−スペクトル包絡を等しいブロックマスのＫ＋１個のブロックへと分割するＫ個のサブバンド・インデックスの所定の（又は任意かつ伝送された）個数を計算すること、及び／又は、
−ＴＳＤ（非特許文献５）と同じアルゴリズムを用いてインデックスを符号化すること、及び／又は、
−ＨＦ帯域の全体マスの（例えばハフマンを介する）量子化及び符号化と、全体マス及びインデックスのビットストリームへの書き込み。

幾つかの実施形態によれば、復号器は次のように構成される。
−ビットストリームからの全体マスとインデックスとの読み出し、及び後続の復号化、及び／又は、
−スプライン補間を介する滑らかな累積マス曲線の近似、及び／又は、
−累積マス曲線の一次導関数を行ってスペクトル包絡を再生すること。

幾つかの実施形態は、さらに任意選択の追加処理を含む。

例えば、幾つかの実施形態はワーピング能力を提供する。つまり、可能な量子化レベルの数を減少させることは、分割点の符号化に必要なビットを削減し、さらに演算複雑性を低減する。この効果は、例えば聴覚心理的特性の助けを借りてスペクトル包絡をワーピングすることによって、又は分配量子化を適用する前に符号器内で隣接する周波数帯域を単純に合計することによって、利用可能である。復号器側で分割点インデックス及び全体マスからスペクトル包絡を再生した後で、その包絡は逆特性によって逆ワープされなければならない。

幾つかのさらなる実施形態は、適応型包絡変換を提供する。つまり、前述のように、スペクトル包絡のエネルギー（即ち、信号Ｘのabs(X)²）に対し分配量子化を適用する必要はないが、全ての他の（正で実数の）表現が実現可能である（例えば、abs(X)、sqrt(abs(x))など）。種々の包絡表現の異なる形状適合型特性を利用できるように、適応型変換技術を使用することが合理的である。したがって、分配量子化が適用される前に、現時点の包絡について（固定され、所定のセットの）最適な変換を検出することが前処理段階として実行される。使用された変換は、復号器側で正確な再変換を可能にするため、信号化されかつビットストリームを介して伝送されなければならない。

さらなる実施形態はブロックの適応的な数をサポートするよう構成される。すなわち、提案されたモデルの一層高度な柔軟性を獲得するために、各スペクトル包絡について異なる数のブロックの間で切り替えを可能にすることが有用である。現時点で選択されたブロックの数は、信号化のために必要なビットを最小化するための所定のセットか、又は最高の柔軟性を可能にするために明示的に伝送されたものかのいずれかであり得る。一方で、このことは、全体のビットレートを低減する。なぜなら、安定した包絡形状については、高い適応性が必要ないからである。他方では、より少数のブロックはより大きなブロックマスをもたらし、急峻な傾斜を持つ強い単一のピークのより正確なフィッティングを可能にする。

幾つかの実施形態は、包絡安定化を提供するよう構成されている。例えばスケールファクタ帯域ベースの手法に比べて、本提案の分配量子化モデルの高い柔軟性により、時間的に隣接する包絡間の上下変動は所望でない不安定を招き得る。この効果を相殺するために、信号−適応型包絡安定化技術が前処理段階として適用される。すなわち、僅かな上下変動しか発生しない安定な信号部分については、包絡は時間的に近隣の包絡値を平滑化することで安定化される。例えば過渡や歯音／摩擦音のオンセット／オフセットのような、本質的に強い時間的変化を含む信号部分については、平滑化が適用されないか又はごく弱い平滑化が適用される。

以下では、一実施形態に従って包絡分配量子化と符号化とを実現するアルゴリズムを説明する。

ＳＢＲ状シナリオにおいてスペクトル包絡を符号化するための提案された分配量子化方法の実際の実現を説明する。アルゴリズムの以下の記述は、例えば１つの特定の包絡を処理するために実行され得る、符号器側のステップと復号器側のステップとについて説明する。

以下では、対応する符号器を説明する。

包絡決定及び前処理が、例えば次のように実行され得る。
−スペクトル・エネルギー目標包絡曲線（例えば２０個のサブバンドサンプルによって表現される）とその対応する全体エネルギーとの決定
−値の総数を削減する（例えば上側の８サブバンド値を平均化し、それにより２０から１６へと総数を削減する）ために、サブバンド値をペア毎に平均化することによる包絡ワーピングの適用
−包絡モデル性能と知覚的品質基準との間の良好な一致のための、包絡振幅変換の適用（例えば各サブバンド値についての４次ルート

の抽出）

分配量子化と符号化は、例えば次のように実行されてもよい。
−等しいマスの所定数のブロックへと包絡を分割するサブバンド・インデックスの複数回の決定（例えば、包絡を３、４、６及び８ブロックへ分割するための決定を４回繰り返す）
−分配量子化された包絡の全体の再生（「分析と合成」の手法、以下参照）
−包絡の最も正確な記述をもたらすブロック数の判定と決定（例えば分配量子化された包絡とオリジナルとのクロス相関を比較することによって）
−オリジナルと分配量子化された包絡との比較によるラウドネス修正と、それに応じた全体エネルギーの適応
−ＴＳＤツール（非特許文献５参照）と同様のアルゴリズムを用いた分割インデックスの符号化
−分配量子化に使用されたブロック数の信号化（例えば４個の所定数のブロックを２ビットで信号化）
−全体エネルギーの量子化と符号化（例えばハフマン符号化を用いて）

次に、対応する復号器について説明する。

復号化と逆量子化は、例えば次のように実行されてもよい。
−分配量子化に使用されるべきブロック数の復号化と全体エネルギーの復号化
−ＴＳＤツール（非特許文献５参照）と同様のアルゴリズムを用いた分割インデックスの復号化
−スプライン補間を介する滑らかな累積マス曲線の近似
−一次導関数を介した累積ドメインからのスペクトル包絡の再生（例えば連続したサンプルの差を取ることによって）

後処理は、例えば以下のように実行されてもよい。
−量子化エラーに起因する後続の包絡間の変動を相殺するための包絡安定化の適用（例えば、再生サブバンド値を次式により時間的に平滑化すること、

ここで、過渡信号部分を含むフレームについてはα＝０．１であり、その他の場合にはα＝０．２５である）
−符号器におけるアプリケーションに従う包絡変換の逆転
−符号器におけるアプリケーションに従う包絡ワーピングの逆転

以下では、分割点の効率的な符号化及び復号化について説明する。図４及び図５の分割点符号器２２５は、例えば以下に説明するような効率的符号化を実行するよう構成されてもよい。図２の分割点復号器１０５は、例えば以下に説明するような効率的復号化を実行するよう構成されてもよい。

図２に示す実施形態では、復号化装置はさらに、復号化規則に従って１つ以上の符号化された点を復号化し、１つ以上の分割点とするための分割点復号器を含んでも良い。分割点復号器１０５は、可能な分割点位置の全体の数を示す全体位置数と、分割点の数を示す分割点数と、分割点状態数とを分析するよう構成されている。さらに、分割点復号器１０５は、全体位置数と分割点数と分割点状態数とを使用して、分割点の１つ以上の位置の指示を生成するよう構成されている。特別な実施形態では、分割点復号器１０５は、例えば全体位置数と分割点数と分割点状態数とを使用して、分割点の２つ以上の位置の指示を生成するように構成されてもよい。

図４及び図５によって示された実施形態では、この装置はさらに、１つ以上の分割点の各々の位置を符号化して１つ以上の符号化された位置を得る、分割点符号器２２５を備えている。分割点符号器２２５は、分割点状態数を符号化することによって１つ以上の分割点の各々の位置を符号化するよう構成されている。さらに、分割点符号器２２５は、可能な分割点位置の全体の数を示す全体位置数と、１つ以上の分割点の数を示す分割点数とを提供するよう構成されている。分割点状態数と全体位置数と分割点数とは共に、１つ以上の分割点の各位置を示している。

図１５は一実施形態に従うオーディオ信号を再生するための装置を示す。この装置は、オーディオ信号の再生オーディオ信号包絡を得るために、上述の実施形態の１つに従って、又は以下に説明する実施形態に従って復号化を行う装置１５１０と、オーディオ信号のオーディオ信号包絡及び更なる信号特性に依存してオーディオ信号を生成するための信号生成部１５２０とを含み、前記更なる信号特性とはオーディオ信号包絡とは異なるものである。上述したように、当業者であれば、オーディオ信号の信号包絡及びオーディオ信号の更なる信号特性から、オーディオ信号それ自体を再生できることを知っているであろう。例えば、信号包絡とはオーディオ信号のサンプルのエネルギーを示しても良い。前述の更なる信号特性とは、例えば時間ドメインオーディオ信号の各サンプルについて、そのサンプルが正の値又は負の値を有するかどうかを示しても良い。

幾つかの特別な実施形態は、可能な分割点位置の全体の数を示す全体位置数と、分割点の全体の数を示す分割点数とが、本発明に係る復号化装置の中で利用可能であってもよいという点に基づいている。例えば符号器は、全体位置数及び／又は分割点数を復号化装置に対して伝送してもよい。

これら仮説に基づいて、幾つかの実施形態は以下の概念を実行する：
Ｎを可能な分割点位置の（全体）数とし、かつＰを分割点の（全体）数とする。

符号化装置と復号化装置との双方がＮ及びＰの値を既知であると仮定する。

Ｎ及びＰを認識していることで、可能な分割点位置の

個だけの異なる組合せが存在することが導出され得る。

例えば、可能な分割点位置の位置が０からＮ−１まで番号付けられ、Ｐ＝８である場合、事象を伴う分割点位置の第１の可能な組合せが（０，１，２，３，４，５，６，７）であり、第２の可能な組合せが（０，１，２，３，４，５，６，８）などであり、組合せ（Ｎ−８，Ｎ−７，Ｎ−６，Ｎ−５，Ｎ−４，Ｎ−３，Ｎ−２，Ｎ−１）まで続き、その結果、全体として

個の異なる組合せがある。

更なる知見、即ち分割点状態数が符号化装置によって符号化されてもよく、かつその分割点状態数が復号器へと伝送されるという知見が活用される。

個の可能な組合せの各々がある独特の分割点状態数によって表現されており、どの分割点状態数が分割点位置のどの組合せを表しているかを復号化装置が認識している場合、その復号化装置は、Ｎ，Ｐ及び分割点状態数を使用して、分割点の位置を復号化することができる。Ｎ及びＰの多くの典型的な値について、そのような符号化技術は、他の概念に比べて、事象の分割点位置を符号化するためにより少ないビットを使用する。

換言すれば、分割点位置の符号化の問題は、領域[０...Ｎ−１]上の位置ｐ_kの離散数Ｐを、それらの位置がオーバーラップしないように、即ちｋ≠ｈについてｐ_k≠ｐ_hとなるように、できるだけ少数のビットで符号化することで解決できる。位置の順序付けは問題でないため、結果的に、位置の独特の組合せの数は二項係数

となる。従って、必要となるビットの数は次の通りである。
［数１７］

幾つかの実施形態は、位置ごとの復号化概念を使用する。即ち、ポジション・バイ・ポジション復号化概念である。この概念は、以下のような知見に基づいている：
Ｎは可能な分割点位置の（全体）数であり、Ｐは分割点の数であると仮定する（これは、Ｎが全体位置数ＦＳＮであり、Ｐが分割点数ＥＳＯＮであり得ることを意味する）。第１の可能な分割点位置が考慮対象となる。２つの場合が区別されてもよい。

第１の可能な分割点位置が分割点を含まない位置である場合、残りのＮ−１個の可能な分割点位置に関し、Ｐ個の分割点の

個の異なる可能な組合せだけが存在する。

しかしながら、第１の可能な分割点位置が分割点を含む位置である場合、残りのＮ−１個の可能な分割点位置に関し、残りのＰ−１個の可能な分割点位置の

個の異なる可能な組合せだけが存在する。

この知見に基づいて、実施形態は、更に次のような知見にも基づいている。即ち、分割点が配置されていない第１の可能な分割点位置を有する全ての組合せは、ある閾値以下の分割点状態数によって符号化されるべきであるという知見である。更に、分割点が配置されている第１の可能な分割点位置を有する全ての組合せは、ある閾値より大きい分割点状態数によって符号化されるべきである。ある実施形態において、全ての分割点状態数は正の整数又は０であってもよく、第１の可能な分割点位置に関する適切な閾値は、

であってもよい。

一実施形態において、あるフレームの第１の可能な分割点位置が分割点を含むかどうかは、その分割点状態数がある閾値より大きいか否かを検査することにより決定される。（代替的に、実施形態の符号化／復号化の処理は、分割点状態数が、ある閾値以上であるか否か、ある閾値以下であるか否か、又は、ある閾値よりも小さいか否か、を検査することでも実現し得る）。

第１の可能な分割点位置を分析した後で、復号化は、調整された値を使用して、第２の可能な分割点位置について続行される。つまり、考慮対象となる分割点位置の数（１ずつ減少する）を調整するだけでなく、分割点数もまた１ずつ減少し、分割点状態数は、その分割点状態数が閾値より大きかった場合には、第１の可能な分割点位置に関係している部分をその分割点状態数から削除するように、調整される。復号化処理は、更なる可能な分割点位置について、同様の方法で続行されてもよい。

一実施形態において、領域[０...Ｎ−１]上の位置ｐ_kの離散数Ｐは、それらの位置がオーバーラップしないように、即ちｋ≠ｈについてｐ_k≠ｐ_hとなるように、符号化される。この場合、所与の領域上の位置の独特な各組合せは、状態と称され、その領域内の各位置は、可能な分割点位置（ｐｓｐｐ）と称される。復号化装置の一実施形態によれば、その領域内の第１の可能な分割点位置が考慮対象となる。その可能な分割点位置が分割点を持たない場合、その領域はＮ−１へと減少されることができ、可能な状態数は

へ減少する。逆に、その状態が

よりも大きい場合、第１の可能な分割点位置に分割点が配置されていると結論付けることが可能である。このことから、以下の復号化アルゴリズムが導かれる：

［数１８］

各繰り返しにおける二項係数の計算は、高コストとなるであろう。従って、実施形態によれば、以下の規則を使用して、先行する繰り返しからの値を用いて二項係数を更新してもよい。
［数１９］

これらの式を使用すれば、二項係数の各更新は、１つの乗算と１つの除算だけが必要となるが、一方、明確な評価には、各繰り返しにおいてＰ個の乗算及び除算というコストが掛かるであろう。

この実施形態において、復号器の全体の演算量は、二項係数の初期化のためのＰ個の乗算及び除算と、各繰り返し当り１つの乗算、除算及びif条件文と、各符号化された位置当り１つの乗算、加算及び除算と、である。理論上は、初期化のために必要な除算の数を１へと減少させることが可能であろう、という点に注意されたい。しかし現実には、この手法は、取り扱いが困難な非常に大きい整数をもたらすであろう。それゆえ、復号器の最悪の場合の演算量は、Ｎ＋２Ｐ個の除算及びＮ＋２Ｐ個の乗算と、Ｐ個の加算（ＭＡＣオペレーションが使用された場合には無視できる）と、Ｎ個のif条件文とである。

一実施形態において、符号化装置によって使用される符号化アルゴリズムは、全ての可能な分割点位置にわたって繰り返す必要はなく、位置を割り当てられている可能な分割点位置だけにわたって繰り返すだけよい。従って、次式となる。
［数２０］

符号器の最悪の場合の演算量は、Ｐ・（Ｐ−１）個の乗算及びＰ・（Ｐ−１）個の除算と、Ｐ−１個の加算とである。

図９は、本発明の一実施形態に係る復号化処理を示す。この実施形態では、復号化はポジション・バイ・ポジションのベースで実行される。

ステップ１１０において、値が初期化される。復号化装置は、入力値として受信した分割点状態数を変数ｓ内に記憶する。更に、分割点数により示される分割点の（全体の）数は、変数ｐ内に記憶される。更に、全体位置数により示されるフレーム内に含まれる可能な分割点位置の全体数は、変数Ｎ内に記憶される。

ステップ１２０において、spSepData[t]の値は、全ての可能な分割点位置について０で初期化される。ビットアレイspSepDataは生成されるべき出力データである。それは、各可能な分割点位置ｔについて、その可能な分割点位置が分割点を含む（spSepData[t]＝１）か、又は含まない（spSepData[t]＝０）か、を示す。ステップ１２０において、全ての可能な分割点位置の対応する値が０で初期化される。

ステップ１３０において、変数ｋが値Ｎ−１を用いて初期化される。この実施形態において、Ｎ個の可能な分割点位置は、０，１，２,...,Ｎ−１と番号付けされている。ｋ＝Ｎ−１と設定することは、最高番号を有する可能な分割点位置が最初に考慮されることを意味する。

ステップ１４０において、ｋ≧０か否かが考慮される。ｋ＜０の場合、分割点位置の復号化は完了となり、処理は終了する。その他の場合には、処理はステップ１５０で続行する。

ステップ１５０において、ｐ＞ｋか否かが検査される。ｐがｋよりも大きい場合、これは、残りの全ての可能な分割点位置が分割点を含むことを意味する。その処理はステップ２３０において続行し、そこでは、残りの可能な分割点位置０，１,...,ｋの全てのspSepDataフィールド値が１に設定され、それは、残りの可能な分割点位置の各々がある分割点を含むことを示している。この場合、処理はその後に終了する。しかし、ステップ１５０でｐがｋを超えないことが判明すると、復号化処理はステップ１６０で続行する。

ステップ１６０では、値

が計算される。ｃは閾値として使用される。

ステップ１７０において、分割点状態数ｓの実際の値がｃ以上である否かが検査される。ここで、ｃはステップ１６０において計算された正にその閾値である。

ｓがｃよりも小さい場合、これは考慮対象の可能な分割点位置（分割点ｋを有する）が分割点を含まないことを意味する。この場合、spSepData[k]は既にステップ１２０において、この可能な分割点位置について０に設定されているため、更なる行動を取る必要はない。この処理は次にステップ２２０で続行し、ｋはk:=k-1に設定され、次の可能な分割点位置が考慮される。

しかし、ステップ１７０における検査が、ｓはｃ以上であると示す場合、これは考慮対象の可能な分割点位置ｋが分割点を含むことを意味する。この場合、分割点状態数ｓは更新され、ステップ１８０で値s:=s-cに設定される。更に、ステップ１９０でspSepData[k] は、可能な分割点位置ｋが分割点を含むことを示す１に設定される。更に、ステップ２００においてｐはｐ−１に設定され、いま調査されるべき残りの可能な分割点位置が分割点を有するｐ−１個の可能な分割点位置だけを含むことを示す。

ステップ２１０において、ｐが０と等しいか否かが検査される。ｐが０と等しい場合、残りの可能な分割点位置は分割点を含まず、復号化処理は終了する。

その他の場合には、残りの可能な分割点位置の少なくとも１つがある事象を含み、処理はステップ２２０で続行し、ここで、復号化処理は次の可能な分割点位置（ｋ−１）を用いて続行する。

図９に示す実施形態の復号化処理は、出力値としてアレーspSepDataを生成し、そのアレーは、各可能な分割点位置ｋについて、その可能な分割点位置が分割点を含む（spSepData[k]＝１）か又は含まない（spSepData[k]＝０）かを示している。

図１０は、分割点位置の復号化を実行する一実施形態に係る疑似コードを示す。

図１１は、分割点を符号化する一実施形態に係る符号化処理を示す。この実施形態において、符号化はポジション・バイ・ポジションのベースで実行される。図１１に示す実施形態に係る符号化処理の目的は、分割点状態数を生成することである。

ステップ３１０において、値が初期化される。p_sは０に初期化される。分割点状態数は、連続的に変数p_sを更新することで生成される。符号化処理を終了したとき、p_sは分割点状態数を有しているであろう。ステップ３１０はまた、ｋをk:=分割点の数-1に設定することで、変数ｋを初期化する。

ステップ３２０では変数「pos」がpos:=spPos[k]に設定され、ここで、spPosは分割点を含む可能な分割点位置を保持しているアレーである。

このアレー内の分割点位置は、昇順で記憶される。

ステップ３３０において、ｋ≧posか否かの検査が実行される。この不等式が当てはまる場合、処理は終了する。その他の場合、処理はステップ３４０で続行する。

ステップ３４０では、値

が計算される。

ステップ３５０では変数p_sが更新され、p_s:=p_s+cに設定される。

ステップ３６０では、ｋがk:=k-1に設定される。

次に、ステップ３７０において、ｋ≧０か否かの検査が実行される。この不等式が当てはまる場合、次の可能な分割点位置ｋ−１が考慮される。その他の場合、処理は終了する。

図１２は、本発明の一実施形態に係る、分割点位置の符号化を実行する疑似コードを示す。

図１３は、一実施形態に係る分割点復号器４１０を示す。

可能な分割点位置の全体数を示す全体位置数ＦＳＮと、分割点の（全体）数を示す分割点数ＥＳＯＮと、分割点状態数ＥＳＴＮとが、分割点復号器４１０へと入力される。分割点復号器４１０は、区分器４４０を含む。区分器４４０は、可能な分割点位置の第１セットを含む第１区分と、可能な分割点位置の第２セットを含む第２区分とに、フレームを分割するよう構成されており、分割点を含む可能な分割点位置は、区分の各々について個別に決定される。これにより、分割点の位置は、区分を更に小さな区分へと繰り返し分割することによって決定されてもよい。

この実施形態の分割点復号器４１０の「区分ベースの」復号化は、以下の概念に基づいている。

区分ベースの復号化が基礎とする考えは、全ての可能な分割点位置のセットが２つの区分Ａ及びＢへと分割され、各区分が可能な分割点位置の１セットを含み、区分ＡはＮ_a個の可能な分割点位置を含み、区分ＢはＮ_b個の可能な分割点位置を含み、Ｎ_a＋Ｎ_b＝Ｎである。全ての可能な分割点位置のセットは、２つの区分へと任意に分割することができ、好ましくは、区分Ａと区分Ｂとが、ほぼ同じ全体数の可能な分割点位置を持つ（例えばＮ_a＝Ｎ_b又はＮ_a＝Ｎ_b−１）ように分割され得る。全ての可能な分割点位置のセットを２つの区分へと分割することで、実際の分割点位置を決定する作業もまた２つのサブ作業、即ち、フレーム区分Ａ内での実際の分割点位置の決定と、フレーム区分Ｂ内での実際の分割点位置の決定という２つのサブ作業に分けられる。

この実施形態において、分割点復号器１０５は、可能な分割点位置の全体数と、分割点の全体数と、分割点状態数とを認識していることが再度想定される。両方のサブ作業を解決するために、分割点復号器１０５はまた、各区分の可能な分割点位置の数と、各区分内の分割点数と、各区分の分割点状態数（１区分のそのような分割点状態数をここでは「分割点サブ状態数」と称する）と、を認識していなければならない。

分割点復号器それ自体が全ての可能な分割点のセットを２つの区分へと分割するので、分割点復号器自体は、区分ＡがＮ_a個の可能な分割点位置を含み、区分ＢがＮ_b個の可能な分割点位置を含むことを認識している。両区分の各々についての実際の分割点数を決定することは、以下の知見に基づいている。

全ての可能な分割点位置のセットが２つの区分へと分割されているので、実際の分割点位置の各々は、区分Ａ内又は区分Ｂ内のいずれかに配置されている。更に、Ｐがある区分の分割点の数であり、Ｎがその区分の可能な分割点位置の全体数であり、ｆ（Ｐ，Ｎ）が分割点位置の異なる組合せの数をリターンする関数であると仮定すると、可能な分割点位置の全体セット（区分Ａと区分Ｂとに分割されている）の分割の異なる組合せの数は、以下のようになる。

上述の考察に基づくと、一実施形態によれば、区分Ａが０個の分割点を有しかつ区分ＢがＰ個の分割点を有する第１の構成を持つ全ての組合せは、第１閾値よりも小さい分割点状態数を用いて符号化されるべきである。分割点状態数は、正の整数値又は０として符号化されてもよい。第１の構成を持つ組合せはf(0,N_a)・f(P,N_b)個しかないため、適切な第１閾値はf(0,N_a)・f(P,N_b)であってもよい。

区分Ａが１個の分割点を有しかつ区分ＢがＰ−１個の分割点を有する第２の構成を持つ全ての組合せは、第１閾値以上ではあるが第２閾値以下の分割点状態数を用いて符号化されるべきである。第２の構成を持つ組合せはf(1,N_a)・f(P-1,N_b)個しかないため、適切な第２閾値は、f(0,N_a)・f(P,N_b)＋f(1,N_a)・f(P-1,N_b)であってもよい。他の構成を持つ組合せについての分割点状態数は、同様にして決定される。

一実施形態によれば、復号化が全ての可能な分割点位置のセットを２つの区分Ａ及びＢへと分割することにより実行される。次に、分割点状態数が第１閾値よりも小さいかどうかが検査される。好ましい実施形態において、第１閾値はf(0,N_a)・f(P,N_b)であってもよい。

分割点状態数が第１閾値よりも小さい場合、区分Ａは０個の分割点を含み、区分ＢはＰ個の全ての分割点を含むと結論付けられる。よって、復号化は、両方の区分について、対応する区分の分割点数を表現するそれぞれ決定された数を用いて実行される。更に、区分Ａについて第１の分割点状態数が決定され、かつ区分Ｂについて第２の分割点状態数が決定され、それぞれが新たな分割点状態数として使用される。本明細書の中では、１区分の分割点状態数は、「分割点サブ状態数」として言及される。

しかし、分割点状態数が第１閾値以上である場合、分割点状態数は更新されてもよい。好ましい実施形態において、分割点状態数は、その分割点状態数からある値を減算することにより、好ましくは第１閾値、例えばf(0,N_a)・f(P,N_b)を減算することにより、更新されてもよい。次のステップでは、更新された分割点状態数が第２閾値よりも小さいか否かが検査される。好ましい実施形態において、第２閾値はf(1,N_a)・f(P-1,N_b)であってもよい。分割点状態数が第２閾値よりも小さい場合、区分Ａは１個の分割点を有し、区分ＢがＰ−１個の分割点を有することが導かれ得る。

次に、復号化が、両方の区分について、各区分の分割点のそれぞれ決定された数を用いて実行される。第１分割点サブ状態数が区分Ａの復号化のために使用され、第２分割点サブ状態数が区分Ｂの復号化のために使用される。しかし、分割点状態数が第２閾値以上である場合、分割点状態数は更新されてもよい。好ましい実施形態において、分割点状態数は、その分割点状態数からある値、好ましくはf(1,N_a)・f(P-1,N_b)を減算することにより、更新されてもよい。復号化処理は、この２つの区分に関する分割点の残りの分配可能性について同様に適用される。

一実施形態において、区分Ａについての分割点サブ状態数と区分Ｂについての分割点サブ状態数とが、区分Ａと区分Ｂの復号化のために使用されてもよく、両方の事象サブ状態数は、以下の除算を実行することで決定される。
分割点状態数／ｆ（区分Ｂの分割点数，Ｎ_b）

好ましくは、区分Ａの分割点サブ状態数は、上述の除算の整数部分であり、区分Ｂの分割点サブ状態数は、その除算の余りである。この除算において使用される分割点状態数は、フレームのオリジナル分割点状態数、又は更新された分割点状態数、例えば上述のように１つ以上の閾値を減算することにより更新されたものであってもよい。

上述した区分ベースの復号化の概念を説明するために、全ての可能な分割点位置のセットが２つの分割点を有する場合を考える。更に、f(p,N)が１区分の分割点位置の異なる組合せの数をリターンする関数であり、ｐがあるフレーム区分の分割点数であり、Ｎがその区分の分割点の全体数である場合である。その場合、位置の可能な分配の各々について、以下の可能な組合せの数がもたらされる。

このように、フレームの符号化された分割点状態数がf(0,N_a)・f(2,N_b)よりも小さい場合、分割点の位置は０及び２として分配されなければならない。その他の場合、f(0,N_a)・f(2,N_b)が分割点状態数から減算されて、その結果がf(1,N_a)・f(1,N_b)と比較される。その結果の方が小さい場合、位置は１及び１として分配される。その他の場合、残りの分配は２及び０だけであり、よって位置は２及び０として分配される。

以下に、分割点（ここでは“sp”）の位置を復号化する一実施形態に従って、疑似コードが提供される。この疑似コードにおいて、“sp_a”は区分Ａ内の分割点の（想定された）数であり、“sp_b”は区分Ｂ内の分割点の（想定された）数である。この疑似コードでは、（例えば更新された）分割点状態数は“state”と称される。区分Ａ及びＢの分割点サブ状態数は、合同して“state”変数内に符号化される。一実施形態のジョイント符号化スキームによれば、Ａの分割点サブ状態数（ここでは“state_a”と称される）は、除算state／f(sp_b,N_b)の整数部分であり、Ｂの分割点サブ状態数（ここでは”state_b”と称される）は、その除算の余りである。これにより、両方の区分の長さ（区分の分割点の全体数）と符号化された位置の数（区分内の分割点数）とは、同じ手法によって復号化され得る。

［数２１］

このアルゴリズムの出力は、各符号化された位置（即ち、分割点位置）において１(1)を有し、かつその他の位置（即ち、分割点を含まない可能な分割点位置）においてゼロ(0)を有する、ベクトルである。

以下に、一実施形態に従って、分割点位置を符号化するための疑似コードが提供される。ここでは、上述した疑似コードと同様の意味を持つ同様の可変ネームを使用する。

［数２２］

ここでは、復号化アルゴリズムと同様に、各符号化された位置（即ち、分割点位置）は、ベクトルｘにおける１(1)によって識別され、その他の成分はゼロ(0)（例えば分割点を含まない可能な分割点位置）である。

疑似コード内に定式化された上述の再帰的方法は、標準的な方法を用いて非再帰的な方法で容易に実行し得る。

一実施形態によれば、関数f(p,N)はルックアップテーブルとして実現されてもよい。現在の文脈におけるように、位置がオーバーラップしていない場合、状態数の関数f(p,N)は、オンラインで計算され得る単純な二項関数である。次式に示す。
［数２３］

本発明の一実施形態によれば、符号器と復号器との両方が、ｋの連続的な値について積f(p-k,Na)*f(k,Nb)を計算するfor-loopを有する。効率的な計算のために、これは以下のように書くことができる。
［数２４］

換言すれば、減算／加算の連続項（復号器におけるステップ２ｂと２ｃ、及び符号器におけるステップ４ａ)は、各繰り返しにつき３個の乗算と１個の除算によって計算され得る。

図１に戻ると、代替的な実施形態が、再生オーディオ信号包絡を異なる方法で取得するために図１の復号化装置を構成する。そのような実施形態において、既に上述したように、この装置は、１つ以上の分割点に基づいて再生オーディオ信号包絡を生成する信号包絡再生部１１０と、再生オーディオ信号包絡を出力するための出力インターフェース１２０とを含む。

ここでも、信号包絡再生部１１０は、１つ以上の分割点が再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように、再生オーディオ信号包絡を生成するよう構成されており、予め定義された割当規則が、２つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記信号包絡部分に依存して定義する。

しかし、そのような代替的な実施形態においては、所定の包絡部分値が２つ以上の信号包絡部分の各々に対して割り当てられる。

そのような実施形態において、信号包絡再生部１１０は、２つ以上の信号包絡部分の各信号包絡部分について、前記信号包絡部分の信号包絡部分値の絶対値が前記信号包絡部分に割り当てられた所定の包絡部分値の絶対値の９０％よりも大きくなるように、かつ、前記信号包絡部分の信号包絡部分値の絶対値が前記信号包絡部分に割り当てられた所定の包絡部分値の絶対値の１１０％よりも小さくなるように、再生オーディオ信号包絡を生成するよう構成されている。これにより、所定の包絡部分値からのある種のずれを許容する。

しかし、特定の実施形態において、信号包絡再生部１１０は、２つ以上の信号包絡部分の各々の信号包絡部分値が前記信号包絡部分に割り当てられた所定の包絡部分値と等しくなるように、再生オーディオ信号包絡を生成するよう構成されている。

一例として、オーディオ信号包絡を４個のオーディオ信号包絡部分へと分割する３個の分割点が受け取られてもよい。割当規則は、第１信号包絡部分の所定の包絡部分値が０．１５であり、第２信号包絡部分の所定の包絡部分値が０．２５であり、第３信号包絡部分の所定の包絡部分値が０．２５であり、第４信号包絡部分の所定の包絡部分値が０．３５であると特定してもよい。これら３個の分割点を受け取ると、信号包絡再生部１１０は次に上述した概念に従って信号包絡をしかるべく再生する。

他の実施形態において、オーディオ信号包絡を２個のオーディオ信号包絡部分へと分割する１個の分割点が受け取られてもよい。割当規則は、第１信号包絡部分の所定の包絡部分値がｐであり、第２信号包絡部分の所定の包絡部分値が１−ｐである、と特定してもよい。例えば、ｐ＝０．４であるとき、１−ｐ＝０．６となる。ここでも、分割点を受け取ると、信号包絡再生部１１０は次に上述した概念に従って信号包絡をしかるべく再生する。

所定の包絡部分値を使用するそのような代替的な実施形態は、これまで説明した概念をそれぞれ使用することができる。

一実施形態では、信号包絡部分の少なくとも２つの所定の包絡部分値は互いに異なっている。

他の実施形態では、信号包絡部分の各々の所定の包絡部分値は他の信号包絡部分の各々の所定の包絡部分値と異なっている。

これまで装置の文脈で幾つかの態様を示してきたが、これらの態様は対応する方法の説明をも表しており、そのブロック又は装置が方法ステップ又は方法ステップの特徴に対応することは明らかである。同様に、方法ステップを説明する文脈で示した態様もまた、対応する装置の対応するブロックもしくは項目又は特徴を表している。

本発明の分解された信号は、デジタル記憶媒体に記憶されることができ、又は、インターネットのような無線伝送媒体もしくは有線伝送媒体などの伝送媒体を介して伝送されることもできる。

所定の構成要件にもよるが、本発明の実施形態は、ハードウエア又はソフトウエアにおいて構成可能である。この構成は、その中に格納される電子的に読み取り可能な制御信号を有し、本発明の各方法が実行されるようにプログラム可能なコンピュータシステムと協働する（又は協働可能な）、デジタル記憶媒体、例えばフレキシブルディスク，ＤＶＤ，ＣＤ，ＲＯＭ，ＰＲＯＭ，ＥＰＲＯＭ，ＥＥＰＲＯＭ，フラッシュメモリなどのデジタル記憶媒体を使用して実行することができる。

本発明に従う幾つかの実施形態は、上述した方法の１つを実行するようプログラム可能なコンピュータシステムと協働可能で、電子的に読み取り可能な制御信号を有する非一時的なデータキャリアを含む。

一般的に、本発明の実施例は、プログラムコードを有するコンピュータプログラム製品として構成することができ、そのプログラムコードは当該コンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法の一つを実行するよう作動可能である。そのプログラムコードは例えば機械読み取り可能なキャリアに記憶されていても良い。

本発明の他の実施形態は、上述した方法の１つを実行するための、機械読み取り可能なキャリアに格納されたコンピュータプログラムを含む。

換言すれば、本発明の方法のある実施形態は、そのコンピュータプログラムがコンピュータ上で作動するときに、上述した方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

本発明の他の実施形態は、上述した方法の１つを実行するために記録されたコンピュータプログラムを含む、データキャリア（又はデジタル記憶媒体、又はコンピュータ読み取り可能な媒体）である。

本発明の他の実施形態は、上述した方法の１つを実行するためのコンピュータプログラムを表現するデータストリーム又は信号列である。そのデータストリーム又は信号列は、例えばインターネットを介するデータ通信接続を介して伝送されるよう構成されても良い。

他の実施形態は、上述した方法の１つを実行するように構成又は適応された、例えばコンピュータ又はプログラム可能な論理デバイスのような処理手段を含む。

他の実施形態は、上述した方法の１つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。

幾つかの実施形態においては、（例えば書換え可能ゲートアレイのような）プログラム可能な論理デバイスが、上述した方法の幾つか又は全ての機能を実行するために使用されても良い。幾つかの実施形態では、書換え可能ゲートアレイは、上述した方法の１つを実行するためにマイクロプロセッサと協働しても良い。一般的に、そのような方法は、好適には任意のハードウエア装置によって実行される。

上述した実施形態は、本発明の原理を単に例示的に示したに過ぎない。本明細書に記載した構成及び詳細について修正及び変更が可能であることは、当業者にとって明らかである。従って、本発明は、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではなく、添付した特許請求の範囲によってのみ限定されるべきである。

Claims

再生オーディオ信号包絡を得るために復号化する装置であって、
１つ以上の分割点に依存して前記再生オーディオ信号包絡を生成する信号包絡再生部（１１０）と、
前記再生オーディオ信号包絡を出力する出力インターフェース（１２０）と、を含み、
前記信号包絡再生部（１１０）は、前記１つ以上の分割点が前記再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように、前記再生オーディオ信号包絡を生成するよう構成されており、予め定義された割当規則が、前記２つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記信号包絡部分に依存して定義しており、
前記信号包絡再生部（１１０）は、前記２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
請求項１に記載の装置であって、前記信号包絡再生部（１１０）は、前記２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が前記他の信号包絡部分の各々の信号包絡部分値の絶対値の９０％よりも大きくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
請求項２に記載の装置であって、前記信号包絡再生部（１１０）は、前記２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が前記他の信号包絡部分の各々の信号包絡部分値の絶対値の９９％よりも大きくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
請求項３に記載の装置であって、前記信号包絡再生部（１１０）は、前記２つ以上の信号包絡部分の各々の前記信号包絡部分値が、前記２つ以上の信号包絡部分の他の信号包絡部分の各々の前記信号包絡部分値と等しくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
再生オーディオ信号包絡を得るために復号化する装置であって、
１つ以上の分割点に依存して前記再生オーディオ信号包絡を生成する信号包絡再生部（１１０）と、
前記再生オーディオ信号包絡を出力するための出力インターフェース（１２０）と、を含み、
前記信号包絡再生部（１１０）は、前記１つ以上の分割点が前記再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように、前記再生オーディオ信号包絡を生成するよう構成されており、予め定義された割当規則が、前記２つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記信号包絡部分に依存して定義しており、
前記２つ以上の信号包絡部分の各々に対して所定の包絡部分値が割り当てられており、
前記信号包絡再生部（１１０）は、前記２つ以上の信号包絡部分の各信号包絡部分について、前記信号包絡部分の信号包絡部分値の絶対値が、前記信号包絡部分に割り当てられた前記所定の包絡部分値の絶対値の９０％よりも大きくなるように、かつ前記信号包絡部分の信号包絡部分値の絶対値が、前記信号包絡部分に割り当てられた前記所定の包絡部分値の絶対値の１１０％よりも小さくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
請求項５に記載の装置であって、前記信号包絡再生部（１１０）は、前記２つ以上の信号包絡部分の各々の信号包絡部分値が、前記信号包絡部分に割り当てられた前記所定の包絡部分値と等しくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
請求項５又は６に記載の装置であって、前記信号包絡部分の少なくとも２つの前記所定の包絡部分値は互いに異なる、装置。
請求項５又は６に記載の装置であって、前記信号包絡部分の各々の前記所定の包絡部分値は他の信号包絡部分の各々の前記所定の包絡部分値と異なる、装置。
請求項１乃至８のいずれか一項に記載の装置であって、前記２つ以上の信号包絡部分の各信号包絡部分の前記信号包絡部分値は、前記信号包絡部分の１つ以上のエネルギー値若しくは１つ以上のパワー値に依存するか、又は、前記オーディオ信号包絡のオリジナルレベル若しくは目標レベルを再生するために適切な他の任意の値に依存する、装置。
請求項１乃至９のいずれか一項に記載の装置であって、
前記信号包絡再生部（１１０）は、前記１つ以上の分割点に依存して集計関数を生成するよう構成され、前記集計関数は複数の集計点を含み、前記集計点の各々は引数値と集計値とを含み、前記集計関数は単調増加し、前記１つ以上の分割点の各々は、前記集計関数の集計点のうちの１つの前記引数値及び集計値の少なくとも１つを示すものであり、
前記信号包絡再生部（１１０）は、前記オーディオ信号包絡が複数の包絡点を含むように、前記オーディオ信号包絡を生成するよう構成され、前記包絡点の各々が引数値と包絡値とを含み、前記集計関数の集計点の各々について、前記包絡点の引数値が前記集計点の引数値と等しくなるように、前記オーディオ信号包絡の包絡点の１つが前記集計点に対して割り当てられており、
前記信号包絡再生部（１１０）は、前記オーディオ信号包絡の包絡点の各々の包絡値が、前記集計関数の少なくとも１つの集計点の集計値に依存するように、前記オーディオ信号包絡を生成するよう構成されている、装置。
請求項１０に記載の装置であって、前記信号包絡再生部（１１０）は、第１差分と第２差分との比を決定することにより前記オーディオ信号包絡を決定するよう構成されており、前記第１差分は、前記集計関数の集計点のうちの第１集計点の第１集計値(c(k+1))と前記集計関数の集計点のうちの第２集計点の第２集計値(c(k-1)；c(k))との差であり、前記第２差分は、前記集計関数の集計点のうちの前記第１集計点の第１引数値(f(k+1))と前記集計関数の集計点のうちの第２集計点の第２引数値(f(k-1)；f(k))との差である、装置。
請求項１１に記載の装置であって、前記信号包絡再生部（１１０）は、次式を適用することで前記オーディオ信号包絡を決定するよう構成されており、
［数１３］

ここで、tilt(k)はｋ番目の分割点における前記集計関数の導関数を示し、
c(k+1)は前記第１集計値であり、
f(k+1)は前記第１引数値であり、
c(k-1)は前記第２集計値であり、
f(k-1)は前記第２引数値であり、
ｋは前記１つ以上の分割点のうちの１つのインデックスを示す整数であり、
c(k+1)-c(k-1)は前記２つの集計値c(k+1)及びc(k-1)の第１差分であり、
f(k+1)-f(k-1)は前記２つの引数値f(k+1)及びf(k-1)の第２差分である、装置。
請求項１１に記載の装置であって、前記信号包絡再生部（１１０）は、次式を適用して前記オーディオ信号包絡を決定するよう構成されており、
［数１４］

ここで、tilt(k)はｋ番目の分割点における前記集計関数の導関数を示し、
c(k+1)は前記第１集計値であり、
f(k+1)は前記第１引数値であり、
c(k)は前記第２集計値であり、
f(k)は前記第２引数値であり、
c(k-1)は前記集計関数の集計点のうちの第３集計点の第３集計値であり、
f(k-1)は前記集計関数の集計点のうちの第３集計点の第３引数値であり、
ｋは前記１つ以上の分割点のうちの１つのインデックスを示す整数であり、
c(k+1)-c(k)は前記２つの集計値c(k+1)及びc(k)の第１差分であり、
f(k+1)-f(k)は前記２つの引数値f(k+1)及びf(k)の第２差分である、装置。
請求項１乃至１３のいずれか一項に記載の装置であって、前記装置は、ある復号化規則に従って１つ以上の符号化された点を復号化して前記１つ以上の分割点の各々の位置を取得する、分割点復号器（１０５）を更に含み、
前記分割点復号器（１０５）は、可能な分割点位置の全体数を示す全体位置数と、前記１つ以上の分割点の数を示す分割点数と、分割点状態数と、を分析するよう構成されており、
前記分割点復号器（１０５）は、前記全体位置数と前記分割点数と前記分割点状態数とを使用して、前記１つ以上の分割点の各々の位置の指示を生成するよう構成されている、装置。
請求項１乃至１４のいずれか一項に記載の装置であって、前記信号包絡再生部（１１０）は、前記再生オーディオ信号包絡の全体エネルギーを示す全体エネルギー値に依存して、又は前記オーディオ信号包絡のオリジナルレベル若しくは目標レベルを再生するのに適切な他の任意の値に依存して、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
オーディオ信号を再生する装置であって、
前記オーディオ信号の再生オーディオ信号包絡を得るための請求項１乃至１５のうちの一項に記載の復号化する装置（１５１０）と、
前記オーディオ信号のオーディオ信号包絡に依存し、かつ前記オーディオ信号の更なる信号特性に依存して、前記オーディオ信号を生成する信号生成部（１５２０）であって、前記更なる信号特性は前記オーディオ信号包絡とは異なる、信号生成部（１５２０）と、
を含む装置。
オーディオ信号包絡を符号化する装置であって、
前記オーディオ信号包絡を受信するオーディオ信号包絡インターフェース（２１０）と、
予め定義された割当規則に依存して、少なくとも２つの分割点構成の各々のために、２つ以上のオーディオ信号包絡部分の少なくとも１つのオーディオ信号包絡部分についての信号包絡部分値を決定する、分割点決定部（２２０）と、を含み、
前記少なくとも２つの分割点構成の各々は１つ以上の分割点を含み、前記２つ以上の分割点構成の各々の１つ以上の分割点は、前記オーディオ信号包絡を前記２つ以上のオーディオ信号包絡部分へと分割するものであり、
前記分割点決定部（２２０）は、前記少なくとも２つの分割点構成の１つの前記１つ以上の分割点を、前記オーディオ信号包絡を符号化するための１つ以上の選択された分割点として選択するよう構成されており、前記分割点決定部（２２０）は、前記１つ以上の分割点を、前記少なくとも２つの分割点構成の各々の前記２つ以上のオーディオ信号包絡部分の前記少なくとも１つのオーディオ信号包絡部分の各々の前記信号包絡部分値に依存して、選択するよう構成されている、装置。
請求項１７に記載の装置であって、前記２つ以上の信号包絡部分の各信号包絡部分の前記信号包絡部分値は、前記信号包絡部分の１つ以上のエネルギー値又は１つ以上のパワー値に依存するか、又は、前記オーディオ信号包絡のオリジナルレベル若しくは目標レベルを再生するために適切な他の任意の値に依存する、装置。
請求項１７又は１８に記載の装置であって、
前記装置は、前記１つ以上の分割点の各々の位置を符号化して１つ以上の符号化された点を取得する、分割点符号器（２２５）を更に含み、
前記分割点符号器（２２５）は、分割点状態数を符号化することにより、前記１つ以上の分割点の各々の位置を符号化するよう構成されており、
前記分割点符号器（２２５）は、可能な分割点位置の全体数を示す全体位置数と、前記１つ以上の分割点の数を示す分割点数とを提供するよう構成されており、
前記分割点状態数と前記全体位置数と前記分割点数とは共に、前記１つ以上の分割点の各々の位置を示す、装置。
請求項１７乃至１９のいずれか一項に記載の装置であって、
前記オーディオ信号包絡の全体エネルギーを決定し、かつ前記オーディオ信号包絡の前記全体エネルギーを符号化するためのエネルギー決定部（２３０）を更に含むか、又は、
前記オーディオ信号包絡のオリジナルレベル若しくは目標レベルを再生するために適切な任意の他の値を決定するよう更に構成されている、装置。
オーディオ信号を符号化する装置であって、
前記オーディオ信号のオーディオ信号包絡を符号化するための、請求項１７乃至２０のいずれか一項に記載の符号化する装置（１４１０）と、
前記オーディオ信号の更なる信号特性を符号化するための二次的信号特性符号器（１４２０）であって、前記更なる信号特性は前記オーディオ信号包絡とは異なる、信号特性符号器（１４２０）と、
を含む装置。
再生オーディオ信号包絡を得るために復号化する方法であって、
１つ以上の分割点に依存して前記再生オーディオ信号包絡を生成するステップと、
前記再生オーディオ信号包絡を出力するステップと、を含み、
前記再生オーディオ信号包絡を生成するステップは、前記１つ以上の分割点が前記再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように実行され、予め定義された割当規則が、前記２つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記信号包絡部分に依存して定義しており、
前記再生オーディオ信号包絡を生成するステップは、前記２つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように実行される、方法。
再生オーディオ信号包絡を得るために復号化する方法であって、
１つ以上の分割点に依存して前記再生オーディオ信号包絡を生成するステップと、
前記再生オーディオ信号包絡を出力するステップと、を含み、
前記再生オーディオ信号包絡を生成するステップは、前記１つ以上の分割点が前記再生オーディオ信号包絡を２つ以上のオーディオ信号包絡部分へと分割するように実行され、予め定義された割当規則が、前記２つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記信号包絡部分に依存して定義しており、
前記２つ以上の信号包絡部分の各々に対して所定の包絡部分値が割り当てられており、
前記再生オーディオ信号包絡を生成するステップは、前記２つ以上の信号包絡部分の各信号包絡部分について、前記信号包絡部分の信号包絡部分値の絶対値が前記信号包絡部分に割り当てられた前記所定の包絡部分値の絶対値の９０％よりも大きくなるように、かつ前記信号包絡部分の信号包絡部分値の絶対値が前記信号包絡部分に割り当てられた前記所定の包絡部分値の絶対値の１１０％よりも小さくなるように、実行される、方法。
オーディオ信号包絡を符号化する方法であって、
前記オーディオ信号包絡を受信するステップと、
予め定義された割当規則に依存して、少なくとも２つの分割点構成の各々のために、２つ以上のオーディオ信号包絡部分の少なくとも１つのオーディオ信号包絡部分についての信号包絡部分値を決定するステップであって、前記少なくとも２つの分割点構成の各々は１つ以上の分割点を含み、前記２つ以上の分割点構成の各々の前記１つ以上の分割点は、前記オーディオ信号包絡を前記２つ以上のオーディオ信号包絡部分へと分割するものである、ステップと、
前記少なくとも２つの分割点構成の１つの前記１つ以上の分割点を、前記オーディオ信号包絡を符号化するための１つ以上の選択された分割点として選択するステップであって、前記１つ以上の分割点を選択するステップは、前記少なくとも２つの分割点構成の各々の前記２つ以上のオーディオ信号包絡部分の前記少なくとも１つのオーディオ信号包絡部分の各々の前記信号包絡部分値に依存して実行される、ステップと、
を含む方法。
コンピュータ又は信号プロセッサ上で作動されたとき、請求項２２乃至２４のいずれか一項に記載の方法を実行するためのコンピュータプログラム。