JP3792250B2

JP3792250B2 - 多チャンネルのデジタル信号を送信及び／又は記憶する方法

Info

Publication number: JP3792250B2
Application number: JP51056794A
Authority: JP
Inventors: エルンストゥエーベルライン; ユルゲンヘッレ; ベアンハートゥグリル; カール−ハインツブランデンブルグ; ディーテルサイツェル
Original assignee: フラウンホッファー−ゲゼルシャフトツァフェルダールングデァアンゲヴァンテンフォアシュンクエー．ファオ
Priority date: 1992-11-02
Filing date: 1993-11-02
Publication date: 2006-07-05
Anticipated expiration: 2021-07-05
Also published as: US5706309A; JPH08505739A; NO309629B1; AU678407B2; RU2129336C1; EP0667063B1; WO1994010758A1; EP0667063A1; DE4236989A1; EP0667063B2; CA2148447A1; KR950704862A; DE59304003D1; NO951549L; KR100311604B1; NO951549D0; ATE143544T1; AU5333294A; CA2148447C; DE4236989C2

Description

技術分野
本発明は、請求の範囲第１項の前提部による多チャンネルのデジタル信号を送信及び／又は記憶する方法に関する。
背景技術
デジタル信号、特にオーディオ信号が、周波数コード化されて送信される方法は、例えば、ＰＣＴ公報ＷＯ８８／０１８１１及びＷＯ８９／０８３５７から公知である。
１チャンネル及び２チャンネル送信の場合、標準化委員会である国際標準化機構（ＩＳＯ）の動画エキスパートグループ（ＭＰＥＧ）は、オーディオ信号のコード化及び送信されるビットストリームのための規格ISO 11172-3を設定した。
該符号化法においては、最小の品質ロスで人間の聴覚の性質を利用しながら、送信されるべきデータの量を低減可能にする心理音響モデルが用いられている。
本明細書中でより一層明らかにされない全ての用語の説明については、前記公報及び前記規格が明示的に参照される。
更なるに国際規格の開発においては、中でも、多チャンネル送信におけるデータの低減の作業が目下行われている。科学出版物"MUSICAM-Surround: A Universal Multi-Channel Coding System Compatible with ISO 11172-3", 93rd AES convention, 1992, San Franciscoによると、５チャンネルまでの送信法が提案されている。例えば、２つのステレオチャンネルと１つの中心チャンネル及び２つの側部チャンネル（３／２ステレオ）、あるいは２つのステレオチャンネル及び３つのコメンタリチャンネルが送信可能である。
さらに、空間的知覚に関しては、重要でないステレオ信号の各部がただ１チャンネルだけで送信されると云う点で、更なるデータ整理が達成されている。さらに、モノチャンネルから対応するラウドスピーカに伝達される信号の強度の尺度を表す尺度係数が送信される。この方法により、より低いオーディオ享受を伴う人工物（artefacts）が特に低周波数範囲で生成される。
さらに、符号化のための各チャンネル用のいわゆるチャンネル内マスキング閾値を決定するのではなく、チャンネル内マスキング効果を考慮に入れながら、むしろ全てのチャンネル用の共通の閾値を与えることにより、送信されるデータ量を低減することが提案されている。しかし、共通のマスキング閾値を用いると、ラウドスピーカの近くで、干渉性符号化ノイズが知覚されうると云う結果を招く。
言語信号の周波数スペクトルの部分に対応する幾つかの数値を発生させ、次いでそれらを符号化する言語信号符号化装置は、EP 0 176 243 A2から公知である。符号化された値は、次に、そのエネルギーの等価物に応じてビットコンバータにより変換され、発生されられたビットに変換された値の数は、一定のままであるが、変化するビット割り当てを有する値の選択は、可変である。
発明の開示
本発明の目的は、送信されるべきデータ量をさらに低減し、送信される信号の主観的に感知されうる外乱を招かないことを可能にする、多チャンネルのデジタル信号を送信及び／又は記憶する方法を提供することである。
本発明によれば、異なるチャンネルの信号は、まずスペクトル値に変換される。次に、異なるチャンネルの対応するセグメントのスペクトル値を用いて、どのチャンネルにおいて、類似のスペクトル部分が発生するかが決定される。
異なるチャンネルからのセグメントを結合する場合に、接続コーディングにより生じる干渉は、可聴閾値以下であるか人工物（artefacts）が発生するかが調べられる。もし、人工物（artefacts）が予期されないのならば、結合が許可される。このようにして、Ｋ個の入力チャンネルは、スペクトルデータチャンネル（送信スペクトルチャンネル）上にセグメントでイメージングされる。
“スペクトルデータチャンネル”という用語は、符号化されたオーディオ信号を時間領域の信号スペクトルの全領域又は部分に変換して戻すために必要とされる各補助信号を含む全てのスペクトル符号化オーディオデータと解されるべきである。
元の入力チャンネルが異なっていれば異なっているほど、一層異なったスペクトルデータチャンネルが、信号情報を送信するために使用されなければならない。もし、極端な場合、あるセグメントにおける全てのチャンネルが実質上同じであれば、単一のスペクトルデータチャンネルで十分であるかも知れない、特にスペクトルの上側の部分に付いては。スペクトルセグメントの振幅は、各尺度係数により制御することが可能である。
必要なスペクトルデータチャンネルのＮＴＳＣの数（送信スペクトルチャンネル数）は、可変であり、入力即ち出力チャンネルより少ないか多くて同数Ｋであってよい。
復号器内でＮＴＳＣスペクトルデータチャンネルからのＫ個の出力チャンネルの結合を制御することができるためには、情報データ（SEGMENT_DATA）のリストが（低減された）信号データに加えて送信される。このリストは、出力チャンネルのスペクトル値が、スペクトルデータチャンネルの側からどのようにして結合されるかを記述するものである。
本発明の有利な態様及び更なる展開は、従属項に記載されている。
出力チャンネルのセグメントを再構成するのに必要な制御コマンドは、結合されて情報ブロック（SEGMENT_INFO）になる。このブロックには、セグメントの長さ（SEG_LENGTH）、スペクトルデータチャンネルの選択（TSC_SELECT）、そして尺度係数（scf）のためのフィールドが含まれている。特殊なスペクトルデータチャンネル（TSC_NUM）の符号化されたスペクトルデータ（TSC_DATA）は、再構成マトリックスを決定する各尺度係数（sfc）を用いて、復号器中で復号される。
出力信号のセグメントを再構成する情報は、並べられてリスト（SEGMENT_LIST）を構成する。
個別の出力チャンネルのセグメントのリストは、全体リスト（SEGMENT_DATA）を構成する。かくして、左チャンネル（LEFT_CHANNEL）、右チャンネル（RIGHT_CHANNEL）、中心チャンネル（CENTER_CHANNEL）及び更なるチャンネルのリストが全体リストに列挙される。
本発明の有利な態様によれば、各チャンネルは、マルチチャンネル音を形成する。例えば、３／２立体音の５チャンネルが送信される。２つのステレオチャンネルに加えて、中心チャンネル、左サイドチャンネル（LS_CHANNEL）及び右サイドチャンネル（RS_CHANNEL）が送信される。送信されるチャンネルは、逆変換ににより、３／２立体音の５つの対応するラウドスピーカにあわせて、時間領域へ変換される。
従来の２つのステレオチャンネルに加えて、幾つかのさらなるコメンタリチャンネル（commentary channels）が送信される。これらのチャンネルにおいては、例えば、ＨＤＴＶ（高品位テレビ）において、オーディオ信号は異なる言語で送信可能である。視聴者は、その場合のテレビ映像用に所望の言語を選ぶことができる。言語は、該２つのステレオチャンネルにダイナミックに付加される。
スペクトルデータチャンネルの送信は、規格ＩＳＯ１１１７２−３と互換の方法により行われる。この規格の３つの層の全ては、スペクトルデータチャンネルの送信の基礎を形成することができる。
符号化中、共通の尺度係数により調整されたスペクトル値のグループは、かくして尺度係数帯域に属し、もしこの尺度係数帯域がどの情報ブロック（SEGMENT_INFO）でも必要とされなければ、送信されない。この場合、各スペクトル値は、出力チャンネルを再構成するのに必要とされない。もし、ＩＳＯ規格の固定された縮尺帯部分が利用されれば有利である。
未使用の尺度係数帯域の信号化は、暗黙に行われており、それによると、この信号化に合わせてさらに送信すべき情報はないと云うことを意味する。
送信されるべきチャンネルの線形の結合も、本発明の方法により形成可能である。これにより、スペクトル値が各個別のチャンネルにおいて互いに強く類似していればデータ量の更なる低減をもたらされる。出力チャンネルの信号は、この場合、再構成されたスペクトル値の線形の結合により形成される。
全てのチャンネルから符号化されたデータを送信するのに必要なビット速度は、３８４kbit/sを超過することはない。このようにして、ＩＳＯ規格の層＝の最大ビット速度に対する要求が満たされる。
本発明の必須の利点は、送信されるデータ量の明確の低減が、音質における可聴の損失なしに、少数の仮想スペクトルチャンネル上での入力チャンネルのイメージングにより達成される。このようにして、特に高い空間的解像度で、オーディオ信号が送信される。このことは、多くの聴衆が入った大きな室内において特に有利である。
さらに、各個別のユーザにとって、所望の情報を選択できる幾つかのチャンネルが利用可能になる。例えば、テレビの番組用に、同時に数カ国語でオーディオチャンネルを送信でき、視聴者は、所望のものを選択することができる。
上記方法を実現する技術的により複雑な方法ステップは、送信されるビットストリームを提供する符号器において行われる。復号器は、到着するビットストリームの情報を単に順次処理するのみであり、符号器よりもかなり単純な構成になっている。したがって、本発明は、数個の符号器においてはより高度の複雑さを必要とするが、ユーザ用により多数必要とされる復号器は、複雑さが増大することはまずない。
発明を実施する最良の形態
本発明は、下記において、好適な態様を用いて一層明らかにされる。
好適な態様は、国際標準化機構の動画エキスパートグループ（ＭＰＥＧ）の規格ISO 11172-3に基づいている。この規格を、以後ＭＰＥＧ−１と呼ぶ。その概念は、全体の発明性を有する観念を限定する意図なく、規格の層＝に限定するものである。規格ＭＰＥＧ−１／層＝におけるように、プログラム言語Ｃと類似の数学的演算がが用いられる。
フィルタバンクの助けにより、時間領域からの５個の入力チャンネルの信号が、周波数領域においてサブ帯域（Ｓｂ）でイメージングされ、入力信号は、より少なくサンプル化されたスペクトル値に分解される。
心理音響学において公知の規則性を利用して、可聴閾値以上にある人工物（artefacts）を生じることなく、異なるチャンネルのどのセグメントを結合することができるかに付いて演算がなされる。
入力チャンネルの周波数値は、個別に又はリニアな結合として量子化され、符号化される。これは、量子化から来るエラーが可聴閾値以下にあるという条件で発生する。
次に、送信されるビットストリームを結合させる。それには、スペクトルデータチャンネルの量子化され、符号化された周波数値ならびに補助情報が含まれている。これらは、尺度係数、ビット割り当て、テーブルの情報、及び現在のブロックで用いられている他のパラメータからなり、リストは、スペクトルデータチャンネルの復号化された周波数値がどのようにして他の出力チャンネルを再構成するために結合されるかを示している。
これらのリストは、補助情報として、ＭＰＥＧ１により、ビットストリームに添付される。
この延長（MPEG2_extension_data）は、下記のように表示される。

信号化バイト（signalling_byte）という用語は、幾つのそしてどの入力即ち出力チャンネルが用いられるかを示す。それは、モノチャンネル、ステレオチャンネル、中心チャンネル、又は補助チャンネル、などが送信されるかどうかを示す。
NTSCは、必要とされるスペクトルデータチャンネルの数を示す。
SEGMENT_DATAは、出力チャンネルの再構成用のリストを記述し、個別のチャンネル（SEGMENT_LIST）の再構成用のリストを含む。

機能used_sb_mapは、共通の尺度係数により調整されたスペクトルデータチャンネルのスペクトル値を含む尺度係数帯域が使用されているかどうかを示す。もし、その様な尺度係数帯域がどの情報ブロック（SEGMENT_INFO）によっても使用されていなければ、対応するスペクトル値は送信されない。
特殊なチャンネル（SEGMENT_LIST）の再構成用のリストには、セグメント長さ（SEG_LENGTH）、尺度係数のサイズ（scalefac_size）、尺度係数（scf）及びスペクトルデータチャンネルの選択（TSC_SELECT）についての情報が含まれている。

好ましい態様においては、値１４及び１５は、再構成されたスペクトル値の線形の結合を形成するのにとっておかれる。その様な場合は、SEG_LENGTH==15が付加され、SEG_LENGTH==14が減算される。
スペクトルデータチャンネルからのデータ用のビットストリームは、MPEG-1/層=の場合の主要データのビットストリームに対応している：

Claims

Ｋ個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び／または記憶する方法であって、
各デジタルオーディオ信号のサンプリングをブロックごとに時間領域から周波数領域に変換してそれぞれスペクトル値を得る変換ステップと、
前記スペクトル値を符号化する符号化ステップと、
符号化されたスペクトル値を組み立てることで、Ｋ個の別の出力データとして復号化自在、かつ時間領域に再変換可能な伝送及び／または記憶用のビットストリームを形成する組立てステップとからなり、
前記符号化ステップは、スペクトルセグメントの数の各スペクトルセグメントに応じた可変数の仮想のスペクトルデータチャンネル（ＴＳＣ）を形成するステップを含み、
仮想のスペクトルデータチャンネルの数は、Ｋ個の別々の入力チャンネルにおけるスペクトルセグメントごとのブロックにおけるスペクトル情報を使用することで多くてＫ個に等しい仮想のチャンネル数に決定されるとともに、
接続コーディングによる干渉が可聴閾値以下であるか、若しくは人工物が発生しないスペクトル部分で類似する異なる入力チャンネルのスペクトル的に対応するセグメントのスペクトル値を活用することで決定され、
各セグメントのために形成された仮想のスペクトルデータチャンネル（ＴＳＣ）の数が、より大きく、K個の入力チャンネルのオーディオ信号と異なるように、同様のスペクトル値をまとめられ、そして単一の仮想のスペクトルデータチャンネル（ＴＳＣ）にまとめられたスペクトル値がおかれ、
前記組立てステップでは、それぞれのセグメントに対する仮想のスペクトルデータチャンネルの数（ＮＴＳＣ）と、仮想のスペクトルデータチャンネルの構造における情報（ＳＥＧＭＥＮＴ＿ＤＡＴＡ）が前記ビットストリームに含まれて組み立てられ、
構造における前記情報（ＳＥＧＭＥＮＴ＿ＤＡＴＡ）には、各出力チャンネルに対してはそれぞれの出力チャンネルを再構成するためのセグメントリスト（ＳＥＧＭＥＮＴ＿ＬＩＳＴ）と、出力チャンネルのそれぞれのセグメントを再構成するための情報ブロック（ＳＥＧＭＥＮＴ＿ＩＮＦＯ）を含み、
前記情報ブロックには、セグメント長さ（ＳＥＧ＿ＬＥＮＧＴＨ）のためのフィールド、
希望のスペクトルデータチャンネル（ＴＳＣ＿ＳＥＬＥＣＴ）の選択フィールド、
およびデコーダにおいてスペクトルデータチャンネル（ＴＳＣ＿ＤＡＴＡ）のコード化されたスペクトル値の再構成振幅を決定する１セットのスケールファクター（ｓｃｆ）のフィールドを含み、
その結果、デコーダにおいて、ビットストリームの変換の後Ｋ個の出力チャンネルが、スペクトルデータチャンネル（ＴＳＣ）から前記スペクトルデータチャンネルの構造における前記情報（ＳＥＧＭＥＮＴ＿ＤＡＴＡ）に基づいて組み立てられること、
を特徴とするＫ個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び／または記憶する方法。
入力と出力チャンネルがそれぞれマルチチャンネル音を形成すること、
を特徴とする請求項１に記載のＫ個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び／または記憶する方法。
入力と出力チャンネルがそれぞれステレオペアおよび更なるコメントチャンネルを形成すること、
を特徴とする請求項１に記載のＫ個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び／または記憶する方法。
仮想のスペクトルデータチャンネル（ＴＳＣ）がコード化され、そして国際標準化、動画と関連オーディオのコード化、組織の規格ＩＳＯ１１１７２−３に適合する方法で変換されること、
を特徴とする請求項１乃至３のいずれかに記載のＫ個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び／または記憶する方法。
スペクトル値をコーディングするとき、共通の尺度係数により調整されたスペクトル値のグループが結合されるとともに、そしてそこではいかなる情報ブロック（ＳＥＧＭＥＮＴ＿ＩＮＦＯ）においても使われない尺度係数帯域に属するスペクトル値は送信されないで、コーディングが行われること、
を特徴とする請求項１乃至４のいずれかに記載のＫ個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び／または記憶する方法。
不使用の尺度係数帯域の信号化が暗黙に行われていること、
を特徴とする請求項５に記載のＫ個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び／または記憶する方法。
入力チャンネルのコーディングと仮想のスペクトルデータチャンネル（ＴＳＣ）の入力チャンネルのマッピングが、出力チャンネルを再構成するために異なったスペクトルデータチャンネルから再構成されたスペクトル値の線形の結合が形成されるように発生すること、
を特徴とする請求項１乃至６のいずれかに記載のＫ個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び／または記憶する方法。
全てのチャンネルのコード化されたデータを変換するためのビットレートが３８４キロビット／秒を超えないこと、
を特徴とする請求項１乃至７のいずれかに記載のＫ個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び／または記憶する方法。
Ｋ個の別々の入力チャンネルを有するデジタルオーディオ信号を伝送及び／または記憶するエンコーダであって、
各デジタルオーディオ信号のサンプリングをブロックごとに時間領域から周波数領域に変換してそれぞれスペクトル値を得る変換手段と、
前記スペクトル値を符号化する符号化手段と、
符号化されたスペクトル値を組み立てることで、Ｋ個の別の出力データとして復号化自在、かつ時間領域に再変換可能な伝送および／または記憶用のビットストリームを形成する組立て手段と、
を備え、
スペクトルセグメントの数の各スペクトルセグメントに応じた可変数の仮想のスペクトルデータチャンネル（ＴＳＣ）を形成するための符号化が作用する手段を含み、
仮想のスペクトルデータチャンネルの数は、Ｋ個の別々の入力チャンネルにおけるスペクトルセグメントごとのブロックにおけるスペクトル情報で使用することで多くてＫ個に等しいチャンネル数に決定されるとともに、
接続コーディングによる干渉が可聴閾値以下であるか、若しくは人工物が発生しないスペクトル部分で類似する異なる入力チャンネルのスペクトル的に対応するセグメントのスペクトル値を活用することで決定され、
各セグメントのために形成された仮想のスペクトルデータチャンネル（ＴＳＣ）の数が、より大きく、K個の入力チャンネルのオーディオ信号と異なるように、同様のスペクトル値をまとめられ、そして単一の仮想のスペクトルデータチャンネル（ＴＳＣ）にまとめられたスペクトル値がおかれ、
前記組立て手段では、それぞれのセグメントに対する仮想のスペクトルデータチャンネル数（ＮＴＳＣ）と、仮想のスペクトルデータチャンネルの構造における情報（ＳＥＧＭＥＮＴ＿ＤＡＴＡ）が前記ビットストリームに含まれて組み立てられ、
構造における前記情報（ＳＥＧＭＥＮＴ＿ＤＡＴＡ）には、各出力チャンネルに対してはそれぞれの出力チャンネルを再構成するためのセグメントリスト（ＳＥＧＭＥＮＴ＿ＬＩＳＴ）と、出力チャンネルのそれぞれのセグメントを再構成するための情報ブロック（ＳＥＧＭＥＮＴ＿ＩＮＦＯ）を含み、
前記情報ブロックには、セグメント長さ（ＳＥＧ＿ＬＥＮＧＴＨ）のためのフィールド、
希望のスペクトルデータチャンネル（ＴＳＣ＿ＳＥＬＥＣＴ）の選択フィールド、
およびデコーダにおいてスペクトルデータチャンネル（ＴＳＣ＿ＤＡＴＡ）のコード化されたスペクトル値の再構成振幅を決定する１セットのスケールファクター（ｓｃｆ）のフィールドを含み、
その結果、デコーダにおいて、ビットストリームの変換の後Ｋ個の出力チャンネルが、スペクトルデータチャンネル（ＴＳＣ）から前記スペクトルデータチャンネルの構造における前記情報（ＳＥＧＭＥＮＴ＿ＤＡＴＡ）に基づいて組み立てられること、
を特徴とするエンコーダ。
ビットストリームを復号化する方法であって、
下記の方法で符号化されたビットストリームの変換後、Ｋ個の出力チャンネルを、変換された仮想のスペクトルデータチャンネル（ＴＳＣ）からスペクトルデータチャンネルの構成の情報（ＳＥＧＭＥＮＴ＿ＤＡＴＡ）を使ってセグメント毎に組み立てて、再構成する符号化の方法。
各デジタルオーディオ信号のサンプリングをブロックごとに時間領域から周波数領域に変換してそれぞれスペクトル値を得る変換ステップと、
前記スペクトル値を符号化する符号化ステップと、
符号化されたスペクトル値を組み立てることで、ビットストリームを形成する組立てステップとからなり、
前記符号化ステップは、スペクトルセグメントの数の各スペクトルセグメントに応じた可変数の仮想のスペクトルデータチャンネル（ＴＳＣ）を形成するステップを含み、
仮想のスペクトルデータチャンネルの数は、Ｋ個の別々の入力チャンネルにおけるスペクトルセグメントごとのブロックにおけるスペクトル情報を使用することで多くてＫ個に等しい仮想のチャンネル数に決定されるとともに、
接続コーディングによる干渉が可聴閾値以下であるか、若しくは人工物が発生しないスペクトル部分で類似する異なる入力チャンネルのスペクトル的に対応するセグメントのスペクトル値を活用することで決定され、
各セグメントのために形成された仮想のスペクトルデータチャンネル（ＴＳＣ）の数が、より大きく、K個の入力チャンネルのオーディオ信号と異なるように、同様のスペクトル値をまとめられ、そして単一の仮想のスペクトルデータチャンネル（ＴＳＣ）にまとめられたスペクトル値がおかれ、
前記組立てステップでは、それぞれのセグメントに対する仮想のスペクトルデータチャンネル数（ＮＴＳＣ）と、仮想のスペクトルデータチャンネルの構造における情報（ＳＥＧＭＥＮＴ＿ＤＡＴＡ）が前記ビットストリームに含まれて組み立てられ、
構造における前記情報（ＳＥＧＭＥＮＴ＿ＤＡＴＡ）には、各出力チャンネルに対してはそれぞれの出力チャンネルを再構成するためのセグメントリスト（ＳＥＧＭＥＮＴ＿ＬＩＳＴ）と、出力チャンネルのそれぞれのセグメントを再構成するための情報ブロック（ＳＥＧＭＥＮＴ＿ＩＮＦＯ）を含み、
前記情報ブロックには、セグメント長さ（ＳＥＧ＿ＬＥＮＧＴＨ）のためのフィールド、希望のスペクトルデータチャンネル（ＴＳＣ＿ＳＥＬＥＣＴ）の選択フィールド、およびデコーダにおいてスペクトルデータチャンネル（ＴＳＣ＿ＤＡＴＡ）のコード化されたスペクトル値の再構成振幅を決定する１セットのスケールファクター（ｓｃｆ）のフィールドを含む。
ビットストリームを復号化するデコーダであり、
下記の方法で符号化されたビットストリームの変換後、Ｋ個の出力チャンネルを、変換されたスペクトルデータチャンネル（ＴＳＣ）からスペクトルデータチャンネルの構成の情報（ＳＥＧＭＥＮＴ＿ＤＡＴＡ）を使ってセグメント毎に組み立てて、再構成するデコーダ。
各デジタルオーディオ信号のサンプリングをブロックごとに時間領域から周波数領域に変換してそれぞれスペクトル値を得る変換ステップと、
前記スペクトル値を符号化する符号化ステップと、
符号化されたスペクトル値を組み立てることで、ビットストリームを形成する組立てステップとからなり、
前記符号化ステップは、スペクトルセグメントの数の各スペクトルセグメントに応じた可変数の仮想のスペクトルデータチャンネル（ＴＳＣ）を形成するステップを含み、
仮想のスペクトルデータチャンネルの数は、Ｋ個の別々の入力チャンネルにおけるスペクトルセグメントごとのブロックにおけるスペクトル情報を使用することで多くてＫ個に等しい仮想のチャンネル数に決定されるとともに、
接続コーディングによる干渉が可聴閾値以下であるか、若しくは人工物が発生しないスペクトル部分で類似する異なる入力チャンネルのスペクトル的に対応するセグメントのスペクトル値を活用することで決定され、
各セグメントのために形成された仮想のスペクトルデータチャンネルの数（ＴＳＣ）が、より大きく、K個の入力チャンネルのオーディオ信号と異なるように、同様のスペクトル値をまとめられ、そして単一の仮想のスペクトルデータチャンネル（ＴＳＣ）にまとめられたスペクトル値がおかれ、
前記組立てステップでは、それぞれのセグメントに対する仮想のスペクトルデータチャンネルの数（ＮＴＳＣ）と、仮想のスペクトルデータチャンネルの構造における情報（ＳＥＧＭＥＮＴ＿ＤＡＴＡ）が前記ビットストリームに含まれて組み立てられ、
構造における前記情報には、各出力チャンネルに対してはそれぞれの出力チャンネルを再構成するためのセグメントリスト（ＳＥＧＭＥＮＴ＿ＬＩＳＴ）と、出力チャンネルのそれぞれのセグメントを再構成するための情報ブロック（ＳＥＧＭＥＮＴ＿ＩＮＦＯ）を含み、
前記情報ブロックには、セグメント長さ（ＳＥＧ＿ＬＥＮＧＴＨ）のためのフィールド、希望のスペクトルデータチャンネル（ＴＳＣ＿ＳＥＬＥＣＴ）の選択フィールド、およびデコーダにおいてスペクトルデータチャンネル（ＴＳＣ＿ＤＡＴＡ）のコード化されたスペクトル値の再構成振幅を決定する１セットのスケールファクター（ｓｃｆ）のフィールドを含む。