JP4591606B2

JP4591606B2 - 音声符号化方法、音声復号方法及び音声信号伝送方法

Info

Publication number: JP4591606B2
Application number: JP2009085025A
Authority: JP
Inventors: 美昭田中; 昭治植野
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 2009-03-31
Filing date: 2009-03-31
Publication date: 2010-12-01
Anticipated expiration: 2018-11-16
Also published as: JP2009145919A

Description

本発明は、マルチチャネルの音声信号を可変長で圧縮するための音声符号化方法、音声復号方法及び音声信号伝送方法に関する。

音声信号を可変長で圧縮する方法として、本発明者は先の出願（特願平９−２８９１５
９号）において１チャネルの原デジタル音声信号に対して、特性が異なる複数の予測器に
より時間領域における過去の信号から現在の信号の複数の線形予測値を算出し、原デジタ
ル音声信号と、この複数の線形予測値から予測器毎の予測残差を算出、予測残差の最小値
を選択する予測符号化方法を提案している。

なお、上記方法では原デジタル音声信号がサンプリング周波数＝９６ｋＨｚ、量子化ビ
ット数＝２０ビット程度の場合にある程度の圧縮効果を得ることができるが、近年のＤＶ
Ｄオーディオディスクではこの２倍のサンプリング周波数（＝１９２ｋＨｚ）が使用され
、また、量子化ビット数も２４ビットが使用される傾向があるので、圧縮率を改善する必
要がある。また、マルチチャネルにおけるサンプリング周波数と量子化ビット数はチャネ
ル毎に異なることもある。

ところで、予測符号化方式のような圧縮方式は圧縮率が可変（ＶＢＲ：バリアブル・ビ
ット・レート）であるので、マルチチャネルの音声信号を予測符号化するとチャネル毎の
データ量が時間的に大きく変化する。また、このようなデータを伝送する場合には、チャ
ネル毎にパラレルではなくデータストリームとして伝送される。

したがって、再生側（デコード側）においてこのような可変長のデータストリームをチ
ャネル毎に同期して再生（プレゼンテーション）可能にするためには、入力バッファに蓄
積されたデータストリームを読み出してデコーダに出力するためのタイミングを示すデコ
ード時間と、出力バッファに蓄積されたデコード後のデータを読み出してスピーカなどに
出力（プレゼンテーション）するためのタイミングを示す再生時間を管理しなければなら
ない。また、再生側でこのような可変長のデータストリームをサーチ再生するための時間
を管理しなければならない。

そこで本発明は、マルチチャネルの音声信号を可変の圧縮率で符号化する場合に再生側
の処理時間を管理することができる音声符号化方法、音声復号方法及び音声信号伝送方法
を提供することを目的とする。

本発明は上記目的を達成するために、以下の１）〜３）に記載の手段よりなる。
すなわち、
１）元のマルチチャネルの音声信号をダウンミクスしてステレオ２チャネルの音声信号に変換するステップと、
前記元のマルチチャネルを所定のマトリクス演算により、相関あるチャネルであってそのチャネル数が前記２チャネル分少ない数の相関チャネルに変換するステップと、
前記ステレオ２チャネルと前記相関チャネルの音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を選択して予測符号化するステップと、
ＳＣＲ情報を含むパックヘッダと、圧縮ＰＣＭアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮ＰＣＭアクセスユニットは前記フレーム中に複数設けられ、前記ステップにより選択された各チャネルの線形予測方法と予測残差を含む予測符号化データを、前記圧縮ＰＣＭアクセスユニット内に配置される前記ステレオ２チャネルの第１のグループと前記相関チャネルの第２のグループにグループ分けしたビットストリームに格納し、また、前記圧縮ＰＣＭアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記ビットストリームに前記先頭サンプル値を収納するステップと、
からなる音声符号化方法。
２）１）の音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
前記ヘッダに含まれるＳＣＲ情報を分離するステップと、
前記ユーザデータから圧縮ＰＣＭアクセスユニットを抽出するステップと、
前記分離されたＳＣＲ情報に基づいて前記ビットストリームを保持するステップと、
前記圧縮ＰＣＭアクセスユニットに配置されるグループ分けしたビットストリームから前記先頭サンプル値と、予測残差および線形予測方法を含む予測符号化データとを取り出すステップと、
前記先頭サンプル値と前記予測残差および線形予測方法とに基づいて予測値を算出するステップと、
この算出された予測値から前記ステレオ２チャネルの音声信号と元のマルチチャネルの音声信号を復元するステップと、
からなる音声復号方法。
３）元のマルチチャネルの音声信号をダウンミクスしてステレオ２チャネルの音声信号に変換するステップと、
前記元のマルチチャネルを所定のマトリクス演算により、相関あるチャネルであってそのチャネル数が前記２チャネル分少ない数の相関チャネルに変換するステップと、
前記ステレオ２チャネルと前記相関チャネルの音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を選択して予測符号化するステップと、
ＳＣＲ情報を含むパックヘッダと、圧縮ＰＣＭアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮ＰＣＭアクセスユニットは前記フレーム中に複数設けられ、前記ステップにより選択された各チャネルの線形予測方法と予測残差を含む予測符号化データを、前記圧縮ＰＣＭアクセスユニット内に配置される前記ステレオ２チャネルの第１のグループと前記相関チャネルの第２のグループにグループ分けしたビットストリームに格納し、また、前記圧縮ＰＣＭアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記ビットストリームに前記先頭サンプル値を収納するステップと、
からなる音声符号化方法により符号化し、
前記選択された先頭サンプル値と、予測残差と線形予測方法とを含む予測符号化データをパケット化して伝送することを特徴とする音声信号伝送方法。

以上説明したように本発明によれば、特に、元のマルチチャネルの音声信号をダウンミクスして互いに相関あるチャネルに変換する２つの相関信号を、チャネル毎に入力される音声信号に応答して先頭サンプル値を得ると共に、時間領域に過去の信号から予測される現在の信号の複数の予測値の中でその予測残差が最小となる線形予測方式によりロスレス圧縮するようにしたので、音声信号を予測符号化する場合に圧縮率を改善できる。

本発明が適用される音声符号化装置とそれに対応した音声復号装置の第１の実施形態を示すブロック図である。図１の符号化部を詳しく示すブロック図である。図１、図２の符号化部により符号化されたビットストリームを示す説明図である。ＤＶＤのパックのフォーマットを示す説明図である。ＤＶＤのオーディオパックのフォーマットを示す説明図である。図１の復号化部を詳しく示すブロック図である。図６の入力バッファの書き込み／読み出しタイミングを示すタイミングチャートである。アクセスユニット毎の圧縮データ量を示す説明図である。アクセスユニットとプレゼンテーションユニットを示す説明図である。音声伝送方法を示すフローチャートである。音声伝送方法を示すフローチャートである。本発明が適用される音声符号化装置とそれに対応した音声復号装置の第３の実施形態を示すブロック図である。第４の実施形態の音声符号化装置を示すブロック図である。第４の実施形態の音声復号装置を示すブロック図である。

以下、図面を参照して本発明の実施の形態を説明する。図１は本発明が適用される声符
号化装置とそれに対応する音声復号装置の第１の実施形態を示すブロック図、図２は図１
の符号化部を詳しく示すブロック図、図３は図１、図２の符号化部により符号化されたビ
ットストリームを示す説明図、図４はＤＶＤのパックのフォーマットを示す説明図、図５
はＤＶＤのオーディオパックのフォーマットを示す説明図、図６は図１の復号化部を詳し
く示すブロック図、図７は図６の入力バッファの書き込み／読み出しタイミングを示すタ
イミングチャート、図８はアクセスユニット毎の圧縮データ量を示す説明図、図９はアク
セスユニットとプレゼンテーションユニットを示す説明図である。

ここで、マルチチャネル方式としては、例えば次の４つの方式が知られている。
（１）４チャネル方式ドルビーサラウンド方式のように、前方Ｌ、Ｃ、Ｒの３チャ
ネル＋後方Ｓの１チャネルの合計４チャネル
（２）５チャネル方式ドルビーＡＣ−３方式のＳＷチャネルなしのように、前方Ｌ
、Ｃ、Ｒの３チャネル＋後方ＳＬ、ＳＲの２チャネルの合計５チャネル
（３）６チャネル方式ＤＴＳ（Digital Theater System）方式や、ドルビーＡＣ−
３方式のように６チャネル（Ｌ、Ｃ、Ｒ、ＳＷ（Ｌｆｅ）、ＳＬ、ＳＲ）
（４）８チャネル方式ＳＤＤＳ（Sony Dynamic Digital Sound）方式のように、前
方Ｌ、ＬＣ、Ｃ、ＲＣ、Ｒ、ＳＷの６チャネル＋後方ＳＬ、ＳＲの２チャネルの合計８チ
ャネル
図１に示す符号化側の６チャネル（ch）ミクス＆マトリクス回路１’は、マルチチャネ
ル信号の一例としてフロントレフト（Ｌｆ）、センタ（Ｃ）、フロントライト（Ｒｆ）、
サラウンドレフト（Ｌｓ）、サラウンドライト（Ｒｓ）及びＬｆｅ（Low Frequency Effe
ct）の６chのＰＣＭデータを次式（１）により前方グループに関する２ch「１」、「２」
と他のグループに関する４ch「３」〜「６」に分類して変換し、２ch「１」、「２」を第
１符号化部２’−１に、また、４ch「３」〜「６」を第２符号化部２’−２に出力する。

「１」＝Ｌｆ＋Ｒｆ
「２」＝Ｌｆ−Ｒｆ
「３」＝Ｃ−（Ｌｓ＋Ｒｓ）／２
「４」＝Ｌｓ＋Ｒｓ
「５」＝Ｌｓ−Ｒｓ
「６」＝Ｌｆｅ−ａ×Ｃ
ただし、０≦ａ≦１ …（１）
符号化部２’を構成する第１及び第２符号化部２’−１、２’−２はそれぞれ、図２に
詳しく示すように２ch「１」、「２」と４ch「３」〜「６」のＰＣＭデータを予測符号化
し、予測符号化データを図３に示すようなビットストリームで記録媒体５や通信媒体６を
介して復号側に伝送する。復号側では復号化部３’を構成する第１及び第２復号化部３’
−１、３’−２により、図６に詳しく示すようにそれぞれ前方グループに関する２ch「１
」、「２」と他のグループに関する４ch「３」〜「６」の予測符号化データをＰＣＭデー
タに復号する。

次いでミクス＆マトリクス回路４’により式（１）に基づいて元の６ch（Ｌｆ、Ｃ、Ｒ
ｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）を復元するとともに、この元の６chと係数ｍiｊ（ｉ＝１，２
，ｊ＝１，２〜６）により次式（２）のようにステレオ２chデータ（Ｌ、Ｒ）を生成する
。

Ｌ＝ｍ１１・Ｌｆ＋ｍ１２・Ｒｆ＋ｍ１３・Ｃ
＋ｍ１４・Ｌｓ＋ｍ１５・Ｒｓ＋ｍ１６・Ｌｆｅ
Ｒ＝ｍ２１・Ｌｆ＋ｍ２２・Ｒｆ＋ｍ２３・Ｃ
＋ｍ２４・Ｌｓ＋ｍ２５・Ｒｓ＋ｍ２６・Ｌｆｅ …（２）
図２を参照して符号化部２’−１、２’−２について詳しく説明する。各ch「１」〜「
６」のＰＣＭデータは１フレーム毎に１フレームバッファ１０に格納される。そして、１
フレームの各ch「１」〜「６」のサンプルデータがそれぞれ予測回路１３Ｄ１、１３Ｄ２
、１５Ｄ１〜１５Ｄ４に印加されるとともに、各ch「１」〜「６」の各フレームの先頭サ
ンプルデータがフォーマット化回路１９に印加される。予測回路１３Ｄ１、１３Ｄ２、１
５Ｄ１〜１５Ｄ４はそれぞれ、各ch「１」〜「６」のＰＣＭデータに対して、特性が異な
る複数の予測器（不図示）により時間領域における過去の信号から現在の信号の複数の線
形予測値を算出し、次いで原ＰＣＭデータと、この複数の線形予測値から予測器毎の予測
残差を算出する。続くバッファ・選択器１４Ｄ１、１４Ｄ２、１６Ｄ１〜１６Ｄ４はそれ
ぞれ、予測回路１３Ｄ１、１３Ｄ２、１５Ｄ１〜１５Ｄ４により算出された各予測残差を
一時記憶して、選択信号／ＤＴＳ（デコーディング・タイム・スタンプ）生成器１７によ
り指定されたサブフレーム毎に予測残差の最小値を選択する。

選択信号／ＤＴＳ生成器１７は予測残差のビット数フラグをパッキング回路１８とフォ
ーマット化回路１９に対して印加し、また、予測残差が最小の予測器を示す予測器選択フ
ラグと、式（１）における相関係数ａと、復号化側が入力バッファ２２ａ（図６）からス
トリームデータを取り出す時間を示すＤＴＳをフォーマット化回路１９に対して印加する
。パッキング回路１８はバッファ・選択器１４Ｄ１、１４Ｄ２、１６Ｄ１〜１６Ｄ４によ
り選択された６ch分の予測残差を、選択信号／ＤＴＳ生成器１７により指定されたビット
数フラグに基づいて指定ビット数でパッキングする。またＰＴＳ生成器１７ｃは、復号化
側が出力バッファ１１０（図６）からＰＣＭデータを取り出す時間を示すＰＴＳ（プレゼ
ンテーション・タイム・スタンプ）を生成してフォーマット化回路１９に出力する。

続くフォーマット化回路１９は図３〜図５に示すようなユーザデータにフォーマット化
する。図３に示すユーザデータ（サブパケット）は、前方グループに関する２ch「１」、
「２」の予測符号化データを含む可変レートビットストリーム（サブストリーム）ＢＳ０
と、他のグループに関する４ch「３」〜「６」の予測符号化データを含む可変レートビッ
トストリーム（サブストリーム）ＢＳ１と、サブストリームＢＳ０、ＢＳ１の前に設けら
れたビットストリームヘッダ（リスタートヘッダ）により構成されている。
また、サブストリームＢＳ０、ＢＳ１の１フレーム分は
・フレームヘッダと、
・各ch「１」〜「６」の１フレームの先頭サンプルデータと、
・各ch「１」〜「６」のサブフレーム毎の予測器選択フラグと、
・各ch「１」〜「６」のサブフレーム毎のビット数フラグと、
・各ch「１」〜「６」の予測残差データ列（可変ビット数）と、
・ch「６」の係数ａ
が多重化されている。このような予測符号化によれば、原信号が例えばサンプリング周波
数＝９６ｋＨｚ、量子化ビット数＝２４ビット、６チャネルの場合、７１％の圧縮率を実
現することができる。

図２に示す符号化部２’−１、２’−２により予測符号化された可変レートビットスト
リームデータを、記録媒体の一例としてＤＶＤオーディオディスクに記録する場合には、
図４に示すオーディオ（Ａ）パックにパッキングされる。このパックは２０３４バイトの
ユーザデータ（Ａパケット、Ｖパケット）に対して４バイトのパックスタート情報と、６
バイトのＳＣＲ（System Clock Reference：システム時刻基準参照値）情報と、３バイト
のMux レート（rate）情報と１バイトのスタッフィングの合計１４バイトのパックヘッダ
が付加されて構成されている（１パック＝合計２０４８バイト）。この場合、タイムスタ
ンプであるＳＣＲ情報を、先頭パックでは「１」として同一タイトル内で連続とすること
により同一タイトル内のＡパックの時間を管理することができる。

圧縮ＰＣＭのＡパケットは図５に詳しく示すように、１９又は１４バイトのパケットヘ
ッダと、圧縮ＰＣＭのプライベートヘッダと、図３に示すフォーマットの１ないし２０１
１バイトのオーディオデータ（圧縮ＰＣＭ）により構成されている。そして、ＤＴＳとＰ
ＴＳは図５のパケットヘッダ内に（具体的にはパケットヘッダの１０〜１４バイト目にＰ
ＴＳが、１５〜１９バイト目にＤＴＳが）セットされる。圧縮ＰＣＭのプライベートヘッ
ダは、
・１バイトのサブストリームＩＤと、
・２バイトのＵＰＣ／ＥＡＮ−ＩＳＲＣ（Universal Product Code/European Article Nu
mber-International Standard Recording Code）番号、及びＵＰＣ／ＥＡＮ−Ｉ
ＳＲＣデータと、
・１バイトのプライベートヘッダ長と、
・２バイトの第１アクセスユニットポインタと、
・８バイトのオーディオデータ情報（ＡＤＩ）と、
・０〜７バイトのスタッフィングバイトとに、
より構成されている。そして、ＡＤＩ内に１秒後のアクセスユニットをサーチするため
の前方アクセスユニット・サーチポインタと、１秒前のアクセスユニットをサーチするた
めの後方アクセスユニット・サーチポインタがともに１バイトで（具体的にはＡＤＩの７
バイト目に前方アクセスユニット・サーチポインタが、８バイト目に後方アクセスユニッ
ト・サーチポインタが）セットされる。

次に図６を参照して復号化部３’−１、３’−２について説明する。上記フォーマット
の可変レートビットストリームデータＢＳ０、ＢＳ１は、デフォーマット化回路２１によ
り分離される。そして、各ｃｈ「１」〜「６」の１フレームの先頭サンプルデータと予測
器選択フラグはそれぞれ予測回路２４Ｄ１、２４Ｄ２、２３Ｄ１〜２３Ｄ４に印加され、
各ｃｈ「１」〜「６」のビット数フラグはアンパッキング回路２２に印加される。また、
ＳＣＲと、ＤＴＳと予測残差データ列は入力バッファ２２ａに印加され、ＰＴＳは出力バ
ッファ１１０に印加される。ここで、予測回路２４Ｄ１、２４Ｄ２、２３Ｄ１〜２３Ｄ４
内の複数の予測器（不図示）はそれぞれ、符号化側の予測回路１３Ｄ１、１３Ｄ２、１５
Ｄ１〜１５Ｄ４内の複数の予測器と同一の特性であり、予測器選択フラグにより同一特性
のものが選択される。

デフォーマット化回路２１により分離されたストリームデータ（予測残差データ列）は
、図７に示すようにＳＣＲによりアクセスユニット毎に入力バッファ２２ａに取り込まれ
て蓄積される。ここで、１つのアクセスユニットのデータ量は、例えばｆｓ＝９６ｋＨｚ
の場合には（１／９６ｋＨｚ）秒分であるが、図８、図９（ａ）に詳しく示すように可変
長である。そして、入力バッファ２２ａに蓄積されたストリームデータはＤＴＳに基づい
てＦＩＦＯで読み出されてアンパッキング回路２２に印加される。

アンパッキング回路２２は各ｃｈ「１」〜「６」の予測残差データ列をビット数フラグ
毎に基づいて分離してそれぞれ予測回路２４Ｄ１、２４Ｄ２、２３Ｄ１〜２３Ｄ４に出力
する。予測回路２４Ｄ１、２４Ｄ２、２３Ｄ１〜２３Ｄ４ではそれぞれ、アンパッキング
回路２２からの各ｃｈ「１」〜「６」の今回の予測残差データと、内部の複数の予測器の
内、予測器選択フラグにより選択された各１つにより予測された前回の予測値が加算され
て今回の予測値が算出され、次いで１フレームの先頭サンプルデータを基準として各サン
プルのＰＣＭデータが算出されて出力バッファ１１０に蓄積される。出力バッファ１１０
に蓄積されたＰＣＭデータはＰＴＳに基づいて読み出されて出力される。したがって、図
９（ａ）に示す可変長のアクセスユニットが伸長されて、図９（ｂ）に示す一定長のプレ
ゼンテーションユニットが出力される。

ここで、操作部１０１を介してサーチ再生が指示された場合には、制御部１００により
図５に示すＡＤＩ内に置かれる１秒先を示す前方アクセスユニット・サーチポインタと１
秒後を示す後方アクセスユニット・サーチポインタに基づいてアクセスユニットを再生す
る。このサーチポインタとしては、１秒先、１秒前の代わりに２秒先、２秒前のものでよ
い。

図２に示す符号化部２’−１、２’−２により予測符号化された可変レートビットスト
リームデータをネットワークを介して伝送する場合には、符号化側では図１０に示すよう
に伝送用にパケット化し（ステップＳ４１）、次いでパケットヘッダを付与し（ステップ
Ｓ４２）、次いでこのパケットをネットワーク上に送り出す（ステップＳ４３）。

復号側では図１１（Ａ）に示すようにヘッダを除去し（ステップＳ５１）、次いでデー
タを復元し（ステップＳ５２）、次いでこのデータをメモリに格納して復号を待つ（ステ
ップＳ５３）。そして、復号を行う場合には図１１（Ｂ）に示すように、デフォーマット
化を行い（ステップＳ６１）、次いで入力バッファ２２ａの入出力制御を行い（ステップ
Ｓ６２）、次いでアンパッキングを行う（ステップＳ６３）。なお、このとき、サーチ再
生指示がある場合にはサーチポインタをデコードする。次いで予測器をフラグに基づいて
選択してデコードを行い（ステップＳ６４）、次いで出力バッファ１１０の入出力制御を
行い（ステップＳ６５）、次いで元のマルチチャネルを復元し（ステップＳ６６）、次い
でこれを出力し（ステップＳ６７）、以下、これを繰り返す。

なお、上記実施形態では、前方グループに関する２ch「１」、「２」を
「１」＝Ｌｆ＋Ｒｆ
「２」＝Ｌｆ−Ｒｆ
により変換して予測符号化したが、代わりに式（２）によりマルチチャネルをダウンミク
スしてステレオ２chデータ（Ｌ、Ｒ）を生成し、
次いで次式（１）’
「１」＝Ｌ＋Ｒ
「２」＝Ｌ−Ｒ
「３」〜「５」は同じ
「６」＝Ｌｆｅ−Ｃ …（１）’
により変換して予測符号化するようにしてもよい（第２の実施形態）。この場合には、復
号化側のミクス＆マトリクス回路４’はチャネル「１」、「２」を加算することによりチ
ャネルＬを、減算することによりチャネルＲを生成することができる。

また、第３の実施形態として図１２に示すように、２ch「１」、「２」の代わりに式（
２）によりマルチチャネルをダウンミクスしてステレオ２chデータ（Ｌ、Ｒ）を生成して
、このステレオ２ch（Ｌ、Ｒ）と４ch「３」〜「６」を予測符号化するようにしてもよい
。なお、第２、第３の実施形態では、フロントレフト（Ｌｆ）とフロントライト（Ｒｆ）
が復号化側に伝送されないので、復号化側ではこれを式（１）、（２）により生成する。

次に図１３、図１４を参照して第４の実施形態について説明する。上記の実施形態では
、１グループの相関性の信号「１」〜「６」を予測符号化するように構成されているが、
この第４の実施形態では複数グループの相関性のある信号を生成して予測符号化し、圧縮
率が最も高いグループの予測符号化データを選択するように構成されている。このため図
１３に示す符号化部では、第１〜第ｎの相関回路１−１〜１−ｎが設けられ、このｎ個の
相関回路１−１〜１−ｎは例えば６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のＰＣＭ
データを、相関性が異なるｎ種類の６ch信号「１」〜「６」に変換する。

例えば第１の相関回路１−１は以下のように変換し、
「１」＝Ｌｆ
「２」＝Ｃ−（Ｌｓ＋Ｒｓ）／２
「３」＝Ｒｆ−Ｌｆ
「４」＝Ｌｓ−ａ×Ｌｆｅ
「５」＝Ｒｓ−ｂ×Ｒｆ
「６」＝Ｌｆｅ
また、第ｎの相関回路１−ｎは以下のように変換する。

「１」＝Ｌｆ＋Ｒｆ
「２」＝Ｃ−Ｌｆ
「３」＝Ｒｆ−Ｌｆ
「４」＝Ｌｓ−Ｌｆ
「５」＝Ｒｓ−Ｌｆ
「６」＝Ｌｆｅ−Ｃ
また、相関回路１−１〜１−ｎ毎に予測回路１５とバッファ・選択器１６が設けられ、
グループ毎の予測残差の最小値のデータ量に基づいて圧縮率が最も高いグループが相関選
択信号生成器１７ｂにより選択される。このとき、フォーマット化回路１９はその選択フ
ラグ（相関回路選択フラグ、その相関回路の相関係数ａ、ｂ）を追加して多重化する。

また、図１４に示す復号化側では、符号化側の相関回路１−１〜１−ｎに対してｎ個の
相関回路４−１〜４−ｎ（又は係数ａ、ｂが変更可能な図示省略の１つの相関回路）が設
けられる。なお、図１３に示すｎグループの予測回路が同一の構成である場合、復号装置
では図１４に示すようにｎグループ分の予測回路を設ける必要はなく、１つのグループ分
の予測回路でよい。そして、符号化装置から伝送された選択フラグに基づいて相関回路４
−１〜４−ｎの１つを選択、又は係数ａ、ｂを設定して元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ
、Ｒｓ、Ｌｆｅ）を復元し、また、式（２）によりマルチチャネルをダウンミクスしてス
テレオ２chデータ（Ｌ、Ｒ）を生成する。

また、上記の第１の実施形態では、１種類の相関性の信号「１」〜「６」を予測符号化
するように構成されているが、この信号「１」〜「６」のグループと原信号（Ｌｆ、Ｃ、
Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のグループを予測符号化し、圧縮率が高い方のグループを選
択するようにしてもよい。

１’ ６chミクス＆マトリクス回路
１３Ｄ１，１３Ｄ２，１５Ｄ１〜１５Ｄ４予測回路（バッファ・選択器１４
Ｄ１，１４Ｄ２，１６Ｄ１〜１６Ｄ４と共に圧縮手段を構成する。）
１４Ｄ１，１４Ｄ２，１６Ｄ１〜１６Ｄ４バッファ・選択器
１７選択信号／ＤＴＳ生成器（タイミング生成手段）
１７ｃＰＴＳ生成器（タイミング生成手段）
１９フォーマット化回路（フォーマット化手段）
２１デフォーマット化回路（分離手段）
２２アンパッキング回路
２２ａ入力バッファ
２４Ｄ１，２４Ｄ２，２３Ｄ１〜２３Ｄ４予測回路（伸長手段）
１００制御部（読み出し手段）
１１０出力バッファ

Claims

元のマルチチャネルの音声信号をダウンミクスしてステレオ２チャネルの音声信号に変換するステップと、
前記元のマルチチャネルを所定のマトリクス演算により、相関あるチャネルであってそのチャネル数が前記２チャネル分少ない数の相関チャネルに変換するステップと、
前記ステレオ２チャネルと前記相関チャネルの音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を選択して予測符号化するステップと、
ＳＣＲ情報を含むパックヘッダと、圧縮ＰＣＭアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮ＰＣＭアクセスユニットは前記フレーム中に複数設けられ、前記ステップにより選択された各チャネルの線形予測方法と予測残差を含む予測符号化データを、前記圧縮ＰＣＭアクセスユニット内に配置される前記ステレオ２チャネルの第１のグループと前記相関チャネルの第２のグループにグループ分けしたビットストリームに格納し、また、前記圧縮ＰＣＭアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記ビットストリームに前記先頭サンプル値を収納するステップと、
からなる音声符号化方法。
請求項１記載の音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
前記ヘッダに含まれるＳＣＲ情報を分離するステップと、
前記ユーザデータから圧縮ＰＣＭアクセスユニットを抽出するステップと、
前記分離されたＳＣＲ情報に基づいて前記ビットストリームを保持するステップと、
前記圧縮ＰＣＭアクセスユニットに配置されるグループ分けしたビットストリームから前記先頭サンプル値と、予測残差および線形予測方法を含む予測符号化データとを取り出すステップと、
前記先頭サンプル値と前記予測残差および線形予測方法とに基づいて予測値を算出するステップと、
この算出された予測値から前記ステレオ２チャネルの音声信号と元のマルチチャネルの音声信号を復元するステップと、
からなる音声復号方法。
元のマルチチャネルの音声信号をダウンミクスしてステレオ２チャネルの音声信号に変換するステップと、
前記元のマルチチャネルを所定のマトリクス演算により、相関あるチャネルであってそのチャネル数が前記２チャネル分少ない数の相関チャネルに変換するステップと、
前記ステレオ２チャネルと前記相関チャネルの音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を選択して予測符号化するステップと、
ＳＣＲ情報を含むパックヘッダと、圧縮ＰＣＭアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮ＰＣＭアクセスユニットは前記フレーム中に複数設けられ、前記ステップにより選択された各チャネルの線形予測方法と予測残差を含む予測符号化データを、前記圧縮ＰＣＭアクセスユニット内に配置される前記ステレオ２チャネルの第１のグループと前記相関チャネルの第２のグループにグループ分けしたビットストリームに格納し、また、前記圧縮ＰＣＭアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記ビットストリームに前記先頭サンプル値を収納するステップと、
からなる音声符号化方法により符号化し、
前記選択された先頭サンプル値と、予測残差と線形予測方法とを含む予測符号化データをパケット化して伝送することを特徴とする音声信号伝送方法。