JP2003249018A

JP2003249018A - 音声符号化装置及び音声復号化装置

Info

Publication number: JP2003249018A
Application number: JP2002344105A
Authority: JP
Inventors: Yoshiaki Tanaka; 美昭田中; Shoji Ueno; 昭治植野; Norihiko Fuchigami; 徳彦渕上
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 2002-11-27
Filing date: 2002-11-27
Publication date: 2003-09-05
Anticipated expiration: 2018-11-16
Also published as: JP3876828B2

Abstract

(57)【要約】【課題】マルチチャネルを圧縮又は非圧縮で選択的に伝
送したり、再生側のダウンミクスを選択的に許可又は禁
止しても再生側が正常に再生可能にする。【解決手段】ＡＴＳＩはオーディオパケット内のマルチ
チャネルデータが圧縮されているか否かを示す第１の識
別子と、マルチチャネルデータをステレオ２チャネルに
ダウンミクスすることを許可するか又は禁止するかを示
す第２の識別子を含む。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、マルチチャネル音
声信号の音声符号化装置及び音声復号化装置に関する。

【０００２】

【従来の技術】音声信号を可変長で圧縮する方法とし
て、本発明者は先の出願（特願平９−２８９１５９号）
において１チャネルの原デジタル音声信号に対して、特
性が異なる複数の予測器により時間領域における過去の
信号から現在の信号の複数の線形予測値を算出し、原デ
ジタル音声信号と、この複数の線形予測値から予測器毎
の予測残差を算出し、予測残差の最小値を選択する予測
符号化方法を提案している。

【０００３】なお、上記方法では原デジタル音声信号が
サンプリング周波数＝９６ｋＨｚ、量子化ビット数＝２
０ビット程度の場合にある程度の圧縮効果を得ることが
できるが、近年のＤＶＤオーディオディスクではこの２
倍のサンプリング周波数（＝１９２ｋＨｚ）が使用さ
れ、また、量子化ビット数も２４ビットが使用される傾
向がある。また、マルチチャネルにおけるサンプリング
周波数と量子化ビット数はチャネル毎に異なることもあ
る。

【０００４】

【発明が解決しようとする課題】ところで、マルチチャ
ネルの音声信号を伝送する場合、著作権者がオーディオ
ソースに依っては圧縮を希望するものとそうでないもの
があり、また、ユーザがマルチチャネルをステレオ２チ
ャネルにダウンミクスして再生することを望まないもの
とそうでないものとの２通りがある。したがって、この
ように圧縮又は非圧縮で選択的に伝送する２通りと、再
生側のダウンミクスを選択的に許可、禁止する２通りの
合計４通りで伝送した場合には、再生側でこれを識別し
て選択的に再生する必要がある。

【０００５】そこで本発明は、再生側のダウンミクスを
選択的に許可又は禁止しても再生側が正常に再生するこ
とができる音声符号化装置及び音声復号化装置を提供す
ることを目的とする。

【０００６】

【課題を解決するための手段】本発明は上記目的を達成
するために、以下の１）及び２）の手段より成る。すな
わち、１）マルチチャネルの音声信号を、そのままのチャネル
又は互いに相関あるチャネル毎に、入力される音声信号
に応答して先頭サンプル値を得ると共に、時間領域の過
去の信号から予測される現在の信号の複数の予測値の中
でその予測残差が最小となるような線形予測方法を選択
して圧縮する手段と、前記ステップにより選択された先
頭サンプル値と予測残差と線形予測方法とを含む圧縮デ
ータを格納するサブパケットと、前記サブパケットに対
応して設けられその同期情報を含む同期情報部と、から
一つのアクセスユニットを形成し、前記同期情報部に圧
縮データのチャネル数を示し、再生側においてそのチャ
ネル数に応じた復号処理を行うために用いられるチャネ
ル割り当て情報を収納するようにしたオーディオパケッ
トと、前記オーディオパケット内のデータが前記圧縮方
法により圧縮されていることを示す第１の識別子と、前
記オーディオパケットに格納されたマルチチャネルデー
タをステレオ２チャネルにダウンミクスすることを許可
するか又は禁止するかを示す第２の識別子と、ダウンミ
クス係数の識別情報とが配置された管理情報とを、有す
るデータ構造にフォーマット化する手段と、からなる音
声符号化装置。２）請求項１記載の音声符号化装置によりフォーマット
化されたデータ構造のデータを復号する音声復号化装置
であって、前記データをオーディオパケットと管理情報
に分離する手段と、前記管理情報から第１の識別子と第
２の識別子を抽出する手段と、前記オーディオパケット
内の同期情報部に含まれるチャネル割り当て情報に基づ
いて、前記抽出された第２の識別子がダウンミクスする
ことを許可する場合に前記サブパケット内の圧縮データ
を前記抽出された第１の識別子に基づいて選択的に伸長
するか又は伸長しないで復号しマルチチャネルとステレ
オ２チャネルの少なくともいずれかで取り出し、前記第
２の識別子がダウンミクスすることを禁止する場合には
前記サブパケット内の圧縮データを前記第１の識別子に
基づいて選択的に伸長するか又は伸長しないで復号しマ
ルチチャネルのみで取り出す手段と、からなる音声復号
化装置。

【０００７】

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図１〜図４は本発明が適用される
マルチチャネル伝送形態を実現する音声符号化装置の処
理を示す説明図である。

【０００８】ここで、マルチチャネル方式としては、例
えば次の４つの方式が知られている。（１）４チャネル方式ドルビーサラウンド方式のように、前方Ｌ、Ｃ、Ｒの３
チャネル＋後方Ｓの１チャネルの合計４チャネル（２）５チャネル方式ドルビーＡＣ−３方式のＳＷチャネルなしのように、前
方Ｌ、Ｃ、Ｒの３チャネル＋後方ＳＬ、ＳＲの２チャネ
ルの合計５チャネル（３）６チャネル方式ＤＴＳ（Digital Theater System）方式や、ドルビーＡ
Ｃ−３方式のように６チャネル（Ｌ、Ｃ、Ｒ、ＳＷ（Ｌ
ｆｅ）、ＳＬ、ＳＲ）（４）８チャネル方式ＳＤＤＳ（Sony Dynamic Digital Sound）方式のよう
に、前方Ｌ、ＬＣ、Ｃ、ＲＣ、Ｒ、ＳＷの６チャネル＋
後方ＳＬ、ＳＲの２チャネルの合計８チャネル

【０００９】図１は第１の例の伝送形態として、マルチ
チャネルを圧縮するとともに再生側のダウンミクスを禁
止する場合を示している。符号化側の６チャネル（ch）
ミクス＆マトリクス回路１’は、マルチチャネル信号の
一例としてフロントレフト（Ｌｆ）、センタ（Ｃ）、フ
ロントライト（Ｒｆ）、サラウンドレフト（Ｌｓ）、サ
ラウンドライト（Ｒｓ）及びＬｆｅ（Low Frequency Ef
fect）の６chのＰＣＭデータを次式（１−１）により６
ch「１」〜「６」分の相関信号に変換し、符号化部２’
に出力する。「１」＝Ｌｆ＋Ｒｆ−Ｃ「２」＝Ｌｆ−Ｒｆ−Ｃ「３」＝Ｃ−（Ｌｓ＋Ｒｓ）／２「４」＝Ｌｓ＋Ｒｓ「５」＝Ｌｓ−Ｒｓ「６」＝Ｌｆｅ−ａ×Ｃただし、０≦ａ≦１ …（１−１）このような６チャネル（ｃｈ）ミクス＆マトリクス回路
１’による相関式と符号化部２’の符号化方式は選択手
段７’で選択される。以下説明する図２、図３、図４、
図５及び図６でも同様であるので、これらの図では選択
手段７’を略すことにする。

【００１０】第１と第２の符号化部２’−１、２’−２
を有する符号化部２’は図７に詳しく示すようにこの６
ch「１」〜「６」のＰＣＭデータを予測符号化し、予測
符号化データを図８に示すようなビットストリームで記
録媒体５や通信媒体６を介して復号側に伝送する。復号
側では第１と第２の復号化部３’−１、３’−２を有す
る復号化部３’により、図１４に詳しく示すように６ch
「１」〜「６」の予測符号化データをＰＣＭデータに復
号し、次いでミクス＆マトリクス回路４’により式（１
−１）に基づいて元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒ
ｓ、Ｌｆｅ）のみを復元する。

【００１１】図２は第２の例の伝送形態として、マルチ
チャネルを圧縮するとともに再生側のダウンミクスを許
可する場合を示している。符号化側の６chミクス＆マト
リクス回路１’は、元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、
Ｒｓ、Ｌｆｅ）と係数ｍij（ｉ＝１，２，ｊ＝１，２〜
６）により次式（２）のようにステレオ２chデータ
（Ｌ、Ｒ）を生成（ダウンミクス）する。Ｌ＝ｍ11・Ｌｆ＋ｍ12・Ｒｆ＋ｍ13・Ｃ＋ｍ14・Ｌｓ＋ｍ15・Ｒｓ＋ｍ16・ＬｆｅＲ＝ｍ21・Ｌｆ＋ｍ22・Ｒｆ＋ｍ23・Ｃ＋ｍ24・Ｌｓ＋ｍ25・Ｒｓ＋ｍ26・Ｌｆｅ …（２）

【００１２】そして、式（２）と次式（１−２）により
次のような第１グループの２チャネル分の相関信号
「１」、「２」と第２グループの４チャネル分の相関信
号「３」〜「６」に変換し、それぞれ第１符号化部２’
−１、第２符号化部２’−２に出力する。「１」＝Ｌ＋Ｒ「２」＝Ｌ−Ｒ「３」〜「６」は式（１−１）と同じ …（１−２）

【００１３】第１、第２符号化部２’−１、２’−２は
それぞれ第１グループチャネル「１」、「２」と第２グ
ループチャネル「３」〜「６」のＰＣＭデータを予測符
号化し、各チャネルの予測符号化データを記録媒体５や
通信媒体６を介して復号側に伝送する。復号側では第
１、第２復号化部３’−１、３’−２により、それぞれ
第１グループチャネル「１」、「２」と第２グループチ
ャネル「３」〜「６」の予測符号化データをＰＣＭデー
タに復号し、次いでミクス＆マトリクス回路４’により
式（１−２）、（２）に基づいて元の６ch（Ｌｆ、Ｃ、
Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）を復元するとともに、第１
グループチャネル「１」、「２」を加算、減算すること
によりそれぞれステレオ２chデータ（Ｌ、Ｒ）を生成す
る。

【００１４】図３は第３の例の伝送形態として、マルチ
チャネルを圧縮しないで伝送するとともに再生側のダウ
ンミクスを禁止する場合を示している。この場合には、
非圧縮であるので、符号化側では相関信号も生成するこ
となく元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆ
ｅ）のＰＣＭデータをそのまま伝送し（ただし、フォー
マット化する）、復号化側ではデフォーマット化した
後、元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）
のみを復元する。

【００１５】図４は第４の例の伝送形態として、マルチ
チャネルを圧縮しないで伝送するとともに再生側のダウ
ンミクスを許可する場合を示している。この場合にも、
非圧縮であるので、符号化側では圧縮率を高めるための
相関信号も生成することなく元の６ch（Ｌｆ、Ｃ、Ｒ
ｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のＰＣＭデータをそのまま伝
送する（ただし、フォーマット化する）。復号化側では
デフォーマット化した後、元の６ch（Ｌｆ、Ｃ、Ｒｆ、
Ｌｓ、Ｒｓ、Ｌｆｅ）を復元するとともに、式（２）に
よりステレオ２chデータ（Ｌ、Ｒ）を生成（ダウンミク
ス）する。

【００１６】図５は図１においてマルチチャネルを圧縮
するとともに再生側のダウンミクスを禁止する場合の変
形例を示している。この場合には、符号化側では次式
（１−３）により６ch（１）〜（６）分の相関信号に変
換し、符号化部２’はこれを予測符号化する。そして、
復号化側では式（１−２）により元の６ch（Ｌｆ、Ｃ、
Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のみを復元する。「１」＝Ｌｆ−Ｃ「２」＝Ｒｆ−Ｃ「３」〜「６」は式（１−１）と同じ …（１−３）このように再生側のダウンミクスを禁止する場合は、こ
れに対応して式（２）のダウンミクス係数を符号化に加
えないとともに、符号化側で式（２）によりステレオ２
ｃｈデータ（Ｌ、Ｒ）を生成（ダウンミクス）すること
が禁じられる。

【００１７】図６は図２においてマルチチャネルを圧縮
するとともに再生側のダウンミクスを許可する場合の変
形例を示している。この場合には、符号化側では式
（２）によりステレオ２chデータ（Ｌ、Ｒ）を生成（ダ
ウンミクス）し、次いで次式（１−４）により次のよう
な第１グループの２チャネル「１」、「２」と第２グル
ープの４チャネル分の相関信号「３」〜「６」に変換
し、第１、第２符号化部２’−１、２’−２はこの各グ
ループチャネルを予測符号化する。そして、復号化側で
は式（１−４）、（２）により元の６ch（Ｌｆ、Ｃ、Ｒ
ｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）を復元するとともにステレオ
２chデータ（Ｌ、Ｒ）をそのまま出力する。「１」＝Ｌ「２」＝Ｒ「３」〜「６」は式（１−１）と同じ …（１−４）

【００１８】図７を参照して符号化部２’−１、２’−
２について詳しく説明する。各ch「１」〜「６」のＰＣ
Ｍデータは１フレーム毎に１フレームバッファ１０に格
納される。そして、１フレームの各ch「１」〜「６」の
サンプルデータがそれぞれ予測回路１３Ｄ１、１３Ｄ
２、１５Ｄ１〜１５Ｄ４に印加されるとともに、各ch
「１」〜「６」の各フレームの先頭サンプルデータがフ
ォーマット化回路１９に印加される。予測回路１３Ｄ
１、１３Ｄ２、１５Ｄ１〜１５Ｄ４はそれぞれ、各ch
「１」〜「６」のＰＣＭデータに対して、特性が異なる
複数の予測器（不図示）により時間領域における過去の
信号から現在の信号の複数の線形予測値を算出し、次い
で原ＰＣＭデータと、この複数の線形予測値から予測器
毎の予測残差を算出する。続くバッファ・選択器１４Ｄ
１、１４Ｄ２、１６Ｄ１〜１６Ｄ４はそれぞれ、予測回
路１３Ｄ１、１３Ｄ２、１５Ｄ１〜１５Ｄ４により算出
された各予測残差を一時記憶して、選択信号／ＤＴＳ
（デコーディング・タイム・スタンプ）生成器１７によ
り指定されたサブフレーム毎に予測残差の最小値を選択
する。

【００１９】選択信号／ＤＴＳ生成器１７は予測残差の
ビット数フラグをパッキング回路１８とフォーマット化
回路１９に対して印加し、また、予測残差が最小の予測
器を示す予測器選択フラグと、相関係数ａと、復号化側
が入力バッファ２２ａ（図１４）からストリームデータ
を取り出す時間を示すＤＴＳをフォーマット化回路１９
に対して印加する。パッキング回路１８はバッファ・選
択器１４Ｄ１、１４Ｄ２、１６Ｄ１〜１６Ｄ４により選
択された６ch分の予測残差を、選択信号／ＤＴＳ生成器
１７により指定されたビット数フラグに基づいて指定ビ
ット数でパッキングする。またＰＴＳ生成器１７ｃは、
復号化側が出力バッファ１１０（図１４）からＰＣＭデ
ータを取り出す時間を示すＰＴＳ（プレゼンテーション
・タイム・スタンプ）を生成してフォーマット化回路１
９に出力する。フォーマット化回路１９にはまた、圧縮
／非圧縮などを示す符号化モードと、ダウンミクス許可
／禁止を示す識別子が印加される。

【００２０】続くフォーマット化回路１９は図８〜図１
３に示すようなユーザデータにフォーマット化する。図
８に示すユーザデータ（サブパケット）は、前方グルー
プに関する２ch「１」、「２」の予測符号化データを含
む可変レートビットストリーム（サブストリーム）ＢＳ
０と、他のグループに関する４ch「３」〜「６」の予測
符号化データを含む可変レートビットストリーム（サブ
ストリーム）ＢＳ１と、サブストリームＢＳ０、ＢＳ１
の前に設けられたビットストリームヘッダ（リスタート
ヘッダ）により構成されている。

【００２１】また、サブストリームＢＳ０、ＢＳ１の１
フレーム分は・フレームヘッダと、・各ch「１」〜「６」の１フレームの先頭サンプルデー
タと、・各ch「１」〜「６」のサブフレーム毎の予測器選択フ
ラグと、・各ch「１」〜「６」のサブフレーム毎のビット数フラ
グと、・各ch「１」〜「６」の予測残差データ列（可変ビット
数）と、・ch「６」の係数ａとが、多重化されている。このよう
な予測符号化によれば、原信号が例えばサンプリング周
波数＝９６ｋＨｚ、量子化ビット数＝２４ビット、６チ
ャネルの場合、７１％の圧縮率を実現することができ
る。

【００２２】図７に示す符号化部２’−１、２’−２に
より予測符号化された可変レートビットストリームデー
タを、記録媒体の一例としてＤＶＤオーディオディスク
に記録する場合には、図９に示すオーディオ（Ａ）パッ
クにパッキングされる。このパックは２０３４バイトの
ユーザデータ（Ａパケット、Ｖパケット）に対して４バ
イトのパックスタート情報と、６バイトのＳＣＲ（Syst
em Clock Reference：システム時刻基準参照値）情報
と、３バイトのMux レート（rate）情報と１バイトのス
タッフィングの合計１４バイトのパックヘッダが付加さ
れて構成されている（１パック＝合計２０４８バイ
ト）。この場合、タイムスタンプであるＳＣＲ情報を、
先頭パックでは「１」として同一タイトル内で連続とす
ることにより同一タイトル内のＡパックの時間を管理す
ることができる。

【００２３】圧縮ＰＣＭのＡパケットは図１０に詳しく
示すように、１９又は１４バイトのパケットヘッダと、
圧縮ＰＣＭのプライベートヘッダと、図１１に示すフォ
ーマットの１ないし２０１１バイトのオーディオデータ
（圧縮ＰＣＭ）により構成されている。そして、ＤＴＳ
とＰＴＳは図５のパケットヘッダ内に（具体的にはパケ
ットヘッダの１０〜１４バイト目にＰＴＳが、１５〜１
９バイト目にＤＴＳが）セットされる。圧縮ＰＣＭのプ
ライベートヘッダは、・１バイトのサブストリームＩＤと、・２バイトのＵＰＣ／ＥＡＮ−ＩＳＲＣ（Universal Pr
oduct Code/European Article Number-International S
tandard Recording Code）番号、及びＵＰＣ／ＥＡＮ−
ＩＳＲＣデータと、・１バイトのプライベートヘッダ長と、・２バイトの第１アクセスユニットポインタと、・８バイトのオーディオデータ情報（ＡＤＩ）と、・０〜７バイトのスタッフィングバイトとに、より構成
されている。

【００２４】また、ＡＤＩ内に１秒後のアクセスユニッ
トをサーチするための前方アクセスユニット・サーチポ
インタと、１秒前のアクセスユニットをサーチするため
の後方アクセスユニット・サーチポインタがともに１バ
イトでセットされる。具体的にはＡＤＩの７バイト目に
前方アクセスユニット・サーチポインタが、８バイト目
に後方アクセスユニット・サーチポインタがセットされ
る。

【００２５】図１０に示す圧縮ＰＣＭ（ＰＰＣＭともい
う）のオーディオパケットにおけるオーディオデータエ
リアは、図１１に示すようにサブパケットと複数のＰＰ
ＣＭアクセスユニットにより構成され、ＰＰＣＭアクセ
スユニットはＰＰＣＭシンク情報とサブパケットにより
構成されている。最初のＰＰＣＭアクセスユニット内の
サブパケットは、ディレクトリと、サブストリーム
「０」と、ＣＲＣと、サブストリーム「１」と、ＣＲＣ
とエクストラ情報により構成され、サブストリーム
「０」、「１」はＰＰＣＭブロックのみにより構成され
ている。２番目以降のＰＰＣＭアクセスユニット内のサ
ブパケットは、ディレクトリを除いてサブストリーム
「０」と、ＣＲＣと、サブストリーム「１」と、ＣＲＣ
とエクストラ情報により構成され、サブストリーム
「０」、「１」はリスタートヘッダとＰＰＣＭブロック
により構成されている。

【００２６】ＰＰＣＭシンク情報（以下、同期情報とも
いう）は次の情報を含む。・１パケット当たりのサンプル数：サンプリング周波数
ｆｓに応じて４０、８０又は１６０が選択される。・データレート：ＶＢＲの場合には「０」（サブパケッ
ト内のデータが圧縮データであることを示す識別子）・サンプリング周波数ｆｓ及び量子化ビット数Ｑｂ・チャネル割り当て情報

【００２７】フォーマット化回路１９はまた、図８〜図
１１に示すオーディオパックを管理するために図１２、
図１３に示すような管理情報を含むＡＴＳＩ（オーディ
オ・タイトル・セット・インフォーメーション）をフォ
ーマット化する。図１２はＡＯＴＴ−ＡＯＢ−ＡＴＲ
（オーディオオンリタイトル・オーディオオブジェクト
セット・アトリビュート）を示し、このＡＯＴＴ−ＡＯ
Ｂ−ＡＴＲ（ｂ１２７〜ｂ０）は、ＭＳＢ側から順に・８ビット（ｂ１２７〜ｂ１２０）のオーディオ符号化
モードと、・８ビット（ｂ１１９〜ｂ１１２）の保留領域と、・４ビット（ｂ１１１〜ｂ１０８）のチャネルグループ
「１」の量子化ビット数Ｑ１と、・４ビット（ｂ１０７〜ｂ１０４）のチャネルグループ
「２」の量子化ビット数Ｑ２と、・４ビット（ｂ１０３〜ｂ１００）のチャネルグループ
「１」のサンプリング周波数ｆｓ１と、・４ビット（ｂ９９〜ｂ９６）のチャネルグループ
「２」のサンプリング周波数ｆｓ２と、・３ビット（ｂ９５〜ｂ９３）のマルチチャネル構造の
タイプと、・５ビット（ｂ９２〜ｂ８８）のチャネル割り当てと、・８ビット×１１（ｂ８７〜ｂ０）の保留領域により構
成されている。

【００２８】上記データを以下に詳しく示す。（１）オーディオ符号化モード（ｂ１２７〜ｂ１２０）００００００００ｂ：リニアＰＣＭモード０００００００１ｂ：圧縮ＰＣＭモードその他：その他の符号化モード用に保留

【００２９】（２）チャネルグループ１の量子化ビット
数Ｑ１（ｂ１１１〜ｂ１０８）００００ｂ：１６ビット０００１ｂ：２０ビット００１０ｂ：２４ビットその他：保留（３）チャネルグループ２の量子化ビット数Ｑ２（ｂ１
０７〜ｂ１０４）・チャネルグループ１の量子化ビット数Ｑ１が「０００
０ｂ」の場合には「００００ｂ」・チャネルグループ１の量子化ビット数Ｑ１が「０００
１ｂ」の場合には「００００ｂ」又は「０００１ｂ」・チャネルグループ１の量子化ビット数Ｑ１が「００１
０ｂ」の場合には「００００ｂ」、「０００１ｂ」又は
「００１０ｂ」ただし、００００ｂ：１６ビット０００１ｂ：２０ビット００１０ｂ：２４ビットその他：保留

【００３０】（４）チャネルグループ１のサンプリング
周波数ｆｓ１（ｂ１０３〜ｂ１００）００００ｂ：４８ｋＨｚ０００１ｂ：９６ｋＨｚ００１０ｂ：１９２ｋＨｚ１０００ｂ：４４．１ｋＨｚ１００１ｂ：８８．２ｋＨｚ１０１０ｂ：１７６．４ｋＨｚその他：保留

【００３１】（５）チャネルグループ２のサンプリング
周波数ｆｓ２（ｂ９９〜ｂ９６）・チャネルグループ１のサンプリング周波数ｆｓ１が
「００００ｂ」の場合には「００００ｂ」・チャネルグループ１のサンプリング周波数ｆｓ１が
「０００１ｂ」の場合には「００００ｂ」又は「０００
１ｂ」・チャネルグループ１のサンプリング周波数ｆｓ１が
「００１０ｂ」の場合には「００００ｂ」、「０００１
ｂ」又は「００１０ｂ」・チャネルグループ１のサンプリング周波数ｆｓ１が
「１０００ｂ」の場合には「１０００ｂ」・チャネルグループ１のサンプリング周波数ｆｓ１が
「１００１ｂ」の場合には「１０００ｂ」又は「１００
１ｂ」・チャネルグループ１のサンプリング周波数ｆｓ１が
「１０１０ｂ」の場合には「１０００ｂ」、「１００１
ｂ」又は「１０１０ｂ」

【００３２】（６）マルチチャネル構造のタイプ（ｂ９
５〜ｂ９３）０００ｂ：タイプ１その他：保留（７）チャネル割り当て（ｂ９２〜ｂ８８）１チャネル（モノラル）から６チャネルまでのグループ
「１」、「２」のチャネル割り当て情報

【００３３】図１３はＡＴＳ−ＰＧ−ＣＮＴ（オーディ
オタイトルセット・プログラム・コンテンツ）を示し、
これは先頭から順に・１ビット（ｂ３１）の、前回と今回のＰＧの関係（Ｒ
／Ａ）と、・１ビット（ｂ３０）のＳＴＣ不連続性フラグ（ＳＴＣ
−Ｆ）と、・３ビット（ｂ２９〜ｂ２７）のアトリビュート数（Ａ
ＴＲＮ）と、・３ビット（ｂ２６〜ｂ２４）のチャネルグループ（Ｃ
ｈＧｒ）「２」のビットシフトデータと、・２ビット（ｂ２３、ｂ２２）の保留領域と、・１ビット（ｂ２１）のダウンミックスモード（Ｄ−
Ｍ）と、・１ビット（ｂ２０）のダウンミックス係数の有効性
（図示※）と、・４ビット（ｂ１９〜ｂ１６）のダウンミックス係数テ
ーブル番号（ＤＭ−ＣＯＥＦＴＮ）と、・各々が１ビット、合計１６ビット（ｂ１５〜ｂ０）の
ＲＴＩフラグＦ１５〜Ｆ０により構成されている。そし
て、ビット（ｂ２１）のダウンミクスモード（Ｄ−Ｍ）
が「１」の場合に「ダウンミクス禁止」、「０」の場合
に「ダウンミクス許可」を表す。

【００３４】次に図１４を参照して復号化部３’（３’
−１、３’−２）について説明する。なお、この復号化
部３’（３’−１、３’−２）とミクス＆マトリクス回
路４’は、ハードウエアの他にコンピュータプログラム
よっても実現することができる。上記フォーマットの可
変レートビットストリームデータＢＳ０、ＢＳ１は、デ
フォーマット化回路２１により分離される。そして、各
ｃｈ「１」〜「６」の１フレームの先頭サンプルデータ
と予測器選択フラグはそれぞれ予測回路２４Ｄ１、２４
Ｄ２、２３Ｄ１〜２３Ｄ４に印加され、各ｃｈ「１」〜
「６」のビット数フラグはアンパッキング回路２２に印
加される。また、ＳＣＲと、ＤＴＳと予測残差データ列
は入力バッファ２２ａに印加され、ＰＴＳは出力バッフ
ァ１１０に印加される。また、圧縮／非圧縮などを示す
符号化モードと、ダウンミクス許可／禁止を示す識別子
は制御部１００に印加され、サンプリング周波数ｆｓ及
び量子化ビット数ＱｂはＤ／Ａ変換器１０２に印加され
る。ここで、予測回路２４Ｄ１、２４Ｄ２、２３Ｄ１〜
２３Ｄ４内の複数の予測器（不図示）はそれぞれ、符号
化側の予測回路１３Ｄ１、１３Ｄ２、１５Ｄ１〜１５Ｄ
４内の複数の予測器と同一の特性であり、予測器選択フ
ラグにより同一特性のものが選択される。

【００３５】デフォーマット化回路２１により分離され
たストリームデータ（予測残差データ列）は、図１５に
示すようにＳＣＲによりアクセスユニット毎に入力バッ
ファ２２ａに取り込まれて蓄積される。ここで、１つの
アクセスユニットのデータ量は、例えばｆｓ＝９６ｋＨ
ｚの場合には（１／９６ｋＨｚ）秒分であるが、図１
６、図１７（ａ）に詳しく示すように可変長である。そ
して、入力バッファ２２ａに蓄積されたストリームデー
タはＤＴＳに基づいてＦＩＦＯで読み出されてアンパッ
キング回路２２に印加される。

【００３６】アンパッキング回路２２は各ｃｈ「１」〜
「６」の予測残差データ列をビット数フラグ毎に基づい
て分離してそれぞれ予測回路２４Ｄ１、２４Ｄ２、２３
Ｄ１〜２３Ｄ４に出力する。予測回路２４Ｄ１、２４Ｄ
２、２３Ｄ１〜２３Ｄ４ではそれぞれ、アンパッキング
回路２２からの各ｃｈ「１」〜「６」の今回の予測残差
データと、内部の複数の予測器の内、予測器選択フラグ
により選択された各１つにより予測された前回の予測値
が加算されて今回の予測値が算出され、次いで１フレー
ムの先頭サンプルデータを基準として各サンプルのＰＣ
Ｍデータが算出されて出力バッファ１１０に蓄積され
る。出力バッファ１１０に蓄積されたＰＣＭデータはＰ
ＴＳに基づいて読み出されて出力され、したがって、図
１７（ａ）に示す可変長のアクセスユニットが伸長され
て、図１７（ｂ）に示す一定長のプレゼンテーションユ
ニットが出力される。

【００３７】また、ＰＰＣＭシンク情報内のサンプリン
グ周波数ｆｓ及び量子化ビット数Ｑｂに基づいて、ＰＣ
ＭデータがＤ／Ａ変換器１０２によりアナログ信号に変
換される。ここで、操作部１０１を介してサーチ再生が
指示された場合には、制御部１００により図５に示す前
方アクセスユニット・サーチポインタ（１秒先）と後方
アクセスユニット・サーチポインタ（１秒前）に基づい
てアクセスユニットを再生する。このサーチポインタと
しては、１秒先、１秒前の代わりに２秒先、２秒前のも
のでよい。

【００３８】符号化部２’（２’−１、２’−２）によ
り予測符号化された可変レートビットストリームデータ
をネットワークを介して伝送する場合には、符号化側で
は図１８に示すように伝送用にパケット化し（ステップ
Ｓ４１）、次いでパケットヘッダを付与し（ステップＳ
４２）、次いでこのパケットをネットワーク上に送り出
す（ステップＳ４３）。

【００３９】復号側では図１９（Ａ）に示すようにヘッ
ダを除去し（ステップＳ５１）、次いでデータを復元し
（ステップＳ５２）、次いでこのデータをメモリに格納
して復号を待つ（ステップＳ５３）。そして、復号を行
う場合には図１９（Ｂ）に示すように、デフォーマット
化を行い（ステップＳ６１）、次いで入力バッファ２２
ａの入出力制御を行い（ステップＳ６２）、次いでアン
パッキングを行う（ステップＳ６３）。なお、このと
き、サーチ再生指示がある場合にはサーチポインタをデ
コードする。次いで予測器をフラグに基づいて選択して
デコードを行い（ステップＳ６４）、次いで出力バッフ
ァ１１０の入出力制御を行い（ステップＳ６５）、次い
で元のマルチチャネルを復元し（ステップＳ６６）、次
いでこれを出力し（ステップＳ６７）、以下、これを繰
り返す。

【００４０】次に図２０、図２１を参照して別の例につ
いて説明する。上述の例では、１グループの相関性の信
号「１」〜「６」を予測符号化するように構成されてい
るが、この例では複数グループの相関性のある信号を生
成して予測符号化し、圧縮率が最も高いグループの予測
符号化データを選択するように構成されている。このた
め図２０に示す符号化部では、第１〜第ｎの相関回路１
−１〜１−ｎが設けられ、このｎ個の相関回路１−１〜
１−ｎは例えば６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌ
ｆｅ）のＰＣＭデータを、相関性が異なるｎ種類の６ch
信号「１」〜「６」に変換する。

【００４１】例えば第１の相関回路１−１は以下のよう
に変換し、（１）＝Ｌｆ（２）＝Ｃ−（Ｌｓ＋Ｒｓ）／２（３）＝Ｒｆ−Ｌｆ（４）＝Ｌｓ−ａ×Ｌｆｅ（５）＝Ｒｓ−ｂ×Ｒｆ（６）＝Ｌｆｅまた、第ｎの相関回路１−ｎは以下のように変換する。（１）＝Ｌｆ＋Ｒｆ（２）＝Ｃ−Ｌｆ（３）＝Ｒｆ−Ｌｆ（４）＝Ｌｓ−Ｌｆ（５）＝Ｒｓ−Ｌｆ（６）＝Ｌｆｅ−Ｃ

【００４２】また、相関回路１−１〜１−ｎ毎に予測回
路１５とバッファ・選択器１６が設けられ、グループ毎
の予測残差の最小値のデータ量に基づいて圧縮率が最も
高いグループが相関選択信号生成器１７ｂにより選択さ
れる。このとき、フォーマット化回路１９はその選択フ
ラグ（相関回路選択フラグ、その相関回路の相関係数
ａ、ｂ）を追加して多重化する。

【００４３】また、図２１に示す復号化側では、符号化
側の相関回路１−１〜１−ｎに対してｎ個の相関回路４
−１〜４−ｎ（又は係数ａ、ｂが変更可能な１つの相関
回路４）が設けられる。なお、図２０に示すｎグループ
の予測回路が同一の構成である場合、復号装置では図２
１に示すようにｎグループ分の予測回路を設ける必要は
なく、１つのグループ分の予測回路でよい。そして、符
号化装置から伝送された選択フラグに基づいて相関回路
４−１〜４−ｎの１つを選択、又は係数ａ、ｂを設定し
て元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）を
復元し、また、式（２）によりマルチチャネルをダウン
ミクスしてステレオ２chデータ（Ｌ、Ｒ）を生成する。

【００４４】また、先の第１の例では、１種類の相関性
の信号「１」〜「６」を予測符号化するように構成され
ているが、この信号「１」〜「６」のグループと原信号
（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のグループを
予測符号化し、圧縮率が高い方のグループを選択するよ
うにしてもよい。本発明によれば、特許請求の範囲に記
載した発明の他に、次のような発明が提供される。マル
チチャネルの音声信号が圧縮されたデータ又は圧縮され
ないデータを選択的にオーディオパケットに配置するフ
ォーマット化手段と、前記オーディオパケット内のマル
チチャネルデータが圧縮されているか否か、あるいは、
前記オーディオパケット内のマルチチャネルデータをス
テレオ２チャネルにダウンミクスすることを許可するか
又は禁止するかによってあらかじめダウンミクスして符
号化するか否か、あるいはダウンミクス係数を符号化す
るか否かを選択する手段とを、有する音声符号化装置。

【００４５】

【発明の効果】以上説明したように本発明によれば、例
えば、マルチチャネルデータが圧縮されているか否かを
示す識別子と、マルチチャネルデータをステレオ２チャ
ネルにダウンミクスすることを許可するか又は禁止する
かを示す識別子とを含むデータ構造に符号化するように
したので、正常に復号化して再生することができる。

【図面の簡単な説明】

【図１】本発明が適用されるマルチチャネルの伝送形態
の第１の例を示す説明図である。

【図２】本発明が適用されるマルチチャネルの伝送形態
の第２の例を示す説明図である。

【図３】本発明が適用されるマルチチャネルの伝送形態
の第３の例を示す説明図である。

【図４】本発明が適用されるマルチチャネルの伝送形態
の第４の例を示す説明図である。

【図５】図１の変形例を示す説明図である。

【図６】図２の変形例を示す説明図である。

【図７】図１の符号化部を詳しく示すブロック図であ
る。

【図８】図１、図７の符号化部により符号化されたビッ
トストリームを示す説明図である。

【図９】ＤＶＤのパックのフォーマットを示す説明図で
ある。

【図１０】ＤＶＤのオーディオパックのフォーマットを
示す説明図である。

【図１１】図１０のオーディオデータエリアのフォーマ
ットを詳しく示す説明図である。

【図１２】ＤＶＤオーディオのＡＯＴＴ−ＡＯＢ−ＡＴ
Ｒ（オーディオオンリタイトル・オーディオオブジェク
トセット・アトリビュート）を示す説明図である。

【図１３】ＤＶＤオーディオのＡＴＳ−ＰＧ−ＣＮＴ
（オーディオタイトルセット・プログラム・コンテン
ツ）を示す説明図である。

【図１４】図１の復号化部を詳しく示すブロック図であ
る。

【図１５】図１４の入力バッファの書き込み／読み出し
タイミングを示すタイミングチャートである。

【図１６】アクセスユニット毎の圧縮データ量を示す説
明図である。

【図１７】アクセスユニットとプレゼンテーションユニ
ットを示す説明図である。

【図１８】音声伝送方法を示すフローチャートである。

【図１９】音声伝送方法を示すフローチャートである。

【図２０】第２の例の音声符号化装置を示すブロック図
である。

【図２１】第２の例の音声復号装置を示すブロック図で
ある。

【符号の説明】

１’ ６chミクス＆マトリクス回路１３Ｄ１，１３Ｄ２，１５Ｄ１〜１５Ｄ４予測回路
（バッファ・選択器１４Ｄ１，１４Ｄ２，１６Ｄ１〜１６Ｄ４と共に圧縮手
段を構成する。）１４Ｄ１，１４Ｄ２，１６Ｄ１〜１６Ｄ４バッファ・
選択器１７選択信号／ＤＴＳ生成器１７ｃＰＴＳ生成器１９フォーマット化回路２１デフォーマット化回路（分離手段）２２アンパッキング回路２２ａ入力バッファ２４Ｄ１，２４Ｄ２，２３Ｄ１〜２３Ｄ４予測回路
（伸長手段）１００制御部（再生手段）１０２Ｄ／Ａ変換器１１０出力バッファ

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０３Ｍ 7/36 Ｇ１０Ｌ 9/18 ＭＨ０４Ｓ 3/00 7/04 Ｇ (72)発明者渕上徳彦神奈川県横浜市神奈川区守屋町３丁目12番地日本ビクター株式会社内Ｆターム(参考） 5D044 AB05 BC03 CC06 DE49 FG18 GK12 5D045 CB01 CC02 CC07 5J064 AA05 BB03 BC01 BC25 BC27 BD01

Claims

【特許請求の範囲】

【請求項１】マルチチャネルの音声信号を、そのままの
チャネル又は互いに相関あるチャネル毎に、入力される
音声信号に応答して先頭サンプル値を得ると共に、時間
領域の過去の信号から予測される現在の信号の複数の予
測値の中でその予測残差が最小となるような線形予測方
法を選択して圧縮する手段と、前記ステップにより選択された先頭サンプル値と予測残
差と線形予測方法とを含む圧縮データを格納するサブパ
ケットと、前記サブパケットに対応して設けられその同
期情報を含む同期情報部と、から一つのアクセスユニッ
トを形成し、前記同期情報部に圧縮データのチャネル数
を示し、再生側においてそのチャネル数に応じた復号処
理を行うために用いられるチャネル割り当て情報を収納
するようにしたオーディオパケットと、前記オーディオパケット内のデータが前記圧縮方法によ
り圧縮されていることを示す第１の識別子と、前記オー
ディオパケットに格納されたマルチチャネルデータをス
テレオ２チャネルにダウンミクスすることを許可するか
又は禁止するかを示す第２の識別子と、ダウンミクス係
数の識別情報とが配置された管理情報とを、有するデー
タ構造にフォーマット化する手段と、からなる音声符号
化装置。
【請求項２】請求項１記載の音声符号化装置によりフォ
ーマット化されたデータ構造のデータを復号する音声復
号化装置であって、前記データをオーディオパケットと管理情報に分離する
手段と、前記管理情報から第１の識別子と第２の識別子を抽出す
る手段と、前記オーディオパケット内の同期情報部に含まれるチャ
ネル割り当て情報に基づいて、前記抽出された第２の識
別子がダウンミクスすることを許可する場合に前記サブ
パケット内の圧縮データを前記抽出された第１の識別子
に基づいて選択的に伸長するか又は伸長しないで復号し
マルチチャネルとステレオ２チャネルの少なくともいず
れかで取り出し、前記第２の識別子がダウンミクスする
ことを禁止する場合には前記サブパケット内の圧縮デー
タを前記第１の識別子に基づいて選択的に伸長するか又
は伸長しないで復号しマルチチャネルのみで取り出す手
段と、からなる音声復号化装置。