JP3344571B2

JP3344571B2 - 記録媒体、音声復号装置

Info

Publication number: JP3344571B2
Application number: JP32595899A
Authority: JP
Inventors: 美昭田中; 昭治植野; 徳彦渕上
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 1998-11-16
Filing date: 1999-11-16
Publication date: 2002-11-11
Anticipated expiration: 2019-11-16
Also published as: JP2000214895A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、マルチチャネルの
音声信号を圧縮して記録した記録媒体及び音声復号装置
に関する。

【０００２】

【従来の技術】音声信号を圧縮する方法として、本発明
者は先の出願（特願平９−２８９１５９号）において１
チャネルの原デジタル音声信号に対して、特性が異なる
複数の予測器により時間領域における過去の信号から現
在の信号の複数の線形予測値を算出し、原デジタル音声
信号と、この複数の線形予測値から予測器毎の予測残差
を算出し、予測残差の最小値を選択する予測符号化方法
を提案している。

【０００３】なお、上記方法では原デジタル音声信号が
サンプリング周波数＝９６ｋＨｚ、量子化ビット数＝２
０ビット程度の場合にある程度の圧縮効果を得ることが
できるが、近年のＤＶＤオーディオディスクではこの２
倍のサンプリング周波数（＝１９２ｋＨｚ）が使用さ
れ、また、量子化ビット数も２４ビットが使用される傾
向がある。

【０００４】

【発明が解決しようとする課題】上記したように、ＤＶ
Ｄオーディオの場合、サンプリング周波数も高く、しか
も、マルチチャンネル信号を扱うためデータ量も多くな
り、より圧縮効率の改善が望まれていると共に、再生時
のことを考慮すると、圧縮されたデータをより正確に復
号することが望まれている。そこで、本願各発明では、
そのような点を考慮して圧縮効率を改善すると共に、よ
り正確な復号ができるデータを記録した記録媒体及び音
声復号装置を提供することを目的とする。

【０００５】本発明は上記目的を達成するために、以下
の１）〜４）の手段からなるものである。すなわち、

【０００６】１）マルチチャネルの音声信号を、そのま
まのチャネル又は互いに相関をとったチャネル毎に入力
される音声信号に応答して先頭サンプル値を得ると共
に、特性が異なる複数の線形予測方法により時間領域の
過去から現在の信号の線形予測値がそれぞれ予測され、
その予測される線形予測値と前記音声信号とから得られ
る予測残差が最小となるような線形予測方法を選択して
予測符号化するステップと、前記ステップにより選択さ
れたチャネル毎の線形予測方法と予測残差と所定の先頭
サンプル値を含む予測符号化データを格納するサブスト
リームを有するサブパケットと、そのサブパケットに対
応して設けられその同期情報を含む同期情報部とから一
つのアクセスユニットを形成し、前記サブパケット内に
前記アクセスユニットの数個毎に再生側において元の音
声信号を復元する際に必要なリスタート情報を含むリス
タート情報部を設けたデータ構造にフォーマット化する
ステップとにより、前記データ構造にフォーマット化さ
れたデータが記録され、その記録されたデータうち前記
予測符号化データは元の音声信号を復元するために用い
られる予測値を算出するためのデータとして記録される
ことを特徴とする記録媒体。２）請求項１記載のサブパケット及び同期情報部と、更
にＳＣＲ情報を含むパックヘッダと、を含んで一つのパ
ックとしてフォーマット化されて記録されると共に、前
記ＳＣＲ情報は、前記パックを再生する際の時間管理情
報として用いられることを特徴とする記録媒体。３）請求項１記載の記録媒体に記録されたデータから元
のマルチチャネルの音声信号を復号する音声復号装置で
あって、前記データ構造をサブパケットと同期情報部に
分離する手段と、前記サブパケット内の圧縮データを前
記リスタート情報部内の情報に基づいてチャネル毎に伸
長する伸長手段と、前記伸長された音声データから前記
マルチチャンネルの音声信号に変換する手段と、前記変
換されたマルチチャンネル音声データを前記同期情報部
内のサンプリング周波数及び量子化ビット数に基づいて
アナログ音声信号に変換する手段とを、有する音声復号
装置。４）請求項２記載の記録媒体に記録されたデータから元
のマルチチャネルの音声信号を復号する音声復号装置で
あって、前記パックヘッダに含まれるＳＣＲ情報を分離
する第１の分離手段と、前記分離されたＳＣＲ情報に基
づいて前記サブパケット及び同期情報部を保持するため
のバッファと、前記バッファに保持された前記サブパケ
ットと同期情報部とを分離する第２の分離手段と、前記
サブパケット内の圧縮データを前記リスタート情報部内
の情報に基づいてチャネル毎に伸長する伸長手段と、前
記伸長された音声データから前記マルチチャンネルの音
声信号に変換する手段と、前記変換されたマルチチャン
ネル音声データを前記同期情報部内のサンプリング周波
数及び量子化ビット数に基づいてアナログ音声信号に変
換する手段とを、有する音声復号装置。

【０００７】

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図１は本発明が適用される音声符
号化装置及び音声復号装置の第１の実施形態を示すブロ
ック図、図２は図１の符号化部を詳しく示すブロック
図、図３は図１、図２の符号化部により符号化されたビ
ットストリームを示す説明図、図４はＤＶＤのパックの
フォーマットを示す説明図、図５はＤＶＤのオーディオ
パックのフォーマットを示す説明図、図６は図５のオー
ディオデータエリアのフォーマットを詳しく示す説明
図、図７は図１の復号化部を詳しく示すブロック図、図
８は図７の入力バッファの書き込み／読み出しタイミン
グを示すタイミングチャート、図９はアクセスユニット
毎の圧縮データ量を示す説明図、図１０はアクセスユニ
ットとプレゼンテーションユニットを示す説明図であ
る。

【０００８】ここで、マルチチャネル方式としては、例
えば次の４つの方式が知られている。（１）４チャネル方式ドルビーサラウンド方式の
ように、前方Ｌ、Ｃ、Ｒの３チャネル＋後方Ｓの１チャ
ネルの合計４チャネル（２）５チャネル方式ドルビーＡＣ−３方式のＳ
Ｗチャネルなしのように、前方Ｌ、Ｃ、Ｒの３チャネル
＋後方ＳＬ、ＳＲの２チャネルの合計５チャネル（３）６チャネル方式ＤＴＳ（Digital Theater
System）方式や、ドルビーＡＣ−３方式のように６チャ
ネル（Ｌ、Ｃ、Ｒ、ＳＷ（Ｌｆｅ）、ＳＬ、ＳＲ）（４）８チャネル方式ＳＤＤＳ（Sony Dynamic D
igital Sound）方式のように、前方Ｌ、ＬＣ、Ｃ、Ｒ
Ｃ、Ｒ、ＳＷの６チャネル＋後方ＳＬ、ＳＲの２チャネ
ルの合計８チャネル

【０００９】図１に示す符号化側の６チャネル（ch）ミ
クス＆マトリクス回路１’は、マルチチャネル信号の一
例としてフロントレフト（Ｌｆ）、センタ（Ｃ）、フロ
ントライト（Ｒｆ）、サラウンドレフト（Ｌｓ）、サラ
ウンドライト（Ｒｓ）及びＬｆｅ（Low Frequency Effe
ct）の６chのＰＣＭデータを次式（１）により前方グル
ープに関する２ch「１」、「２」と他のグループに関す
る４ch「３」〜「６」に分類して変換し、２ch「１」、
「２」を第１符号化部２’−１に、また、４ch「３」〜
「６」を第２符号化部２’−２に出力する。

【００１０】「１」＝Ｌｆ＋Ｒｆ「２」＝Ｌｆ−Ｒｆ「３」＝Ｃ−（Ｌｓ＋Ｒｓ）／２「４」＝Ｌｓ＋Ｒｓ「５」＝Ｌｓ−Ｒｓ「６」＝Ｌｆｅ−ａ×Ｃただし、０≦ａ≦１ …（１）

【００１１】符号化部２’を構成する第１及び第２符号
化部２’−１、２’−２はそれぞれ、図２に詳しく示す
ように２ch「１」、「２」と４ch「３」〜「６」のＰＣ
Ｍデータをチャネル毎に予測符号化し、予測符号化デー
タを図３に示すようなビットストリームで記録媒体５や
衛星回線や電話回線等の通信媒体６を介して復号側に伝
送する。復号側では復号化部３’を構成する第１及び第
２復号化部３’−１、３’−２により、図７に詳しく示
すようにそれぞれ前方グループに関する２ch「１」、
「２」と他のグループに関する４ch「３」〜「６」の予
測符号化データをチャネル毎にＰＣＭデータに復号す
る。

【００１２】次いでミクス＆マトリクス回路４’により
式（１）に基づいて元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、
Ｒｓ、Ｌｆｅ）を復元するとともに、この元の６chと係
数ｍij（ｉ＝１，２，ｊ＝１，２〜６）により次式
（２）のようにステレオ２chデータ（Ｌ、Ｒ）を生成す
る。Ｌ＝ｍ11・Ｌｆ＋ｍ12・Ｒｆ＋ｍ13・Ｃ＋ｍ14・Ｌｓ＋ｍ15・Ｒｓ＋ｍ16・ＬｆｅＲ＝ｍ21・Ｌｆ＋ｍ22・Ｒｆ＋ｍ23・Ｃ＋ｍ24・Ｌｓ＋ｍ25・Ｒｓ＋ｍ26・Ｌｆｅ …（２）

【００１３】図２を参照して符号化部２’−１、２’−
２について詳しく説明する。各ch「１」〜「６」のＰＣ
Ｍデータは１フレーム毎に１フレームバッファ１０に格
納される。そして、１フレームの各ch「１」〜「６」の
サンプルデータがそれぞれ予測回路１３Ｄ１、１３Ｄ
２、１５Ｄ１〜１５Ｄ４に印加されるとともに、各ch
「１」〜「６」の各フレームの先頭サンプルデータ（後
述のリスタートヘッダ内に格納される）がアンパッキン
グ回路８及びフォーマット化回路１９に印加される。ま
た、ＰＣＭデータがＡ／Ｄ変換されたときのサンプリン
グ周波数（ｆｓ）と量子化ビット数（Ｑｂ）がパッキン
グ回路１８及びフォーマット化回路１９に印加される。
予測回路１３Ｄ１、１３Ｄ２、１５Ｄ１〜１５Ｄ４はそ
れぞれ、各ch「１」〜「６」のＰＣＭデータに対して、
特性が異なる複数の予測器（不図示）により時間領域に
おける過去の信号から現在の信号の複数の線形予測値を
算出し、次いで原ＰＣＭデータと、この複数の線形予測
値から予測器毎の予測残差を算出する。続くバッファ・
選択器１４Ｄ１、１４Ｄ２、１６Ｄ１〜１６Ｄ４はそれ
ぞれ、予測回路１３Ｄ１、１３Ｄ２、１５Ｄ１〜１５Ｄ
４により算出された各予測残差を一時記憶して、選択信
号／ＤＴＳ（デコーディング・タイム・スタンプ）生成
器１７により指定されたサブフレーム毎に予測残差の最
小値を選択する。

【００１４】選択信号／ＤＴＳ生成器１７は予測残差の
ビット数フラグをパッキング回路１８とフォーマット化
回路１９に対して印加し、また、予測残差が最小の予測
器を示す予測器選択フラグと、式（１）における相関係
数ａと、復号化側が入力バッファ２２ａ（図７）からス
トリームデータを取り出す時間を示すＤＴＳをフォーマ
ット化回路１９に対して印加する。パッキング回路１８
はバッファ・選択器１４Ｄ１、１４Ｄ２、１６Ｄ１〜１
６Ｄ４により選択された６ch分の予測残差を、選択信号
／ＤＴＳ生成器１７により指定されたビット数フラグに
基づいて指定ビット数でパッキングし、サンプリング周
波数ｆｓに応じたサンプル数でパッキングする。すなわ
ち、サンプリング周波数４８ｋＨｚの場合にはサンプル
数４０を選び、サンプリング周波数９６ｋＨｚの場合に
はサンプル数８０を選び、、１９２ｋＨｚの場合にはサ
ンプル数８０を選ぶようになっている。またＰＴＳ生成
器１７ｃは、復号化側が出力バッファ１１０（図７）か
らＰＣＭデータを取り出す時間を示すＰＴＳ（プレゼン
テーション・タイム・スタンプ）を生成してフォーマッ
ト化回路１９に出力する。

【００１５】続くフォーマット化回路１９は図３〜図６
に示すようなユーザデータにフォーマット化する。図３
に示すユーザデータ（サブパケット）は、前方グループ
に関する２ch「１」、「２」の予測符号化データを含む
可変レートビットストリーム（サブストリーム）ＢＳ０
と、他のグループに関する４ch「３」〜「６」の予測符
号化データを含む可変レートビットストリーム（サブス
トリーム）ＢＳ１と、サブストリームＢＳ０、ＢＳ１の
前に設けられたビットストリームヘッダ（リスタートヘ
ッダ）により構成されている。また、サブストリームＢ
Ｓ０、ＢＳ１の１フレーム分は・フレームヘッダと、・各ch「１」〜「６」の１フレームの先頭サンプルデー
タと、・各ch「１」〜「６」のサブフレーム毎の予測器選択フ
ラグと、・各ch「１」〜「６」のサブフレーム毎のビット数フラ
グと、・各ch「１」〜「６」の予測残差データ列（可変ビット
数）と、・ch「６」の係数ａとが、多重化されている。このような予測符号化によれば、原
信号が例えばサンプリング周波数（ｆｓ）＝９６ｋＨ
ｚ、量子化ビット数（Ｑｂ）＝２４ビット、６チャネル
の場合、７１％の圧縮率を実現することができる。

【００１６】図２に示す符号化部２’−１、２’−２に
より予測符号化された可変レートビットストリームデー
タを、記録媒体の一例としてＤＶＤオーディオディスク
に記録する場合には、図４に示すオーディオ（Ａ）パッ
クにパッキングされる。このパックは２０３４バイトの
ユーザデータ（Ａパケット、Ｖパケット）に対して４バ
イトのパックスタート情報と、６バイトのＳＣＲ（Syst
em Clock Reference：システム時刻基準参照値）情報
と、３バイトのMux レート（rate）情報と１バイトのス
タッフィングの合計１４バイトのパックヘッダが付加さ
れて構成されている（１パック＝合計２０４８バイ
ト）。この場合、タイムスタンプであるＳＣＲ情報を、
先頭パックでは「１」として同一タイトル内で連続とす
ることにより同一タイトル内のＡパックの時間を管理す
ることができる。

【００１７】圧縮ＰＣＭのＡパケットは図５に詳しく示
すように、９〜２２バイトのパケットヘッダと、圧縮Ｐ
ＣＭのプライベートヘッダと、図３に示すフォーマット
の１ないし２０１５バイトのオーディオデータ（圧縮Ｐ
ＣＭ）により構成されている。そして、ＤＴＳとＰＴＳ
は図５のパケットヘッダ内に（具体的にはパケットヘッ
ダの１０〜１４バイト目にＰＴＳが、１５〜１９バイト
目にＤＴＳが）セットされる。圧縮ＰＣＭのプライベー
トヘッダは、・１バイトのサブストリームＩＤと、・２バイトのＵＰＣ／ＥＡＮ−ＩＳＲＣ（Universal Pr
oduct Code/European Article Number-International S
tandard Recording Code）番号、及びＵＰＣ／ＥＡＮ−
ＩＳＲＣデータと、・１バイトのプライベートヘッダ長と、・２バイトの第１アクセスユニットポインタと、・４バイトのオーディオデータ情報（ＡＤＩ）と、・０〜７バイトのスタッフィングバイトとに、より構成
されている。

【００１８】そして、ＡＤＩ内に１秒後のアクセスユニ
ットをサーチするための前方アクセスユニット・サーチ
ポインタと、１秒前のアクセスユニットをサーチするた
めの後方アクセスユニット・サーチポインタがともに１
バイトでセットされる。具体的には、ＡＤＩの１バイト
目に前方アクセスユニット・サーチポインタが、８バイ
ト目に後方アクセスユニット・サーチポインタがセット
される。このようにＡＤＩは、圧縮ＰＣＭでは４バイト
に減少させるためオーディオデータを２０１５バイトま
で収納できる。

【００１９】図５に示す圧縮ＰＣＭ（ＰＰＣＭ）のオー
ディオパケットにおけるオーディオデータエリアは、図
６に示すように複数のＰＰＣＭアクセスユニットにより
構成され、ＰＰＣＭアクセスユニットはＰＰＣＭシンク
情報とサブパケットにより構成されている。最初のＰＰ
ＣＭアクセスユニット内のサブパケットは、ディレクト
リと、サブストリーム「ＢＳ０」と、ＣＲＣ（１バイト
又は２バイト）と、サブストリーム「ＢＳ１」と、ＣＲ
Ｃとエクストラ情報により構成され、サブストリーム
「ＢＳ０」、「ＢＳ１」はＰＰＣＭブロックのみにより
構成されている。２番目以降のＰＰＣＭアクセスユニッ
ト内のサブパケットも、ディレクトリと、サブストリー
ム「ＢＳ０」と、ＣＲＣと、サブストリーム「ＢＳ１」
と、ＣＲＣとエクストラ情報により構成され、サブスト
リーム「ＢＳ０」、「ＢＳ１」はリスタートヘッダとＰ
ＰＣＭブロックにより構成されている。このリスタート
ヘッダには前述のフレーム先頭サンプル値が格納され、
このリスタートヘッダは一アクセスユニット毎に設けら
れるのではなく、数個毎のアクセスユニットに一つ設け
られるようになっている。そして、エクストラ情報は、
少なくとも、サイズ調整機能を有している。すなわち、
入来データが固定レート（ＣＢＲ）の場合には、上述し
たようにサンプリング周波数ｆｓによって１パケット当
たりのサンプリング数が４０，８０，１６０のいずれか
に定められており、そのため、決定されたサンプリング
数によっては１パケット当たりのデータ長とサブパケッ
トのサイズとが合わない場合があり、それをサブパケッ
トのサイズに合わせるために、例えば、０，０…等を付
加してサイズ調整を行う。また、このサイズ調整用のデ
ータはテキストデータ等を利用することも可能である。

【００２０】ＰＰＣＭシンク情報（以下、同期情報とも
いう）は次の情報を含む。・１パケット当たりのサンプル数：サンプリング周波数
ｆｓに応じて４０、８０又は１６０が選択される。・データレートがＶＢＲの場合には「０」（サブパケッ
ト内のデータがＶＢＲの圧縮データであることを示す識
別子）、ＣＢＲの場合には「１」（サブパケット内のデ
ータが固定レートであることを示す識別子）・サンプリング周波数ｆｓ及び量子化ビット数Ｑｂ・チャネル割り当て情報

【００２１】次に図７を参照して復号化部３’−１、
３’−２について説明する。上記フォーマットのパック
ヘッダと可変レートビットストリームデータＢＳ０、Ｂ
Ｓ１は、デフォーマット化回路２１により分離される。
そして、各ｃｈ「１」〜「６」の１フレームの先頭サン
プルデータ含むリスタートヘッダ、予測器選択フラグ、
各ｃｈ「１」〜「６」のビット数フラグ、ＳＣＲ、ＤＴ
Ｓ、チャンネル割り当て情報及び予測残差データ列が入
力バッファ２２ａに印加され、ＰＴＳは出力バッファ１
１０に印加される。そして、これらの情報はアンパッキ
ング回路２２に印加され、チャンネル割り当て情報に応
じて使用される各予測回路２４Ｄ１，２４Ｄ２，２３Ｄ
１〜２３Ｄ４が決定されるようになっている。例えば、
６チャンネルの割り当て情報であれば、全部の予測回路
が使用され、６チャンネルのデータが繰り返し供給さ
れ、５チャンネルの割り当て情報であれば、５チャンネ
ルのデータが繰り返し供給されるよになっている。ま
た、割り当て情報はマルチチャンネルの情報だけに限ら
ず、ステレオ２チャンネルの情報の場合もあり得、その
場合には予測回路２４Ｄ１，２４Ｄ２が使用される。ま
た、データレートがＶＢＲかＣＢＲかを示す識別子は各
予測器２４Ｄ１、２４Ｄ２、２３Ｄ１、２３Ｄ２、２３
Ｄ３、２３Ｄ４に印加され、これらにおいて識別子に応
じた入出力データの処理プログラムが決定されてデータ
の取り込み速度の制御がなされることになる。ＶＢＲで
ある場合には処理プログラムを切り換えると共に入力デ
ータを毎回ロードする必要があり処理に時間を要するこ
とになるが、ＣＢＲの場合には固定レートであることか
ら処理プログラムを切り換える必要がなく処理が速くな
る。そして、選択された各予測器ではリスタートヘッダ
内のフレーム先頭サンプル値に基づいて予測算差が計算
されることになる。また、サンプリング周波数ｆｓ及び
量子化ビット数ＱｂはＤ／Ａ変換器１０２に印加され
る。ここで、予測回路２４Ｄ１、２４Ｄ２、２３Ｄ１〜
２３Ｄ４内の複数の予測器（不図示）はそれぞれ、符号
化側の予測回路１３Ｄ１、１３Ｄ２、１５Ｄ１〜１５Ｄ
４内の複数の予測器と同一の特性であり、予測器選択フ
ラグにより同一特性のものが選択される。

【００２２】デフォーマット化回路２１により、最初オ
ーディオパックからオーディオパケットが分離され、次
にオーディオパケットからストリームデータ（予測残差
データ列）が分離されてビットストリームＢＳ０とＢＳ
１が取り出される。またＳＣＲが取り出され、図８に示
すようにＳＣＲによるタイミングにしたがってアクセス
ユニット毎に入力バッファ２２ａに取り込まれて蓄積さ
れる。ここで、１つのアクセスユニットのデータ量は、
例えばｆｓ＝９６ｋＨｚの場合には（１／９６ｋＨｚ）
秒分であるが、図９、図１０（ａ）に詳しく示すように
可変長である。そして、入力バッファ２２ａに蓄積され
たストリームデータはＤＴＳに基づいてＦＩＦＯで読み
出されてアンパッキング回路２２に印加される。

【００２３】アンパッキング回路２２は各ｃｈ「１」〜
「６」の予測残差データ列をビット数フラグ毎に基づい
て分離してそれぞれ予測回路２４Ｄ１、２４Ｄ２、２３
Ｄ１〜２３Ｄ４に出力する。予測回路２４Ｄ１、２４Ｄ
２、２３Ｄ１〜２３Ｄ４ではそれぞれ、アンパッキング
回路２２からの各ｃｈ「１」〜「６」の今回の予測残差
データと、内部の複数の予測器の内、予測器選択フラグ
により選択された各１つにより予測された前回の予測値
が加算されて今回の予測値が算出され、次いで１フレー
ムの先頭サンプルデータを基準として各サンプルのＰＣ
Ｍデータが算出されて出力バッファ１１０に蓄積され
る。出力バッファ１１０に蓄積されたＰＣＭデータはＰ
ＴＳに基づいて読み出されて出力され、したがって、図
１０（ａ）に示す可変長のアクセスユニットが伸長され
て、図１０（ｂ）に示す一定長のプレゼンテーションユ
ニットが出力される。

【００２４】また、ＰＰＣＭシンク情報内のサンプリン
グ周波数ｆｓ及び量子化ビット数Ｑｂに基づいて、ＰＣ
ＭデータがＤ／Ａ変換器１０２によりアナログ信号に変
換される。また、同時にＰＰＣＭシンク情報においてＣ
ＢＲの識別子が検出され、ディレクトリ内のエクストラ
データの位置が検出されて、更に例えば０，０…のデー
タや、テキストデータ等のサイズ調整用のエクストラデ
ータが検出されると、それがテキストデータである場合
にはエクストラデータをこのアンパッキング回路２２か
ら図示しないテキストデータデコード回路に供給し、そ
こで、デコード処理をしてテキストデータとして取り出
し、出力バッファ１１０を通じて出力されることにな
る。また一方、エクストラデータが０，０…データであ
った場合には、何の処理も施されないようになってい
る。また、テキストデータデコーダ回路が用意されてい
ない場合には、この処理はパスされる。また、ここで、
操作部１０１を介してサーチ再生が指示された場合に
は、制御部１００により図５に示す前方アクセスユニッ
ト・サーチポインタ（１秒先）と後方アクセスユニット
・サーチポインタ（１秒前）に基づいてアクセスユニッ
トを再生する。このサーチポインタとしては、１秒先、
１秒前の代わりに２秒先、２秒前のものでよい。

【００２５】図２に示す符号化部２’−１、２’−２に
より予測符号化された可変レートビットストリームデー
タをネットワークを介して伝送する場合には、符号化側
では図１１に示すように伝送用にパケット化し（ステッ
プＳ４１）、次いでパケットヘッダを付与し（ステップ
Ｓ４２）、次いでこのパケットをネットワーク上に送り
出す（ステップＳ４３）。

【００２６】復号側では図１２（Ａ）に示すようにヘッ
ダを除去し（ステップＳ５１）、次いでデータを復元し
（ステップＳ５２）、次いでこのデータをメモリに格納
して復号を待つ（ステップＳ５３）。そして、復号を行
う場合には図１２（Ｂ）に示すように、デフォーマット
化を行い（ステップＳ６１）、次いで入力バッファ２２
ａの入出力制御を行い（ステップＳ６２）、次いでアン
パッキングを行う（ステップＳ６３）。なお、このと
き、サーチ再生指示がある場合にはサーチポインタをデ
コードする。次いで予測器をフラグに基づいて選択して
デコードを行い（ステップＳ６４）、次いで出力バッフ
ァ１１０の入出力制御を行い（ステップＳ６５）、次い
で元のマルチチャネルを復元し（ステップＳ６６）、次
いでこれを出力し（ステップＳ６７）、以下、これを繰
り返す。

【００２７】なお、上記実施形態では、前方グループに
関する２ch「１」、「２」を「１」＝Ｌｆ＋Ｒｆ「２」＝Ｌｆ−Ｒｆにより変換して予測符号化したが、代わりに式（２）に
よりマルチチャネルをダウンミクスしてステレオ２chデ
ータ（Ｌ、Ｒ）を生成し、次いで次式（１）’ 「１」＝Ｌ＋Ｒ「２」＝Ｌ−Ｒ「３」〜「５」は同じ「６」＝Ｌｆｅ−Ｃ …（１）’ により変換して予測符号化するようにしてもよい（第２
の実施形態）。この場合には、復号化側のミクス＆マト
リクス回路４’はチャネル「１」、「２」を加算するこ
とによりチャネルＬを、減算することによりチャネルＲ
を生成することができる。

【００２８】また、第３の実施形態として図１３に示す
ように、２ch「１」、「２」の代わりに式（２）により
マルチチャネルをダウンミクスしてステレオ２chデータ
（Ｌ、Ｒ）を生成して、このステレオ２ch（Ｌ、Ｒ）と
４ch「３」〜「６」を予測符号化するようにしてもよ
い。なお、第２、第３の実施形態では、フロントレフト
（Ｌｆ）とフロントライト（Ｒｆ）が復号化側に伝送さ
れないので、復号化側ではこれを式（１）、（２）によ
り生成する。

【００２９】次に図１４、図１５、図１６を参照して第
４の実施形態について説明する。上記の実施形態では、
１グループの相関性の信号「１」〜「６」を予測符号化
するように構成されているが、この第４の実施形態では
複数グループの相関性のある信号を生成して予測符号化
し、圧縮率が最も高いグループの予測符号化データを選
択するように構成されている。また、この実施例ではそ
の１グループ内における符号化は、前述の各実施例の場
合のように前方グループに関する２ｃｈと他のグループ
に関する４ｃｈに分類して変換するようなことはせず
に、一つにまとめた符号化処理が行われる構成で、図１
４は前述の図１に対応した図として示してある。また、
図１５は符号化部の詳細ブロックを示すものであるが、
本実施例の場合にはｎ個の相関回路１−１〜１−ｎまで
が、ミクス＆マトリクス回路１’側に設けられている。
これらｎ個の相関回路１−１〜１−ｎは例えば６ch（Ｌ
ｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のＰＣＭデータ
を、相関性が異なるｎ種類の６ch信号「１」〜「６」に
変換する。

【００３０】例えば第１の相関回路１−１は以下のよう
に変換し、「１」＝Ｌｆ「２」＝Ｃ−（Ｌｓ＋Ｒｓ）／２「３」＝Ｒｆ−Ｌｆ「４」＝Ｌｓ−ａ×Ｌｆｅ「５」＝Ｒｓ−ｂ×Ｒｆ「６」＝Ｌｆｅまた、第ｎの相関回路１−ｎは以下のように変換する。「１」＝Ｌｆ＋Ｒｆ「２」＝Ｃ−Ｌｆ「３」＝Ｒｆ−Ｌｆ「４」＝Ｌｓ−Ｌｆ「５」＝Ｒｓ−Ｌｆ「６」＝Ｌｆｅ−Ｃ

【００３１】また、相関回路１−１〜１−ｎ毎に予測回
路１５とバッファ・選択器１６が設けられ、グループ毎
の予測残差の最小値のデータ量に基づいて圧縮率が最も
高いグループが相関選択信号生成器１７ｂにより選択さ
れる。このとき、フォーマット化回路１９はその選択フ
ラグ（相関回路選択フラグ、その相関回路の相関係数
ａ、ｂ）を追加して多重化する。

【００３２】そして、図１６は前述の図６に対応したデ
ータエリアを示し、この実施例ではサブストリーム「Ｂ
Ｓ１」を用いず、サブストリーム「ＢＳ０」のみで構成
することになる。

【００３３】また、図１７に示す復号化側では、符号化
側の相関回路１−１〜１−ｎに対してｎ個の相関回路４
−１〜４−ｎ（又は係数ａ、ｂが変更可能な図示省略の
１つの相関回路）が設けられる。なお、図１５に示すｎ
グループの予測回路が同一の構成である場合、復号装置
では図１７に示すようにｎグループ分の予測回路を設け
る必要はなく、１つのグループ分の予測回路でよい。そ
して、符号化装置から伝送された選択フラグに基づいて
相関回路４−１〜４−ｎの１つを選択、又は係数ａ、ｂ
を設定して元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌ
ｆｅ）を復元し、また、式（２）によりマルチチャネル
をダウンミクスしてステレオ２chデータ（Ｌ、Ｒ）を生
成する。

【００３４】また、上記の第１の実施形態では、１種類
の相関性の信号「１」〜「６」を予測符号化するように
構成されているが、この信号「１」〜「６」のグループ
と原信号（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のグ
ループを予測符号化し、圧縮率が高い方のグループを選
択するようにしてもよい。

【００３５】

【発明の効果】以上説明したように本発明によれば、よ
り圧縮効率の改善が図れると共に、圧縮処理された音声
信号をより正確に復号することが可能になる。

【図面の簡単な説明】

【図１】本発明が適用される音声符号化装置及び音声復
号装置の第１の実施形態を示すブロック図である。

【図２】図１の符号化部を詳しく示すブロック図であ
る。

【図３】図１、図２の符号化部により符号化されたビッ
トストリームを示す説明図である。

【図４】ＤＶＤのパックのフォーマットを示す説明図で
ある。

【図５】ＤＶＤのオーディオパックのフォーマットを示
す説明図である。

【図６】図５のオーディオデータエリアのフォーマット
を詳しく示す説明図である。

【図７】図１の復号化部を詳しく示すブロック図であ
る。

【図８】図７の入力バッファの書き込み／読み出しタイ
ミングを示すタイミングチャートである。

【図９】アクセスユニット毎の圧縮データ量を示す説明
図である。

【図１０】アクセスユニットとプレゼンテーションユニ
ットを示す説明図である。

【図１１】音声伝送方法を示すフローチャートである。

【図１２】音声伝送方法を示すフローチャートである。

【図１３】本発明が適用される音声符号化装置及び音声
復号装置の第３の実施形態を示すブロック図である。

【図１４】本発明が適用される音声符号化装置及び音声
復号装置の第４の実施形態を示すブロック図である。

【図１５】第４の実施形態の音声符号化装置を示すブロ
ック図である。

【図１６】図６に対応した別の実施例の説明図である。

【図１７】第４の実施形態の音声復号装置を示すブロッ
ク図である。

【符号の説明】

１’ ６chミクス＆マトリクス回路１３Ｄ１，１３Ｄ２，１５Ｄ１〜１５Ｄ４予測回路
（バッファ・選択器１４Ｄ１，１４Ｄ２，１６Ｄ１〜１
６Ｄ４と共に圧縮手段を構成する。）１４Ｄ１，１４Ｄ２，１６Ｄ１〜１６Ｄ４バッファ・
選択器１７選択信号／ＤＴＳ生成器（タイミング生成手段）１７ｃＰＴＳ生成器（タイミング生成手段）１９フォーマット化回路（フォーマット化手段）２１デフォーマット化回路（分離手段）２２アンパッキング回路２２ａ入力バッファ２４Ｄ１，２４Ｄ２，２３Ｄ１〜２３Ｄ４予測回路
（伸長手段）１００制御部１０２Ｄ／Ａ変換器１１０出力バッファ

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開昭64−44499（ＪＰ，Ａ) 特開平８−272393（ＪＰ，Ａ) 特開平３−24834（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/00 - 19/14 G11B 20/10 - 20/12 H03M 7/30 - 7/40

Claims

(57)【特許請求の範囲】

【請求項１】マルチチャネルの音声信号を、そのままの
チャネル又は互いに相関をとったチャネル毎に入力され
る音声信号に応答して先頭サンプル値を得ると共に、特
性が異なる複数の線形予測方法により時間領域の過去か
ら現在の信号の線形予測値がそれぞれ予測され、その予
測される線形予測値と前記音声信号とから得られる予測
残差が最小となるような線形予測方法を選択して予測符
号化するステップと、前記ステップにより選択されたチャネル毎の線形予測方
法と予測残差と所定の先頭サンプル値を含む予測符号化
データを格納するサブストリームを有するサブパケット
と、そのサブパケットに対応して設けられその同期情報
を含む同期情報部とから一つのアクセスユニットを形成
し、前記サブパケット内に前記アクセスユニットの数個
毎に再生側において元の音声信号を復元する際に必要な
リスタート情報を含むリスタート情報部を設けたデータ
構造にフォーマット化するステップとにより、前記データ構造にフォーマット化されたデータが記録さ
れ、その記録されたデータうち前記予測符号化データは
元の音声信号を復元するために用いられる予測値を算出
するためのデータとして記録されることを特徴とする記
録媒体。
【請求項２】請求項１記載のサブパケット及び同期情
報部と、更にＳＣＲ情報を含むパックヘッダと、を含ん
で一つのパックとしてフォーマット化されて記録される
と共に、前記ＳＣＲ情報は、前記パックを再生する際の
時間管理情報として用いられることを特徴とする記録媒
体。
【請求項３】請求項１記載の記録媒体に記録されたデ
ータから元のマルチチャネルの音声信号を復号する音声
復号装置であって、前記データ構造をサブパケットと同期情報部に分離する
手段と、前記サブパケット内の圧縮データを前記リスタート情報
部内の情報に基づいてチャネル毎に伸長する伸長手段
と、前記伸長された音声データから前記マルチチャンネルの
音声信号に変換する手段と、前記変換されたマルチチャンネル音声データを前記同期
情報部内のサンプリング周波数及び量子化ビット数に基
づいてアナログ音声信号に変換する手段とを、有する音
声復号装置。
【請求項４】請求項２記載の記録媒体に記録されたデ
ータから元のマルチチャネルの音声信号を復号する音声
復号装置であって、前記パックヘッダに含まれるＳＣＲ情報を分離する第１
の分離手段と、前記分離されたＳＣＲ情報に基づいて前記サブパケット
及び同期情報部を保持するためのバッファと、前記バッファに保持された前記サブパケットと同期情報
部とを分離する第２の分離手段と、前記サブパケット内の圧縮データを前記リスタート情報
部内の情報に基づいてチャネル毎に伸長する伸長手段
と、前記伸長された音声データから前記マルチチャンネルの
音声信号に変換する手段と、前記変換されたマルチチャンネル音声データを前記同期
情報部内のサンプリング周波数及び量子化ビット数に基
づいてアナログ音声信号に変換する手段とを、有する音
声復号装置。