JP2001202099A

JP2001202099A - 音声符号化方法及び音声復号方法

Info

Publication number: JP2001202099A
Application number: JP2000328614A
Authority: JP
Inventors: Yoshiaki Tanaka; 美昭田中; Shoji Ueno; 昭治植野
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 2000-10-27
Filing date: 2000-10-27
Publication date: 2001-07-27
Anticipated expiration: 2018-11-16
Also published as: JP3346398B2

Abstract

(57)【要約】【課題】マルチチャネルの音声信号を可変の圧縮率で
符号化する場合に再生側の処理時間を管理可能にする。【解決手段】予測回路１３Ｄ１，１３Ｄ２，１５Ｄ１
〜１５Ｄ４とバッファ・選択器１４Ｄ１，１４Ｄ２，１
６Ｄ１〜１６Ｄ４は、６チャネル音声信号を予測符号化
する。ＤＴＳ生成器１７はチャネル毎の予測符号化デー
タ量に応じて、復号側の入力バッファ２２ａ内の圧縮デ
ータを読み出すタイミングを示すデコーディング・タイ
ム・スタンプ情報を生成し、フォーマット化回路１９は
デコーディング・タイム・スタンプ情報を含むパケット
ヘッダと、圧縮データを含むユーザデータを有するパケ
ットにフォーマット化する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、マルチチャネルの
音声信号を可変長で圧縮するための音声符号化方法及び
音声復号方法に関する。

【０００２】

【従来の技術】音声信号を可変長で圧縮する方法とし
て、本発明者は先の出願（特願平９−２８９１５９号）
において１チャネルの原デジタル音声信号に対して、特
性が異なる複数の予測器により時間領域における過去の
信号から現在の信号の複数の線形予測値を算出し、原デ
ジタル音声信号と、この複数の線形予測値から予測器毎
の予測残差を算出し、予測残差の最小値を選択する予測
符号化方法を提案している。

【０００３】なお、上記方法では原デジタル音声信号が
サンプリング周波数＝９６ｋＨｚ、量子化ビット数＝２
０ビット程度の場合にある程度の圧縮効果を得ることが
できるが、近年のＤＶＤオーディオディスクではこの２
倍のサンプリング周波数（＝１９２ｋＨｚ）が使用さ
れ、また、量子化ビット数も２４ビットが使用される傾
向があるので、圧縮率を改善する必要がある。また、マ
ルチチャネルにおけるサンプリング周波数と量子化ビッ
ト数はチャネル毎に異なることもある。

【０００４】

【発明が解決しようとする課題】ところで、予測符号化
方式のような圧縮方式は圧縮率が可変（ＶＢＲ：バリア
ブル・ビット・レート）であるので、マルチチャネルの
音声信号を予測符号化するとチャネル毎のデータ量が時
間的に大きく変化する。また、このようなデータを伝送
する場合には、チャネル毎にパラレルではなくデータス
トリームとして伝送される。

【０００５】したがって、再生側（デコード側）におい
てこのような可変長のデータストリームをチャネル毎に
同期して再生（プレゼンテーション）可能にするために
は、入力バッファに蓄積されたデータストリームを読み
出してデコーダに出力するためのタイミングを示すデコ
ード時間と、出力バッファに蓄積されたデコード後のデ
ータを読み出してスピーカなどに出力（プレゼンテーシ
ョン）するためのタイミングを示す再生時間を管理しな
ければならない。また、再生側でこのような可変長のデ
ータストリームをサーチ再生するための時間を管理しな
ければならない。

【０００６】そこで本発明は、マルチチャネルの音声信
号を可変の圧縮率で符号化する場合に再生側の処理時間
を管理することができる音声符号化方法及び音声復号方
法を提供することを目的とする。

【０００７】

【課題を解決するための手段】本発明は上記目的を達成
するために、以下の１）及び２）に記載の手段よりな
る。すなわち、

【０００８】１）マルチチャネルの音声信号を、そのま
まのチャネル又は互いに相関をとったチャネル毎に、入
力される音声信号に応答して先頭サンプル値を所定時間
のフレーム単位で得ると共に、時間領域の過去の信号か
ら予測される現在の信号の複数の予測値の中でその予測
残差が最小値となる線形予測方法を前記フレームを更に
分割したサブフレーム単位に選択して予測符号化するス
テップと、前記ステップにより選択されたチャネル毎の
予測符号化データ量に応じて、復号側の入力バッファ内
の予測符号化データ（圧縮データ）を読み出すタイミン
グを示すデコーディング・タイム・スタンプ情報を生成
するステップと、前記デコーディング・タイム・スタン
プ情報を含むパケットヘッダと、前記予測符号化データ
を含むユーザデータをパケットにフォーマット化するス
テップと、からなる音声符号化方法。２）マルチチャネルの音声信号を、そのままのチャネル
又は互いに相関をとったチャネル毎に、入力される音声
信号に応答して先頭サンプル値を得ると共に、時間領域
の過去の信号から予測される現在の信号の複数の予測値
の中でその予測残差が最小値となる線形予測方法を選択
して予測符号化するステップと、前記ステップにより選
択されたチャネル毎の予測符号化データ量に応じて、復
号側の入力バッファ内の予測符号化データ（圧縮デー
タ）を読み出すタイミングを示すデコーディング・タイ
ム・スタンプ情報を生成するステップと、前記デコーデ
ィング・タイム・スタンプ情報を含むパケットヘッダ
と、前記予測符号化データを含むユーザデータをパケッ
トにフォーマット化するステップと、からなる音声符号
化方法により符号化されたデータから元の音声信号を復
号する復号方法であって、前記パケットをパケットヘッ
ダとユーザデータに分離するステップと、前記ユーザデ
ータ内の予測符号化データをバッファに蓄積するステッ
プと、前記バッファ内の予測符号化データを前記パケッ
トヘッダ内のデコーディング・タイム・スタンプ情報に
基づいて読み出すステップと、前記バッファから読み出
された予測符号化データを伸長するステップと、からな
る音声復号方法。

【０００９】

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図１は本発明が適用される係る音
声符号化装置及び音声復号装置の第１の実施形態を示す
ブロック図、図２は図１の符号化部を詳しく示すブロッ
ク図、図３は図１、図２の符号化部により符号化された
ビットストリームを示す説明図、図４はＤＶＤのパック
のフォーマットを示す説明図、図５はＤＶＤのオーディ
オパックのフォーマットを示す説明図、図６は図１の復
号化部を詳しく示すブロック図、図７は図６の入力バッ
ファの書き込み／読み出しタイミングを示すタイミング
チャート、図８はアクセスユニット毎の圧縮データ量を
示す説明図、図９はアクセスユニットとプレゼンテーシ
ョンユニットを示す説明図である。

【００１０】ここで、マルチチャネル方式としては、例
えば次の４つの方式が知られている。（１）４チャネル方式ドルビーサラウンド方式の
ように、前方Ｌ、Ｃ、Ｒの３チャネル＋後方Ｓの１チャ
ネルの合計４チャネル（２）５チャネル方式ドルビーＡＣ−３方式のＳ
Ｗチャネルなしのように、前方Ｌ、Ｃ、Ｒの３チャネル
＋後方ＳＬ、ＳＲの２チャネルの合計５チャネル（３）６チャネル方式ＤＴＳ（Digital Theater
System）方式や、ドルビーＡＣ−３方式のように６チャ
ネル（Ｌ、Ｃ、Ｒ、ＳＷ（Ｌｆｅ）、ＳＬ、ＳＲ）（４）８チャネル方式ＳＤＤＳ（Sony Dynamic D
igital Sound）方式のように、前方Ｌ、ＬＣ、Ｃ、Ｒ
Ｃ、Ｒ、ＳＷの６チャネル＋後方ＳＬ、ＳＲの２チャネ
ルの合計８チャネル

【００１１】図１に示す符号化側の６チャネル（ch）ミ
クス＆マトリクス回路１’は、マルチチャネル信号の一
例としてフロントレフト（Ｌｆ）、センタ（Ｃ）、フロ
ントライト（Ｒｆ）、サラウンドレフト（Ｌｓ）、サラ
ウンドライト（Ｒｓ）及びＬｆｅ（Low Frequency Effe
ct）の６chのＰＣＭデータを次式（１）により前方グル
ープに関する２ch「１」、「２」と他のグループに関す
る４ch「３」〜「６」に分類して変換し、２ch「１」、
「２」を第１符号化部２’−１に、また、４ch「３」〜
「６」を第２符号化部２’−２に出力する。「１」＝Ｌｆ＋Ｒｆ「２」＝Ｌｆ−Ｒｆ「３」＝Ｃ−（Ｌｓ＋Ｒｓ）／２「４」＝Ｌｓ＋Ｒｓ「５」＝Ｌｓ−Ｒｓ「６」＝Ｌｆｅ−ａ×Ｃただし、０≦ａ≦１ …（１）

【００１２】符号化部２’を構成する第１及び第２符号
化部２’−１、２’−２はそれぞれ、図２に詳しく示す
ように２ch「１」、「２」と４ch「３」〜「６」のＰＣ
Ｍデータを予測符号化し、予測符号化データを図３に示
すようなビットストリームで記録媒体５や通信媒体６を
介して復号側に伝送する。復号側では復号化部３’を構
成する第１及び第２復号化部３’−１、３’−２によ
り、図６に詳しく示すようにそれぞれ前方グループに関
する２ch「１」、「２」と他のグループに関する４ch
「３」〜「６」の予測符号化データをＰＣＭデータに復
号する。

【００１３】次いでミクス＆マトリクス回路４’により
式（１）に基づいて元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、
Ｒｓ、Ｌｆｅ）を復元するとともに、この元の６chと係
数ｍiｊ（ｉ＝１，２，ｊ＝１，２〜６）により次式
（２）のようにステレオ２chデータ（Ｌ、Ｒ）を生成す
る。Ｌ＝ｍ１１・Ｌｆ＋ｍ１２・Ｒｆ＋ｍ１３・Ｃ＋ｍ１４・Ｌｓ＋ｍ１５・Ｒｓ＋ｍ１６・ＬｆｅＲ＝ｍ２１・Ｌｆ＋ｍ２２・Ｒｆ＋ｍ２３・Ｃ＋ｍ２４・Ｌｓ＋ｍ２５・Ｒｓ＋ｍ２６・Ｌｆｅ …（２）

【００１４】図２を参照して符号化部２’−１、２’−
２について詳しく説明する。各ch「１」〜「６」のＰＣ
Ｍデータは１フレーム毎に１フレームバッファ１０に格
納される。そして、１フレームの各ch「１」〜「６」の
サンプルデータがそれぞれ予測回路１３Ｄ１、１３Ｄ
２、１５Ｄ１〜１５Ｄ４に印加されるとともに、各ch
「１」〜「６」の各フレームの先頭サンプルデータがフ
ォーマット化回路１９に印加される。予測回路１３Ｄ
１、１３Ｄ２、１５Ｄ１〜１５Ｄ４はそれぞれ、各ch
「１」〜「６」のＰＣＭデータに対して、特性が異なる
複数の予測器（不図示）により時間領域における過去の
信号から現在の信号の複数の線形予測値を算出し、次い
で原ＰＣＭデータと、この複数の線形予測値から予測器
毎の予測残差を算出する。続くバッファ・選択器１４Ｄ
１、１４Ｄ２、１６Ｄ１〜１６Ｄ４はそれぞれ、予測回
路１３Ｄ１、１３Ｄ２、１５Ｄ１〜１５Ｄ４により算出
された各予測残差を一時記憶して、選択信号／ＤＴＳ
（デコーディング・タイム・スタンプ）生成器１７によ
り指定されたサブフレーム毎に予測残差の最小値を選択
する。

【００１５】選択信号／ＤＴＳ生成器１７は予測残差の
ビット数フラグをパッキング回路１８とフォーマット化
回路１９に対して印加し、また、予測残差が最小の予測
器を示す予測器選択フラグと、式（１）における相関係
数ａと、復号化側が入力バッファ２２ａ（図６）からス
トリームデータを取り出す時間を示すＤＴＳをフォーマ
ット化回路１９に対して印加する。パッキング回路１８
はバッファ・選択器１４Ｄ１、１４Ｄ２、１６Ｄ１〜１
６Ｄ４により選択された６ch分の予測残差を、選択信号
／ＤＴＳ生成器１７により指定されたビット数フラグに
基づいて指定ビット数でパッキングする。またＰＴＳ生
成器１７ｃは、復号化側が出力バッファ１１０（図６）
からＰＣＭデータを取り出す時間を示すＰＴＳ（プレゼ
ンテーション・タイム・スタンプ）を生成してフォーマ
ット化回路１９に出力する。

【００１６】続くフォーマット化回路１９は図３〜図５
に示すようなユーザデータにフォーマット化する。図３
に示すユーザデータ（サブパケット）は、前方グループ
に関する２ch「１」、「２」の予測符号化データを含む
可変レートビットストリーム（サブストリーム）ＢＳ０
と、他のグループに関する４ch「３」〜「６」の予測符
号化データを含む可変レートビットストリーム（サブス
トリーム）ＢＳ１と、サブストリームＢＳ０、ＢＳ１の
前に設けられたビットストリームヘッダ（リスタートヘ
ッダ）により構成されている。また、サブストリームＢ
Ｓ０、ＢＳ１の１フレーム分は・フレームヘッダと、・各ch「１」〜「６」の１フレームの先頭サンプルデー
タと、・各ch「１」〜「６」のサブフレーム毎の予測器選択フ
ラグと、・各ch「１」〜「６」のサブフレーム毎のビット数フラ
グと、・各ch「１」〜「６」の予測残差データ列（可変ビット
数）と、・ch「６」の係数ａが多重化されている。このような予測符号化によれば、
原信号が例えばサンプリング周波数＝９６ｋＨｚ、量子
化ビット数＝２４ビット、６チャネルの場合、７１％の
圧縮率を実現することができる。

【００１７】図２に示す符号化部２’−１、２’−２に
より予測符号化された可変レートビットストリームデー
タを、記録媒体の一例としてＤＶＤオーディオディスク
に記録する場合には、図４に示すオーディオ（Ａ）パッ
クにパッキングされる。このパックは２０３４バイトの
ユーザデータ（Ａパケット、Ｖパケット）に対して４バ
イトのパックスタート情報と、６バイトのＳＣＲ（Syst
em Clock Reference：システム時刻基準参照値）情報
と、３バイトのMux レート（rate）情報と１バイトのス
タッフィングの合計１４バイトのパックヘッダが付加さ
れて構成されている（１パック＝合計２０４８バイ
ト）。この場合、タイムスタンプであるＳＣＲ情報を、
先頭パックでは「１」として同一タイトル内で連続とす
ることにより同一タイトル内のＡパックの時間を管理す
ることができる。

【００１８】圧縮ＰＣＭのＡパケットは図５に詳しく示
すように、１９又は１４バイトのパケットヘッダと、圧
縮ＰＣＭのプライベートヘッダと、図３に示すフォーマ
ットの１ないし２０１１バイトのオーディオデータ（圧
縮ＰＣＭ）により構成されている。そして、ＤＴＳとＰ
ＴＳは図５のパケットヘッダ内に（具体的にはパケット
ヘッダの１０〜１４バイト目にＰＴＳが、１５〜１９バ
イト目にＤＴＳが）セットされる。圧縮ＰＣＭのプライ
ベートヘッダは、・１バイトのサブストリームＩＤと、・２バイトのＵＰＣ／ＥＡＮ−ＩＳＲＣ（Universal Pr
oduct Code/European Article Number-International S
tandard Recording Code）番号、及びＵＰＣ／ＥＡＮ−
ＩＳＲＣデータと、・１バイトのプライベートヘッダ長と、・２バイトの第１アクセスユニットポインタと、・８バイトのオーディオデータ情報（ＡＤＩ）と、・０〜７バイトのスタッフィングバイトとに、より構成
されている。そして、ＡＤＩ内に１秒後のアクセスユニ
ットをサーチするための前方アクセスユニット・サーチ
ポインタと、１秒前のアクセスユニットをサーチするた
めの後方アクセスユニット・サーチポインタがともに１
バイトで（具体的にはＡＤＩの７バイト目に前方アクセ
スユニット・サーチポインタが、８バイト目に後方アク
セスユニット・サーチポインタが）セットされる。

【００１９】次に図６を参照して復号化部３’−１、
３’−２について説明する。上記フォーマットの可変レ
ートビットストリームデータＢＳ０、ＢＳ１は、デフォ
ーマット化回路２１により分離される。そして、各ｃｈ
「１」〜「６」の１フレームの先頭サンプルデータと予
測器選択フラグはそれぞれ予測回路２４Ｄ１、２４Ｄ
２、２３Ｄ１〜２３Ｄ４に印加され、各ｃｈ「１」〜
「６」のビット数フラグはアンパッキング回路２２に印
加される。また、ＳＣＲと、ＤＴＳと予測残差データ列
は入力バッファ２２ａに印加され、ＰＴＳは出力バッフ
ァ１１０に印加される。ここで、予測回路２４Ｄ１、２
４Ｄ２、２３Ｄ１〜２３Ｄ４内の複数の予測器（不図
示）はそれぞれ、符号化側の予測回路１３Ｄ１、１３Ｄ
２、１５Ｄ１〜１５Ｄ４内の複数の予測器と同一の特性
であり、予測器選択フラグにより同一特性のものが選択
される。

【００２０】デフォーマット化回路２１により分離され
たストリームデータ（予測残差データ列）は、図７に示
すようにＳＣＲによりアクセスユニット毎に入力バッフ
ァ２２ａに取り込まれて蓄積される。ここで、１つのア
クセスユニットのデータ量は、例えばｆｓ＝９６ｋＨｚ
の場合には（１／９６ｋＨｚ）秒分であるが、図８、図
９（ａ）に詳しく示すように可変長である。そして、入
力バッファ２２ａに蓄積されたストリームデータはＤＴ
Ｓに基づいてＦＩＦＯで読み出されてアンパッキング回
路２２に印加される。

【００２１】アンパッキング回路２２は各ｃｈ「１」〜
「６」の予測残差データ列をビット数フラグ毎に基づい
て分離してそれぞれ予測回路２４Ｄ１、２４Ｄ２、２３
Ｄ１〜２３Ｄ４に出力する。予測回路２４Ｄ１、２４Ｄ
２、２３Ｄ１〜２３Ｄ４ではそれぞれ、アンパッキング
回路２２からの各ｃｈ「１」〜「６」の今回の予測残差
データと、内部の複数の予測器の内、予測器選択フラグ
により選択された各１つにより予測された前回の予測値
が加算されて今回の予測値が算出され、次いで１フレー
ムの先頭サンプルデータを基準として各サンプルのＰＣ
Ｍデータが算出されて出力バッファ１１０に蓄積され
る。出力バッファ１１０に蓄積されたＰＣＭデータはＰ
ＴＳに基づいて読み出されて出力される。したがって、
図９（ａ）に示す可変長のアクセスユニットが伸長され
て、図９（ｂ）に示す一定長のプレゼンテーションユニ
ットが出力される。

【００２２】ここで、操作部１０１を介してサーチ再生
が指示された場合には、制御部１００により図５に示す
ＡＤＩ内に置かれる１秒先を示す前方アクセスユニット
・サーチポインタと１秒後を示す後方アクセスユニット
・サーチポインタに基づいてアクセスユニットを再生す
る。このサーチポインタとしては、１秒先、１秒前の代
わりに２秒先、２秒前のものでよい。

【００２３】図２に示す符号化部２’−１、２’−２に
より予測符号化された可変レートビットストリームデー
タをネットワークを介して伝送する場合には、符号化側
では図１０に示すように伝送用にパケット化し（ステッ
プＳ４１）、次いでパケットヘッダを付与し（ステップ
Ｓ４２）、次いでこのパケットをネットワーク上に送り
出す（ステップＳ４３）。

【００２４】復号側では図１１（Ａ）に示すようにヘッ
ダを除去し（ステップＳ５１）、次いでデータを復元し
（ステップＳ５２）、次いでこのデータをメモリに格納
して復号を待つ（ステップＳ５３）。そして、復号を行
う場合には図１１（Ｂ）に示すように、デフォーマット
化を行い（ステップＳ６１）、次いで入力バッファ２２
ａの入出力制御を行い（ステップＳ６２）、次いでアン
パッキングを行う（ステップＳ６３）。なお、このと
き、サーチ再生指示がある場合にはサーチポインタをデ
コードする。次いで予測器をフラグに基づいて選択して
デコードを行い（ステップＳ６４）、次いで出力バッフ
ァ１１０の入出力制御を行い（ステップＳ６５）、次い
で元のマルチチャネルを復元し（ステップＳ６６）、次
いでこれを出力し（ステップＳ６７）、以下、これを繰
り返す。

【００２５】なお、上記実施形態では、前方グループに
関する２ch「１」、「２」を「１」＝Ｌｆ＋Ｒｆ「２」＝Ｌｆ−Ｒｆにより変換して予測符号化したが、代わりに式（２）に
よりマルチチャネルをダウンミクスしてステレオ２chデ
ータ（Ｌ、Ｒ）を生成し、次いで次式（１）’ 「１」＝Ｌ＋Ｒ「２」＝Ｌ−Ｒ「３」〜「５」は同じ「６」＝Ｌｆｅ−Ｃ …（１）’ により変換して予測符号化するようにしてもよい（第２
の実施形態）。この場合には、復号化側のミクス＆マト
リクス回路４’はチャネル「１」、「２」を加算するこ
とによりチャネルＬを、減算することによりチャネルＲ
を生成することができる。

【００２６】また、第３の実施形態として図１２に示す
ように、２ch「１」、「２」の代わりに式（２）により
マルチチャネルをダウンミクスしてステレオ２chデータ
（Ｌ、Ｒ）を生成して、このステレオ２ch（Ｌ、Ｒ）と
４ch「３」〜「６」を予測符号化するようにしてもよ
い。なお、第２、第３の実施形態では、フロントレフト
（Ｌｆ）とフロントライト（Ｒｆ）が復号化側に伝送さ
れないので、復号化側ではこれを式（１）、（２）によ
り生成する。

【００２７】次に図１３、図１４を参照して第４の実施
形態について説明する。上記の実施形態では、１グルー
プの相関性の信号「１」〜「６」を予測符号化するよう
に構成されているが、この第４の実施形態では複数グル
ープの相関性のある信号を生成して予測符号化し、圧縮
率が最も高いグループの予測符号化データを選択するよ
うに構成されている。このため図１３に示す符号化部で
は、第１〜第ｎの相関回路１−１〜１−ｎが設けられ、
このｎ個の相関回路１−１〜１−ｎは例えば６ch（Ｌ
ｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のＰＣＭデータ
を、相関性が異なるｎ種類の６ch信号「１」〜「６」に
変換する。

【００２８】例えば第１の相関回路１−１は以下のよう
に変換し、「１」＝Ｌｆ「２」＝Ｃ−（Ｌｓ＋Ｒｓ）／２「３」＝Ｒｆ−Ｌｆ「４」＝Ｌｓ−ａ×Ｌｆｅ「５」＝Ｒｓ−ｂ×Ｒｆ「６」＝Ｌｆｅまた、第ｎの相関回路１−ｎは以下のように変換する。「１」＝Ｌｆ＋Ｒｆ「２」＝Ｃ−Ｌｆ「３」＝Ｒｆ−Ｌｆ「４」＝Ｌｓ−Ｌｆ「５」＝Ｒｓ−Ｌｆ「６」＝Ｌｆｅ−Ｃ

【００２９】また、相関回路１−１〜１−ｎ毎に予測回
路１５とバッファ・選択器１６が設けられ、グループ毎
の予測残差の最小値のデータ量に基づいて圧縮率が最も
高いグループが相関選択信号生成器１７ｂにより選択さ
れる。このとき、フォーマット化回路１９はその選択フ
ラグ（相関回路選択フラグ、その相関回路の相関係数
ａ、ｂ）を追加して多重化する。

【００３０】また、図１４に示す復号化側では、符号化
側の相関回路１−１〜１−ｎに対してｎ個の相関回路４
−１〜４−ｎ（又は係数ａ、ｂが変更可能な図示省略の
１つの相関回路）が設けられる。なお、図１３に示すｎ
グループの予測回路が同一の構成である場合、復号装置
では図１４に示すようにｎグループ分の予測回路を設け
る必要はなく、１つのグループ分の予測回路でよい。そ
して、符号化装置から伝送された選択フラグに基づいて
相関回路４−１〜４−ｎの１つを選択、又は係数ａ、ｂ
を設定して元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌ
ｆｅ）を復元し、また、式（２）によりマルチチャネル
をダウンミクスしてステレオ２chデータ（Ｌ、Ｒ）を生
成する。

【００３１】また、上記の第１の実施形態では、１種類
の相関性の信号「１」〜「６」を予測符号化するように
構成されているが、この信号「１」〜「６」のグループ
と原信号（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のグ
ループを予測符号化し、圧縮率が高い方のグループを選
択するようにしてもよい。

【００３２】

【発明の効果】以上説明したように本発明によれば、チ
ャネル毎の圧縮データ量に応じて、復号側の入力バッフ
ァ内の圧縮データを読み出すタイミングを示すデコーデ
ィング・タイム・スタンプ情報を生成してパケットヘッ
ダにセットしたので、マルチチャネルの音声信号を可変
の圧縮率で符号化する場合に再生側の処理時間を管理す
ることができる。

【図面の簡単な説明】

【図１】本発明が適用される音声符号化装置及び音声復
号装置の第１の実施形態を示すブロック図である。

【図２】図１の符号化部を詳しく示すブロック図であ
る。

【図３】図１、図２の符号化部により符号化されたビッ
トストリームを示す説明図である。

【図４】ＤＶＤのパックのフォーマットを示す説明図で
ある。

【図５】ＤＶＤのオーディオパックのフォーマットを示
す説明図である。

【図６】図１の復号化部を詳しく示すブロック図であ
る。

【図７】図６の入力バッファの書き込み／読み出しタイ
ミングを示すタイミングチャートである。

【図８】アクセスユニット毎の圧縮データ量を示す説明
図である。

【図９】アクセスユニットとプレゼンテーションユニッ
トを示す説明図である。

【図１０】音声伝送方法を示すフローチャートである。

【図１１】音声伝送方法を示すフローチャートである。

【図１２】本発明が適用される音声符号化装置及び音声
復号装置第３の実施形態を示すブロック図である。

【図１３】第４の実施形態の音声符号化装置を示すブロ
ック図である。

【図１４】第４の実施形態の音声復号装置を示すブロッ
ク図である。

【符号の説明】

１’ ６chミクス＆マトリクス回路１３Ｄ１，１３Ｄ２，１５Ｄ１〜１５Ｄ４予測回路
（バッファ・選択器１４Ｄ１，１４Ｄ２，１６Ｄ１〜１
６Ｄ４と共に圧縮手段を構成する。）１４Ｄ１，１４Ｄ２，１６Ｄ１〜１６Ｄ４バッファ・
選択器１７選択信号／ＤＴＳ生成器（タイミング生成手段）１７ｃＰＴＳ生成器（タイミング生成手段）１９フォーマット化回路（フォーマット化手段）２１デフォーマット化回路（分離手段）２２アンパッキング回路２２ａ入力バッファ２４Ｄ１，２４Ｄ２，２３Ｄ１〜２３Ｄ４予測回路
（伸長手段）１００制御部（読み出し手段）１１０出力バッファ

─────────────────────────────────────────────────────

【手続補正書】

【提出日】平成１３年２月２８日（２００１．２．２
８）

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】特許請求の範囲

【補正方法】変更

【補正内容】

【特許請求の範囲】

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】０００８

【補正方法】変更

【補正内容】

【０００８】１）マルチチャネルの音声信号を、そのま
まのチャネル又は互いに相関をとったチャネル毎に、入
力される音声信号に応答して、先頭サンプル値を得ると
共に、特性が異なる複数の線形予測方法により時間領域
の過去の信号から現在の信号の線形予測値がそれぞれ予
測され、その予測される線形予測値と前記音声信号とか
ら得られる予測残差が最小となるような線形予測方法を
前記フレームを更に分割したサブフレーム単位に選択し
て圧縮するステップと、前記圧縮されたデータの量に応
じて、復号側の入力バッファ内の圧縮データを読み出す
タイミングを示すデコーディング・タイム・スタンプ情
報を生成すると共に、復号側の出力バッファ内のデコー
ド済みデータを読み出すタイミングを示すプレゼンテー
ション・タイム・スタンプ情報を生成するステップと、
前記デコーディング・タイム・スタンプ情報及び前記プ
レゼンテーション・タイム・スタンプ情報を含むパケッ
トヘッダと、前記圧縮データと、を含むユーザデータを
パケットにフォーマット化するステップと、からなる音
声符号化方法。２）)マルチチャネルの音声信号を、そのままのチャネ
ル又は互いに相関をとったチャネル毎に、入力される音
声信号に応答して、先頭サンプル値を得ると共に、特性
が異なる複数の線形予測方法により時間領域の過去の信
号から現在の信号の線形予測値がそれぞれ予測され、そ
の予測される線形予測値と前記音声信号とから得られる
予測残差が最小となるような線形予測方法を選択して圧
縮するステップと、前記圧縮されたデータの量に応じ
て、デコーディング・タイム・スタンプ情報を生成する
と共に、プレゼンテーション・タイム・スタンプ情報を
生成するステップと、前記デコーディング・タイム・ス
タンプ情報及びプレゼンテーション・タイム・スタンプ
情報と、を含むパケットヘッダと、前記圧縮データと、
を含むユーザデータを有するパケットにフォーマット化
するステップと、からなる音声符号化方法により符号化
されたデータから元の音声信号を復号する復号方法であ
って、前記パケット内のユーザデータをパケットヘッダ
と圧縮データとに分離するステップと、前記分離された
圧縮データを入力バッファに蓄積するステップと、前記
入力バッファ内に蓄積された圧縮データを前記パケット
ヘッダ内のデコーディング・タイム・スタンプ情報に基
づいて読み出し伸長するステップと、前記読み出されて
伸長された音声データを出力バッファに蓄積するステッ
プと、前記出力バッファに蓄積された音声データを前記
パケット内のプレゼンテーション・タイム・スタンプ情
報に基づいて取り出すステップと、からなる音声復号方
法。

フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０４Ｓ 3/02 Ｇ１０Ｌ 9/18 ＤＭ

Claims

【特許請求の範囲】

【請求項１】マルチチャネルの音声信号を、そのままの
チャネル又は互いに相関をとったチャネル毎に、入力さ
れる音声信号に応答して先頭サンプル値を所定時間のフ
レーム単位で得ると共に、時間領域の過去の信号から予
測される現在の信号の複数の予測値の中でその予測残差
が最小値となる線形予測方法を前記フレームを更に分割
したサブフレーム単位に選択して予測符号化するステッ
プと、前記ステップにより選択されたチャネル毎の予測符号化
データ量に応じて、復号側の入力バッファ内の予測符号
化データ（圧縮データ）を読み出すタイミングを示すデ
コーディング・タイム・スタンプ情報を生成すると共
に、復号側の出力バッファ内のデコード済みデータを読
み出すタイミングを示すプレゼンテーション・タイム・
スタンプ情報を生成するステップと、前記デコーディング・タイム・スタンプ情報と前記プレ
ゼンテーション・タイム・スタンプ情報を含むパケット
ヘッダと、前記予測符号化データを含むユーザデータを
パケットにフォーマット化するステップと、からなる音
声符号化方法。
【請求項２】マルチチャネルの音声信号を、そのままの
チャネル又は互いに相関をとったチャネル毎に、入力さ
れる音声信号に応答して先頭サンプル値を得ると共に、
時間領域の過去の信号から予測される現在の信号の複数
の予測値の中でその予測残差が最小値となる線形予測方
法を選択して予測符号化するステップと、前記ステップにより選択されたチャネル毎の予測符号化
データ量に応じて、復号側の入力バッファ内の予測符号
化データ（圧縮データ）を読み出すタイミングを示すデ
コーディング・タイム・スタンプ情報を生成すると共
に、復号側の出力バッファ内のデコード済みデータを読
み出すタイミングを示すプレゼンテーション・タイム・
スタンプ情報を生成するステップと、前記デコーディング・タイム・スタンプ情報と前記プレ
ゼンテーション・タイム・スタンプ情報を含むパケット
ヘッダと、前記予測符号化データを含むユーザデータを
パケットにフォーマット化するステップと、からなる音
声符号化方法により符号化されたデータから元の音声信
号を復号する音声復号方法であって、前記パケットをパケットヘッダとユーザデータに分離す
るステップと、前記ユーザデータ内の予測符号化データを入力バッファ
に蓄積するステップと、前記入力バッファ内の予測符号化データを前記パケット
ヘッダ内のデコーディング・タイム・スタンプ情報に基
づいて読み出すステップと、前記バッファから読み出された予測符号化データを伸長
し、前記伸長された音声データを前記パケットヘッダ内
のプレゼンテーション・タイム・スタンプ情報に基づい
て取り出すステップと、からなる音声復号方法。