JP2000156038A - 音声符号化装置、記録媒体、音声復号化装置及び音声伝送方法並びにコンピュータ記録媒体 - Google Patents
音声符号化装置、記録媒体、音声復号化装置及び音声伝送方法並びにコンピュータ記録媒体Info
- Publication number
- JP2000156038A JP2000156038A JP10342354A JP34235498A JP2000156038A JP 2000156038 A JP2000156038 A JP 2000156038A JP 10342354 A JP10342354 A JP 10342354A JP 34235498 A JP34235498 A JP 34235498A JP 2000156038 A JP2000156038 A JP 2000156038A
- Authority
- JP
- Japan
- Prior art keywords
- data
- channel
- identifier
- audio
- audio packet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
伝送したり、再生側のダウンミクスを選択的に許可又は
禁止しても再生側が正常に再生可能にする 【解決手段】 ATSIはオーディオパケット内のマル
チチャネルデータが圧縮されているか否かを示す第1の
識別子と、マルチチャネルデータをステレオ2チャネル
にダウンミクスすることを許可するか又は禁止するかを
示す第2の識別子を含む。
Description
音声信号を伝送して再生するための音声符号化装置、記
録媒体、音声復号化装置及び音声伝送方法並びにコンピ
ュータ記録媒体に関する。
て、本発明者は先の出願(特願平9−289159号)
において1チャネルの原デジタル音声信号に対して、特
性が異なる複数の予測器により時間領域における過去の
信号から現在の信号の複数の線形予測値を算出し、原デ
ジタル音声信号と、この複数の線形予測値から予測器毎
の予測残差を算出し、予測残差の最小値を選択する予測
符号化方法を提案している。
サンプリング周波数=96kHz、量子化ビット数=2
0ビット程度の場合にある程度の圧縮効果を得ることが
できるが、近年のDVDオーディオディスクではこの2
倍のサンプリング周波数(=192kHz)が使用さ
れ、また、量子化ビット数も24ビットが使用される傾
向がある。また、マルチチャネルにおけるサンプリング
周波数と量子化ビット数はチャネル毎に異なることもあ
る。
ネルの音声信号を伝送する場合、著作権者がオーディオ
ソースに依っては圧縮を希望するものとそうでないもの
があり、また、ユーザがマルチチャネルをステレオ2チ
ャネルにダウンミクスして再生することを望まないもの
とそうでないものとの2通りがある。したがって、この
ように圧縮又は非圧縮で選択的に伝送する2通りと、再
生側のダウンミクスを選択的に許可、禁止する2通りの
合計4通りで伝送した場合には、再生側でこれを識別し
て選択的に再生する必要がある。
は非圧縮で選択的に伝送したり、再生側のダウンミクス
を選択的に許可又は禁止しても再生側が正常に再生する
ことができる音声符号化装置、記録媒体、音声復号化装
置及び音声伝送方法並びにコンピュータ記録媒体を提供
することを目的とする。
するために、マルチチャネルを圧縮又は非圧縮で選択的
に伝送する場合に、マルチチャネルデータが圧縮されて
いるか否かを示す識別子と、マルチチャネルデータをス
テレオ2チャネルにダウンミクスすることを許可するか
又は禁止するかを示す識別子を共に伝送するようにした
ものである。すなわち本発明によれば、マルチチャネル
の音声信号が圧縮されたデータ又は圧縮されないデータ
が選択的に配置されるオーディオパケットと、前記オー
ディオパケット内のマルチチャネルデータが圧縮されて
いるか否かを示す第1の識別子と、前記オーディオパケ
ット内のマルチチャネルデータをステレオ2チャネルに
ダウンミクスすることを許可するか又は禁止するかを示
す第2の識別子が配置された管理情報とを、有するデー
タ構造にフォーマット化する手段を有する音声符号化装
置が提供される。また本発明によれば、マルチチャネル
の音声信号が圧縮されたデータ又は圧縮されないデータ
が選択的に配置されるオーディオパケットと、前記オー
ディオパケット内のマルチチャネルデータが圧縮されて
いるか否かを示す第1の識別子と、前記前記オーディオ
パケット内のマルチチャネルデータをステレオ2チャネ
ルにダウンミクスすることを許可するか又は禁止するか
を示す第2の識別子が配置された管理情報とを、有する
データ構造が記録された記録媒体が提供される。
タ構造を復号化する音声復号化装置であって、前記デー
タ構造をオーディオパケットと管理情報に分離する手段
と、前記管理情報内の第2の識別子がダウンミクスする
ことを許可する場合に前記オーディオパケット内のマル
チチャネルデータを前記第1の識別子に基づいて選択的
に伸長するか又は伸長しないでマルチチャネルとステレ
オ2チャネルで再生し、ダウンミクス識別子がダウンミ
クスすることを禁止する場合に前記オーディオパケット
内のマルチチャネルデータを前記第1の識別子に基づい
て選択的に伸長するか又は伸長しないでマルチチャネル
のみで再生する手段とを、有する音声復号化装置が提供
される。
タ構造を通信回線を介して伝送することを特徴とする音
声伝送方法が提供される。
タ構造を復号化するコンピュータプログラムが記録され
たコンピュータ記録媒体であって、前記コンピュータプ
ログラムは、前記データ構造をオーディオパケットと管
理情報に分離するステップと、前記管理情報内の第2の
識別子がダウンミクスすることを許可する場合に前記オ
ーディオパケット内のマルチチャネルデータを前記第1
の識別子に基づいて選択的に伸長するか又は伸長しない
でマルチチャネルとステレオ2チャネルで再生し、ダウ
ンミクス識別子がダウンミクスすることを禁止する場合
に前記オーディオパケット内のマルチチャネルデータを
前記第1の識別子に基づいて選択的に伸長するか又は伸
長しないでマルチチャネルのみで再生するステップと
を、有するコンピュータ記録媒体が提供される。
施の形態を説明する。図1〜図4は本発明に係るマルチ
チャネル伝送形態を実現する音声符号化装置の処理を示
す説明図である。
えば次の4つの方式が知られている。 (1)4チャネル方式 ドルビーサラウンド方式の
ように、前方L、C、Rの3チャネル+後方Sの1チャ
ネルの合計4チャネル (2)5チャネル方式 ドルビーAC−3方式のS
Wチャネルなしのように、前方L、C、Rの3チャネル
+後方SL、SRの2チャネルの合計5チャネル (3)6チャネル方式 DTS(Digital Theater
System)方式や、ドルビーAC−3方式のように6チャ
ネル(L、C、R、SW(Lfe)、SL、SR) (4)8チャネル方式 SDDS(Sony Dynamic D
igital Sound)方式のように、前方L、LC、C、R
C、R、SWの6チャネル+後方SL、SRの2チャネ
ルの合計8チャネル
チャネルを圧縮するとともに再生側のダウンミクスを禁
止する場合を示している。符号化側の6チャネル(ch)
ミクス&マトリクス回路1’は、マルチチャネル信号の
一例としてフロントレフト(Lf)、センタ(C)、フ
ロントライト(Rf)、サラウンドレフト(Ls)、サ
ラウンドライト(Rs)及びLfe(Low Frequency Ef
fect)の6chのPCMデータを次式(1−1)により6
ch「1」〜「6」分の相関信号に変換し、符号化部2’
に出力する。 「1」=Lf+Rf−C 「2」=Lf−Rf−C 「3」=C−(Ls+Rs)/2 「4」=Ls+Rs 「5」=Ls−Rs 「6」=Lfe−a×C ただし、0≦a≦1 …(1−1) このような6チャネル(ch)ミクス&マトリクス回路
1’による相関式と符号化部2’の符号化方式は選択手
段7’で選択される。以下説明する図2、図3、図4、
図5及び図6でも同様であるので、これらの図では選択
手段7’を略すことにする。
を有する符号化部2’は図7に詳しく示すようにこの6
ch「1」〜「6」のPCMデータを予測符号化し、予測
符号化データを図8に示すようなビットストリームで記
録媒体5や通信媒体6を介して復号側に伝送する。復号
側では第1と第2の復号化部3’−1、3’−2を有す
る復号化部3’により、図14に詳しく示すように6ch
「1」〜「6」の予測符号化データをPCMデータに復
号し、次いでミクス&マトリクス回路4’により式(1
−1)に基づいて元の6ch(Lf、C、Rf、Ls、R
s、Lfe)のみを復元する。
チャネルを圧縮するとともに再生側のダウンミクスを許
可する場合を示している。符号化側の6chミクス&マト
リクス回路1’は、元の6ch(Lf、C、Rf、Ls、
Rs、Lfe)と係数mij(i=1,2,j=1,2〜
6)により次式(2)のようにステレオ2chデータ
(L、R)を生成(ダウンミクス)する。 L=m11・Lf+m12・Rf+m13・C +m14・Ls+m15・Rs+m16・Lfe R=m21・Lf+m22・Rf+m23・C +m24・Ls+m25・Rs+m26・Lfe …(2)
次のような第1グループの2チャネル分の相関信号
「1」、「2」と第2グループの4チャネル分の相関信
号「3」〜「6」に変換し、それぞれ第1符号化部2’
−1、第2符号化部2’−2に出力する。 「1」=L+R 「2」=L−R 「3」〜「6」は式(1−1)と同じ …(1−2)
それぞれ第1グループチャネル「1」、「2」と第2グ
ループチャネル「3」〜「6」のPCMデータを予測符
号化し、各チャネルの予測符号化データを記録媒体5や
通信媒体6を介して復号側に伝送する。復号側では第
1、第2復号化部3’−1、3’−2により、それぞれ
第1グループチャネル「1」、「2」と第2グループチ
ャネル「3」〜「6」の予測符号化データをPCMデー
タに復号し、次いでミクス&マトリクス回路4’により
式(1−2)、(2)に基づいて元の6ch(Lf、C、
Rf、Ls、Rs、Lfe)を復元するとともに、第1
グループチャネル「1」、「2」を加算、減算すること
によりそれぞれステレオ2chデータ(L、R)を生成す
る。
チャネルを圧縮しないで伝送するとともに再生側のダウ
ンミクスを禁止する場合を示している。この場合には、
非圧縮であるので、符号化側では相関信号も生成するこ
となく元の6ch(Lf、C、Rf、Ls、Rs、Lf
e)のPCMデータをそのまま伝送し(ただし、フォー
マット化する)、復号化側ではデフォーマット化した
後、元の6ch(Lf、C、Rf、Ls、Rs、Lfe)
のみを復元する。
チャネルを圧縮しないで伝送するとともに再生側のダウ
ンミクスを許可する場合を示している。この場合にも、
非圧縮であるので、符号化側では圧縮率を高めるための
相関信号も生成することなく元の6ch(Lf、C、R
f、Ls、Rs、Lfe)のPCMデータをそのまま伝
送する(ただし、フォーマット化する)。復号化側では
デフォーマット化した後、元の6ch(Lf、C、Rf、
Ls、Rs、Lfe)を復元するとともに、式(2)に
よりステレオ2chデータ(L、R)を生成(ダウンミク
ス)する。
するとともに再生側のダウンミクスを禁止する場合の変
形例を示している。この場合には、符号化側では次式
(1−3)により6ch(1)〜(6)分の相関信号に変
換し、符号化部2’はこれを予測符号化する。そして、
復号化側では式(1−2)により元の6ch(Lf、C、
Rf、Ls、Rs、Lfe)のみを復元する。 「1」=Lf−C 「2」=Rf−C 「3」〜「6」は式(1−1)と同じ …(1−3) このように再生側のダウンミクスを禁止する場合は、こ
れに対応して式(2)のダウンミクス係数を符号化に加
えないとともに、符号化側で式(2)によりステレオ2
chデータ(L、R)を生成(ダウンミクス)すること
が禁じられる。
するとともに再生側のダウンミクスを許可する場合の変
形例を示している。この場合には、符号化側では式
(2)によりステレオ2chデータ(L、R)を生成(ダ
ウンミクス)し、次いで次式(1−4)により次のよう
な第1グループの2チャネル「1」、「2」と第2グル
ープの4チャネル分の相関信号「3」〜「6」に変換
し、第1、第2符号化部2’−1、2’−2はこの各グ
ループチャネルを予測符号化する。そして、復号化側で
は式(1−4)、(2)により元の6ch(Lf、C、R
f、Ls、Rs、Lfe)を復元するとともにステレオ
2chデータ(L、R)をそのまま出力する。 「1」=L 「2」=R 「3」〜「6」は式(1−1)と同じ …(1−4)
2について詳しく説明する。各ch「1」〜「6」のPC
Mデータは1フレーム毎に1フレームバッファ10に格
納される。そして、1フレームの各ch「1」〜「6」の
サンプルデータがそれぞれ予測回路13D1、13D
2、15D1〜15D4に印加されるとともに、各ch
「1」〜「6」の各フレームの先頭サンプルデータがフ
ォーマット化回路19に印加される。予測回路13D
1、13D2、15D1〜15D4はそれぞれ、各ch
「1」〜「6」のPCMデータに対して、特性が異なる
複数の予測器(不図示)により時間領域における過去の
信号から現在の信号の複数の線形予測値を算出し、次い
で原PCMデータと、この複数の線形予測値から予測器
毎の予測残差を算出する。続くバッファ・選択器14D
1、14D2、16D1〜16D4はそれぞれ、予測回
路13D1、13D2、15D1〜15D4により算出
された各予測残差を一時記憶して、選択信号/DTS
(デコーディング・タイム・スタンプ)生成器17によ
り指定されたサブフレーム毎に予測残差の最小値を選択
する。
ビット数フラグをパッキング回路18とフォーマット化
回路19に対して印加し、また、予測残差が最小の予測
器を示す予測器選択フラグと、相関係数aと、復号化側
が入力バッファ22a(図14)からストリームデータ
を取り出す時間を示すDTSをフォーマット化回路19
に対して印加する。パッキング回路18はバッファ・選
択器14D1、14D2、16D1〜16D4により選
択された6ch分の予測残差を、選択信号/DTS生成器
17により指定されたビット数フラグに基づいて指定ビ
ット数でパッキングする。またPTS生成器17cは、
復号化側が出力バッファ110(図14)からPCMデ
ータを取り出す時間を示すPTS(プレゼンテーション
・タイム・スタンプ)を生成してフォーマット化回路1
9に出力する。フォーマット化回路19にはまた、圧縮
/非圧縮などを示す符号化モードと、ダウンミクス許可
/禁止を示す識別子が印加される。
3に示すようなユーザデータにフォーマット化する。図
8に示すユーザデータ(サブパケット)は、前方グルー
プに関する2ch「1」、「2」の予測符号化データを含
む可変レートビットストリーム(サブストリーム)BS
0と、他のグループに関する4ch「3」〜「6」の予測
符号化データを含む可変レートビットストリーム(サブ
ストリーム)BS1と、サブストリームBS0、BS1
の前に設けられたビットストリームヘッダ(リスタート
ヘッダ)により構成されている。
フレーム分は ・フレームヘッダと、 ・各ch「1」〜「6」の1フレームの先頭サンプルデー
タと、 ・各ch「1」〜「6」のサブフレーム毎の予測器選択フ
ラグと、 ・各ch「1」〜「6」のサブフレーム毎のビット数フラ
グと、 ・各ch「1」〜「6」の予測残差データ列(可変ビット
数)と、 ・ch「6」の係数aとが、 多重化されている。このような予測符号化によれば、原
信号が例えばサンプリング周波数=96kHz、量子化
ビット数=24ビット、6チャネルの場合、71%の圧
縮率を実現することができる。
より予測符号化された可変レートビットストリームデー
タを、記録媒体の一例としてDVDオーディオディスク
に記録する場合には、図9に示すオーディオ(A)パッ
クにパッキングされる。このパックは2034バイトの
ユーザデータ(Aパケット、Vパケット)に対して4バ
イトのパックスタート情報と、6バイトのSCR(Syst
em Clock Reference:システム時刻基準参照値)情報
と、3バイトのMux レート(rate)情報と1バイトのス
タッフィングの合計14バイトのパックヘッダが付加さ
れて構成されている(1パック=合計2048バイ
ト)。この場合、タイムスタンプであるSCR情報を、
先頭パックでは「1」として同一タイトル内で連続とす
ることにより同一タイトル内のAパックの時間を管理す
ることができる。
示すように、19又は14バイトのパケットヘッダと、
圧縮PCMのプライベートヘッダと、図11に示すフォ
ーマットの1ないし2011バイトのオーディオデータ
(圧縮PCM)により構成されている。そして、DTS
とPTSは図5のパケットヘッダ内に(具体的にはパケ
ットヘッダの10〜14バイト目にPTSが、15〜1
9バイト目にDTSが)セットされる。圧縮PCMのプ
ライベートヘッダは、 ・1バイトのサブストリームIDと、 ・2バイトのUPC/EAN−ISRC(Universal Pr
oduct Code/European Article Number-International S
tandard Recording Code)番号、及びUPC/EAN−
ISRCデータと、 ・1バイトのプライベートヘッダ長と、 ・2バイトの第1アクセスユニットポインタと、 ・8バイトのオーディオデータ情報(ADI)と、 ・0〜7バイトのスタッフィングバイトとに、 より構成されている。
トをサーチするための前方アクセスユニット・サーチポ
インタと、1秒前のアクセスユニットをサーチするため
の後方アクセスユニット・サーチポインタがともに1バ
イトでセットされる。具体的にはADIの7バイト目に
前方アクセスユニット・サーチポインタが、8バイト目
に後方アクセスユニット・サーチポインタがセットされ
る。
う)のオーディオパケットにおけるオーディオデータエ
リアは、図11に示すようにサブパケットと複数のPP
CMアクセスユニットにより構成され、PPCMアクセ
スユニットはPPCMシンク情報とサブパケットにより
構成されている。最初のPPCMアクセスユニット内の
サブパケットは、ディレクトリと、サブストリーム
「0」と、CRCと、サブストリーム「1」と、CRC
とエクストラ情報により構成され、サブストリーム
「0」、「1」はPPCMブロックのみにより構成され
ている。2番目以降のPPCMアクセスユニット内のサ
ブパケットは、ディレクトリを除いてサブストリーム
「0」と、CRCと、サブストリーム「1」と、CRC
とエクストラ情報により構成され、サブストリーム
「0」、「1」はリスタートヘッダとPPCMブロック
により構成されている。
いう)は次の情報を含む。 ・1パケット当たりのサンプル数:サンプリング周波数
fsに応じて40、80又は160が選択される。 ・データレート:VBRの場合には「0」(サブパケッ
ト内のデータが圧縮データであることを示す識別子) ・サンプリング周波数fs及び量子化ビット数Qb ・チャネル割り当て情報
11に示すオーディオパックを管理するために図12、
図13に示すような管理情報を含むATSI(オーディ
オ・タイトル・セット・インフォーメーション)をフォ
ーマット化する。図12はAOTT−AOB−ATR
(オーディオオンリタイトル・オーディオオブジェクト
セット・アトリビュート)を示し、このAOTT−AO
B−ATR(b127〜b0)は、MSB側から順に ・8ビット(b127〜b120)のオーディオ符号化
モードと、 ・8ビット(b119〜b112)の保留領域と、 ・4ビット(b111〜b108)のチャネルグループ
「1」の量子化ビット数Q1と、 ・4ビット(b107〜b104)のチャネルグループ
「2」の量子化ビット数Q2と、 ・4ビット(b103〜b100)のチャネルグループ
「1」のサンプリング周波数fs1と、 ・4ビット(b99〜b96)のチャネルグループ
「2」のサンプリング周波数fs2と、 ・3ビット(b95〜b93)のマルチチャネル構造の
タイプと、 ・5ビット(b92〜b88)のチャネル割り当てと、 ・8ビット×11(b87〜b0)の保留領域により構
成されている。
数Q1(b111〜b108) 0000b:16ビット 0001b:20ビット 0010b:24ビット その他 :保留 (3)チャネルグループ2の量子化ビット数Q2(b1
07〜b104) ・チャネルグループ1の量子化ビット数Q1が「000
0b」の場合には「0000b」 ・チャネルグループ1の量子化ビット数Q1が「000
1b」の場合には「0000b」又は「0001b」 ・チャネルグループ1の量子化ビット数Q1が「001
0b」の場合には「0000b」、「0001b」又は
「0010b」 ただし、0000b:16ビット 0001b:20ビット 0010b:24ビット その他 :保留
周波数fs1(b103〜b100) 0000b:48kHz 0001b:96kHz 0010b:192kHz 1000b:44.1kHz 1001b:88.2kHz 1010b:176.4kHz その他 :保留
周波数fs2(b99〜b96) ・チャネルグループ1のサンプリング周波数fs1が
「0000b」の場合には「0000b」 ・チャネルグループ1のサンプリング周波数fs1が
「0001b」の場合には「0000b」又は「000
1b」 ・チャネルグループ1のサンプリング周波数fs1が
「0010b」の場合には「0000b」、「0001
b」又は「0010b」 ・チャネルグループ1のサンプリング周波数fs1が
「1000b」の場合には「1000b」 ・チャネルグループ1のサンプリング周波数fs1が
「1001b」の場合には「1000b」又は「100
1b」 ・チャネルグループ1のサンプリング周波数fs1が
「1010b」の場合には「1000b」、「1001
b」又は「1010b」
5〜b93) 000b:タイプ1 その他 :保留 (7)チャネル割り当て(b92〜b88) 1チャネル(モノラル)から6チャネルまでのグループ
「1」、「2」のチャネル割り当て情報
オタイトルセット・プログラム・コンテンツ)を示し、
これは先頭から順に ・1ビット(b31)の、前回と今回のPGの関係(R
/A)と、 ・1ビット(b30)のSTC不連続性フラグ(STC
−F)と、 ・3ビット(b29〜b27)のアトリビュート数(A
TRN)と、 ・3ビット(b26〜b24)のチャネルグループ(C
hGr)「2」のビットシフトデータと、 ・2ビット(b23、b22)の保留領域と、 ・1ビット(b21)のダウンミックスモード(D−
M)と、 ・1ビット(b20)のダウンミックス係数の有効性
(図示※)と、 ・4ビット(b19〜b16)のダウンミックス係数テ
ーブル番号(DM−COEFTN)と、 ・各々が1ビット、合計16ビット(b15〜b0)の
RTIフラグF15〜F0により構成されている。 そして、ビット(b21)のダウンミクスモード(D−
M)が「1」の場合に「ダウンミクス禁止」、「0」の
場合に「ダウンミクス許可」を表す。
−1、3’−2)について説明する。なお、この復号化
部3’(3’−1、3’−2)とミクス&マトリクス回
路4’は、ハードウエアの他にコンピュータプログラム
よっても実現することができる。上記フォーマットの可
変レートビットストリームデータBS0、BS1は、デ
フォーマット化回路21により分離される。そして、各
ch「1」〜「6」の1フレームの先頭サンプルデータ
と予測器選択フラグはそれぞれ予測回路24D1、24
D2、23D1〜23D4に印加され、各ch「1」〜
「6」のビット数フラグはアンパッキング回路22に印
加される。また、SCRと、DTSと予測残差データ列
は入力バッファ22aに印加され、PTSは出力バッフ
ァ110に印加される。また、圧縮/非圧縮などを示す
符号化モードと、ダウンミクス許可/禁止を示す識別子
は制御部100に印加され、サンプリング周波数fs及
び量子化ビット数QbはD/A変換器102に印加され
る。ここで、予測回路24D1、24D2、23D1〜
23D4内の複数の予測器(不図示)はそれぞれ、符号
化側の予測回路13D1、13D2、15D1〜15D
4内の複数の予測器と同一の特性であり、予測器選択フ
ラグにより同一特性のものが選択される。
たストリームデータ(予測残差データ列)は、図15に
示すようにSCRによりアクセスユニット毎に入力バッ
ファ22aに取り込まれて蓄積される。ここで、1つの
アクセスユニットのデータ量は、例えばfs=96kH
zの場合には(1/96kHz)秒分であるが、図1
6、図17(a)に詳しく示すように可変長である。そ
して、入力バッファ22aに蓄積されたストリームデー
タはDTSに基づいてFIFOで読み出されてアンパッ
キング回路22に印加される。
「6」の予測残差データ列をビット数フラグ毎に基づい
て分離してそれぞれ予測回路24D1、24D2、23
D1〜23D4に出力する。予測回路24D1、24D
2、23D1〜23D4ではそれぞれ、アンパッキング
回路22からの各ch「1」〜「6」の今回の予測残差
データと、内部の複数の予測器の内、予測器選択フラグ
により選択された各1つにより予測された前回の予測値
が加算されて今回の予測値が算出され、次いで1フレー
ムの先頭サンプルデータを基準として各サンプルのPC
Mデータが算出されて出力バッファ110に蓄積され
る。出力バッファ110に蓄積されたPCMデータはP
TSに基づいて読み出されて出力され、したがって、図
17(a)に示す可変長のアクセスユニットが伸長され
て、図17(b)に示す一定長のプレゼンテーションユ
ニットが出力される。
グ周波数fs及び量子化ビット数Qbに基づいて、PC
MデータがD/A変換器102によりアナログ信号に変
換される。ここで、操作部101を介してサーチ再生が
指示された場合には、制御部100により図5に示す前
方アクセスユニット・サーチポインタ(1秒先)と後方
アクセスユニット・サーチポインタ(1秒前)に基づい
てアクセスユニットを再生する。このサーチポインタと
しては、1秒先、1秒前の代わりに2秒先、2秒前のも
のでよい。
り予測符号化された可変レートビットストリームデータ
をネットワークを介して伝送する場合には、符号化側で
は図18に示すように伝送用にパケット化し(ステップ
S41)、次いでパケットヘッダを付与し(ステップS
42)、次いでこのパケットをネットワーク上に送り出
す(ステップS43)。
ダを除去し(ステップS51)、次いでデータを復元し
(ステップS52)、次いでこのデータをメモリに格納
して復号を待つ(ステップS53)。そして、復号を行
う場合には図19(B)に示すように、デフォーマット
化を行い(ステップS61)、次いで入力バッファ22
aの入出力制御を行い(ステップS62)、次いでアン
パッキングを行う(ステップS63)。なお、このと
き、サーチ再生指示がある場合にはサーチポインタをデ
コードする。次いで予測器をフラグに基づいて選択して
デコードを行い(ステップS64)、次いで出力バッフ
ァ110の入出力制御を行い(ステップS65)、次い
で元のマルチチャネルを復元し(ステップS66)、次
いでこれを出力し(ステップS67)、以下、これを繰
り返す。
形態について説明する。上記の実施形態では、1グルー
プの相関性の信号「1」〜「6」を予測符号化するよう
に構成されているが、この第4の実施形態では複数グル
ープの相関性のある信号を生成して予測符号化し、圧縮
率が最も高いグループの予測符号化データを選択するよ
うに構成されている。このため図20に示す符号化部で
は、第1〜第nの相関回路1−1〜1−nが設けられ、
このn個の相関回路1−1〜1−nは例えば6ch(L
f、C、Rf、Ls、Rs、Lfe)のPCMデータ
を、相関性が異なるn種類の6ch信号「1」〜「6」に
変換する。
に変換し、 (1)=Lf (2)=C−(Ls+Rs)/2 (3)=Rf−Lf (4)=Ls−a×Lfe (5)=Rs−b×Rf (6)=Lfe また、第nの相関回路1−nは以下のように変換する。 (1)=Lf+Rf (2)=C−Lf (3)=Rf−Lf (4)=Ls−Lf (5)=Rs−Lf (6)=Lfe−C
路15とバッファ・選択器16が設けられ、グループ毎
の予測残差の最小値のデータ量に基づいて圧縮率が最も
高いグループが相関選択信号生成器17bにより選択さ
れる。このとき、フォーマット化回路19はその選択フ
ラグ(相関回路選択フラグ、その相関回路の相関係数
a、b)を追加して多重化する。
側の相関回路1−1〜1−nに対してn個の相関回路4
−1〜4−n(又は係数a、bが変更可能な1つの相関
回路4)が設けられる。なお、図20に示すnグループ
の予測回路が同一の構成である場合、復号装置では図2
1に示すようにnグループ分の予測回路を設ける必要は
なく、1つのグループ分の予測回路でよい。そして、符
号化装置から伝送された選択フラグに基づいて相関回路
4−1〜4−nの1つを選択、又は係数a、bを設定し
て元の6ch(Lf、C、Rf、Ls、Rs、Lfe)を
復元し、また、式(2)によりマルチチャネルをダウン
ミクスしてステレオ2chデータ(L、R)を生成する。
の相関性の信号「1」〜「6」を予測符号化するように
構成されているが、この信号「1」〜「6」のグループ
と原信号(Lf、C、Rf、Ls、Rs、Lfe)のグ
ループを予測符号化し、圧縮率が高い方のグループを選
択するようにしてもよい。本発明によれば、特許請求の
範囲に記載した発明の他に、次のような発明が提供され
る。マルチチャネルの音声信号が圧縮されたデータ又は
圧縮されないデータを選択的にオーディオパケットに配
置するフォーマット化手段と、前記オーディオパケット
内のマルチチャネルデータが圧縮されているか否か、あ
るいは、前記オーディオパケット内のマルチチャネルデ
ータをステレオ2チャネルにダウンミクスすることを許
可するか又は禁止するかによってあらかじめダウンミク
スして符号化するか否か、あるいはダウンミクス係数を
符号化するか否かを選択する手段とを、有する音声符号
化装置。
ルチチャネルを圧縮又は非圧縮で選択的に伝送する場合
に、マルチチャネルデータが圧縮されているか否かを示
す識別子と、マルチチャネルデータをステレオ2チャネ
ルにダウンミクスすることを許可するか又は禁止するか
を示す識別子をともに伝送するようにしたので、マルチ
チャネルを圧縮又は非圧縮で選択的に伝送したり、再生
側のダウンミクスを選択的に許可又は禁止しても再生側
が正常に再生することができる。
の例を示す説明図である。
の例を示す説明図である。
の例を示す説明図である。
の例を示す説明図である。
る。
トストリームを示す説明図である。
ある。
示す説明図である。
ットを詳しく示す説明図である。
R(オーディオオンリタイトル・オーディオオブジェク
トセット・アトリビュート)を示す説明図である。
(オーディオタイトルセット・プログラム・コンテン
ツ)を示す説明図である。
る。
タイミングを示すタイミングチャートである。
明図である。
ットを示す説明図である。
ック図である。
ク図である。
(バッファ・選択器14D1,14D2,16D1〜1
6D4と共に圧縮手段を構成する。) 14D1,14D2,16D1〜16D4 バッファ・
選択器 17 選択信号/DTS生成器 17c PTS生成器 19 フォーマット化回路 21 デフォーマット化回路(分離手段) 22 アンパッキング回路 22a 入力バッファ 24D1,24D2,23D1〜23D4 予測回路
(伸長手段) 100 制御部(再生手段) 102 D/A変換器 110 出力バッファ
Claims (5)
- 【請求項1】 マルチチャネルの音声信号が圧縮された
データ又は圧縮されないデータが選択的に配置されるオ
ーディオパケットと、 前記オーディオパケット内のマルチチャネルデータが圧
縮されているか否かを示す第1の識別子と、前記オーデ
ィオパケット内のマルチチャネルデータをステレオ2チ
ャネルにダウンミクスすることを許可するか又は禁止す
るかを示す第2の識別子が配置された管理情報とを、 有するデータ構造にフォーマット化する手段を有する音
声符号化装置。 - 【請求項2】 マルチチャネルの音声信号が圧縮された
データ又は圧縮されないデータが選択的に配置されるオ
ーディオパケットと、 前記オーディオパケット内のマルチチャネルデータが圧
縮されているか否かを示す第1の識別子と、前記オーデ
ィオパケット内のマルチチャネルデータをステレオ2チ
ャネルにダウンミクスすることを許可するか又は禁止す
るかを示す第2の識別子が配置された管理情報とを、 有するデータ構造が記録された記録媒体。 - 【請求項3】 請求項1記載のデータ構造を復号化する
音声復号化装置であって、 前記データ構造をオーディオパケットと管理情報に分離
する手段と、 前記管理情報内の第2の識別子がダウンミクスすること
を許可する場合に前記オーディオパケット内のマルチチ
ャネルデータを前記第1の識別子に基づいて選択的に伸
長するか又は伸長しないでマルチチャネルとステレオ2
チャネルで再生し、ダウンミクス識別子がダウンミクス
することを禁止する場合に前記オーディオパケット内の
マルチチャネルデータを前記第1の識別子に基づいて選
択的に伸長するか又は伸長しないでマルチチャネルのみ
で再生する手段とを、 有する音声復号化装置。 - 【請求項4】 請求項1記載のデータ構造を通信回線を
介して伝送することを特徴とする音声伝送方法。 - 【請求項5】 請求項1記載のデータ構造を復号化する
コンピュータプログラムが記録されたコンピュータ記録
媒体であって、 前記コンピュータプログラムは、 前記データ構造をオーディオパケットと管理情報に分離
するステップと、 前記管理情報内の第2の識別子がダウンミクスすること
を許可する場合に前記オーディオパケット内のマルチチ
ャネルデータを前記第1の識別子に基づいて選択的に伸
長するか又は伸長しないでマルチチャネルとステレオ2
チャネルで再生し、ダウンミクス識別子がダウンミクス
することを禁止する場合に前記オーディオパケット内の
マルチチャネルデータを前記第1の識別子に基づいて選
択的に伸長するか又は伸長しないでマルチチャネルのみ
で再生するステップとを、 有するコンピュータ記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP34235498A JP3173482B2 (ja) | 1998-11-16 | 1998-11-16 | 記録媒体、及びそれに記録された音声データの音声復号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP34235498A JP3173482B2 (ja) | 1998-11-16 | 1998-11-16 | 記録媒体、及びそれに記録された音声データの音声復号化装置 |
Related Child Applications (11)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001010405A Division JP3196778B1 (ja) | 2001-01-18 | 2001-01-18 | 音声符号化方法及び音声復号化方法 |
JP2001010402A Division JP3228473B2 (ja) | 2001-01-18 | 2001-01-18 | 記録媒体、及びそれに記録された音声データの音声復号化装置 |
JP2001010406A Division JP3228475B2 (ja) | 2001-01-18 | 2001-01-18 | 音声伝送方法及びコンピュータプログラム記録媒体 |
JP2001010408A Division JP3846194B2 (ja) | 2001-01-18 | 2001-01-18 | 音声符号化方法,音声復号化方法,音声受信装置及び音声信号伝送方法 |
JP2001010398A Division JP3173608B1 (ja) | 2001-01-18 | 2001-01-18 | 音声符号化装置及び音声復号化装置 |
JP2001010401A Division JP3196776B1 (ja) | 2001-01-18 | 2001-01-18 | 音声符号化装置、音声伝送方法、及びコンピュータプログラム記録媒体 |
JP2001010404A Division JP3196777B1 (ja) | 2001-01-18 | 2001-01-18 | 記録媒体、及びそれに記録された音声データの音声復号化装置 |
JP2001010400A Division JP3196775B1 (ja) | 2001-01-18 | 2001-01-18 | 音声符号化方法及び音声復号化方法 |
JP2001010403A Division JP3228474B2 (ja) | 2001-01-18 | 2001-01-18 | 音声符号化装置及び音声復号化方法 |
JP2001010407A Division JP3196779B1 (ja) | 2001-01-18 | 2001-01-18 | 音声伝送方法及びコンピュータプログラム記録媒体 |
JP2001010399A Division JP3173609B1 (ja) | 2001-01-18 | 2001-01-18 | 音声符号化方法及び音声復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000156038A true JP2000156038A (ja) | 2000-06-06 |
JP3173482B2 JP3173482B2 (ja) | 2001-06-04 |
Family
ID=18353085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP34235498A Expired - Lifetime JP3173482B2 (ja) | 1998-11-16 | 1998-11-16 | 記録媒体、及びそれに記録された音声データの音声復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3173482B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090582A (ja) * | 1998-09-07 | 2000-03-31 | Victor Co Of Japan Ltd | オーディオ信号の伝送方法、オーディオディスク、エンコード装置及びデコード装置 |
JP2005352396A (ja) * | 2004-06-14 | 2005-12-22 | Matsushita Electric Ind Co Ltd | 音響信号符号化装置および音響信号復号装置 |
WO2006135165A1 (en) * | 2005-06-15 | 2006-12-21 | Lg Electronics Inc. | Recording medium, apparatus for mixing audio data and method thereof |
JP2011518342A (ja) * | 2008-03-04 | 2011-06-23 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
US8504376B2 (en) | 2006-09-29 | 2013-08-06 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
CN111263196A (zh) * | 2013-12-16 | 2020-06-09 | 松下电器(美国)知识产权公司 | 发送方法、接收方法、发送装置以及接收装置 |
-
1998
- 1998-11-16 JP JP34235498A patent/JP3173482B2/ja not_active Expired - Lifetime
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090582A (ja) * | 1998-09-07 | 2000-03-31 | Victor Co Of Japan Ltd | オーディオ信号の伝送方法、オーディオディスク、エンコード装置及びデコード装置 |
JP2005352396A (ja) * | 2004-06-14 | 2005-12-22 | Matsushita Electric Ind Co Ltd | 音響信号符号化装置および音響信号復号装置 |
WO2005122639A1 (ja) * | 2004-06-14 | 2005-12-22 | Matsushita Electric Industrial Co., Ltd. | 音響信号符号化装置および音響信号復号装置 |
WO2006135165A1 (en) * | 2005-06-15 | 2006-12-21 | Lg Electronics Inc. | Recording medium, apparatus for mixing audio data and method thereof |
US8504376B2 (en) | 2006-09-29 | 2013-08-06 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US8625808B2 (en) | 2006-09-29 | 2014-01-07 | Lg Elecronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US8762157B2 (en) | 2006-09-29 | 2014-06-24 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US9384742B2 (en) | 2006-09-29 | 2016-07-05 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US9792918B2 (en) | 2006-09-29 | 2017-10-17 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
JP2011518342A (ja) * | 2008-03-04 | 2011-06-23 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
CN111263196A (zh) * | 2013-12-16 | 2020-06-09 | 松下电器(美国)知识产权公司 | 发送方法、接收方法、发送装置以及接收装置 |
Also Published As
Publication number | Publication date |
---|---|
JP3173482B2 (ja) | 2001-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3173482B2 (ja) | 記録媒体、及びそれに記録された音声データの音声復号化装置 | |
JP4148157B2 (ja) | 音声信号伝送方法及び音声信号復号化装置 | |
JP3173608B1 (ja) | 音声符号化装置及び音声復号化装置 | |
JP3196778B1 (ja) | 音声符号化方法及び音声復号化方法 | |
JP3228474B2 (ja) | 音声符号化装置及び音声復号化方法 | |
JP3196775B1 (ja) | 音声符号化方法及び音声復号化方法 | |
JP3196776B1 (ja) | 音声符号化装置、音声伝送方法、及びコンピュータプログラム記録媒体 | |
JP3196777B1 (ja) | 記録媒体、及びそれに記録された音声データの音声復号化装置 | |
JP3173609B1 (ja) | 音声符号化方法及び音声復号化方法 | |
JP3228473B2 (ja) | 記録媒体、及びそれに記録された音声データの音声復号化装置 | |
JP3228475B2 (ja) | 音声伝送方法及びコンピュータプログラム記録媒体 | |
JP2001255899A (ja) | 音声受信方法及び音声受信装置 | |
JP3196779B1 (ja) | 音声伝送方法及びコンピュータプログラム記録媒体 | |
JP4151020B2 (ja) | 音声信号伝送方法及び音声信号復号化装置 | |
JP4151018B2 (ja) | 音声信号伝送方法及び音声信号復号化装置 | |
JP2003177795A (ja) | 音声符号化方法及び音声復号化方法 | |
JP2003249019A (ja) | 音声符号化装置及び音声復号化装置 | |
JP2003263198A (ja) | 音声符号化装置及び音声復号化装置 | |
JP2003177793A (ja) | 音声符号化方法及び音声復号化方法 | |
JP2003223197A (ja) | 音声符号化方法及び音声復号化方法 | |
JP2003216191A (ja) | 音声符号化方法及び音声復号化方法 | |
JP2003177794A (ja) | 音声符号化方法及び音声復号化方法 | |
JP2003177792A (ja) | 音声符号化方法及び音声復号化方法 | |
JP2003216194A (ja) | 音声符号化装置及び音声復号化装置 | |
JP2003263196A (ja) | 音声符号化装置及び音声復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010227 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090330 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090330 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100330 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110330 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120330 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120330 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20190330 Year of fee payment: 18 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20190330 Year of fee payment: 18 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20190330 Year of fee payment: 18 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |