JP3632891B2 - Audio signal transmission method, audio disc, encoding device, and decoding device - Google Patents

Audio signal transmission method, audio disc, encoding device, and decoding device Download PDF

Info

Publication number
JP3632891B2
JP3632891B2 JP26901798A JP26901798A JP3632891B2 JP 3632891 B2 JP3632891 B2 JP 3632891B2 JP 26901798 A JP26901798 A JP 26901798A JP 26901798 A JP26901798 A JP 26901798A JP 3632891 B2 JP3632891 B2 JP 3632891B2
Authority
JP
Japan
Prior art keywords
audio
channel
signal
audio signal
ats
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26901798A
Other languages
Japanese (ja)
Other versions
JP2000090582A (en
Inventor
美昭 田中
弘明 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP26901798A priority Critical patent/JP3632891B2/en
Publication of JP2000090582A publication Critical patent/JP2000090582A/en
Application granted granted Critical
Publication of JP3632891B2 publication Critical patent/JP3632891B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、マルチチャネルを2チャネルにダウンミックス(ミックスダウンともいう)して再生するためのオーディオ信号の伝送方法、オーディオディスク、エンコード装置及びデコード装置に関し、例えばカラオケシステムに好適なオーディオ信号の伝送方法、オーディオディスク、エンコード装置及びデコード装置に関する。
【0002】
【従来の技術】
一般に、CDなどの記録媒体には音楽ソースが2チャネルのオーディオデータで記録されるが、マルチチャネルに記録してもよく、この場合には2チャネルに比べてマルチチャネルのデータ量が膨大になるので、演奏時間(記録時間)が減少する。そこで、CDより記録容量が大きいDVDビデオにマルチチャネルデータを記録すれば演奏時間(記録時間)が長くなるので、長時間の音楽ソースを記録することができ、したがって、例えばカラオケシステムにおける楽曲データを記録する場合に好適である。
【0003】
従来、カラオケ用楽曲データをマルチチャネルで媒体を介して伝送する方法としては、例えば特開平9−46799号公報(特許番号第2766466号)に示されるように、一般的なサラウンドシステムをカラオケなどの特殊用途に用いるために、音楽ソースの主チャネル及び従チャネルを含むマルチチャネル信号とともに、その音楽ソースが通常のマルチチャネルモードであるか、又はカラオケなどの特殊用途モードであるかを再生装置に伝送する方法が提案されている。また、この方法では音楽ソースがドルビーAC−3方式で圧縮されて伝送される。
【0004】
そして、この方法では、デコーダ側はサラウンド用ミキシング係数発生器と特殊用途(カラオケ)用ミキシング係数発生器を備え、伝送データからマルチチャネルモードを検出した場合には主チャネル及び従チャネルの両方が出力されるように、そのままマルチチャネルで出力したり、主チャネル及び従チャネルに対して所定のサラウンド用ミキシング係数を乗算して2チャネルにダウンミックスして出力し、他方、特殊用途モードの場合には、例えば伴奏チャネルのみを再生してボーカルチャネルを再生しないように、主チャネル及び従チャネルに対して所定の特殊用途用ミキシング係数を乗算してマルチチャネル又はダウンミックス2チャネルで出力する。
【0005】
【発明が解決しようとする課題】
しかしながら、上記従来の方法では、デコーダ側が特殊用途モードを検出した場合に特殊用途用ミキシング係数発生器の係数を各チャネルに乗算するので、ユーザの所望のミキシング具合で再生することができず、また、ユーザが係数を変更可能にすると、このミキシング操作が熟練度を要するので操作が面倒となるという問題点がある。また、ユーザにとって伴奏とボーカルを含む通常の音楽ソースから伴奏のみを再生し、ボーカルを再生しないようにしてカラオケとして再生することができない。
【0006】
また、上記従来の方法では、一般的なサラウンドシステムをカラオケなどの特殊用途に用いるために、その音楽ソースが通常のマルチチャネルモードであるか、又はカラオケなどの特殊用途モードであるかを示す情報を伝送するので、その音楽ソースがマルチチャネルモードか又は特殊用途モードかがあらかじめソース提供者により決められており、したがって、ユーザにとって自由度がない。また、上記従来例では、再生装置が通常のマルチチャネルモードであるか、又はカラオケなどの特殊用途モードであるかを検出しなければならないので、この検出機能を持たない再生装置は特殊用途モードで再生することができない。さらに、上記従来例では、音楽ソースをドルビーAC−3方式で圧縮して伝送するので音質が悪い。
【0007】
本発明は上記従来例の問題点に鑑み、マルチチャネルを2チャネルにダウンミックスして再生する場合にユーザにとって使い勝手が良いオーディオ信号の伝送方法、オーディオディスク、エンコード装置及びデコード装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明は上記目的を達成するために、例えば伴奏音楽などの第1のオーディオ信号とボーカル音楽などの第2のオーディオ信号を含むマルチチャネル信号をステレオ2チャネルにダウンミックスするための最適な係数を記録媒体や通信媒体を介して伝送するようにしたものである。
【0009】
すなわち本発明によれば、少なくとも2チャネルの第1のオーディオ信号と少なくとも1チャネルの第2のオーディオ信号を含むマルチチャネル信号と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1、第2のオーディオ信号の両方を再生するための第1の係数と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1のオーディオ信号を再生して前記第2のオーディオ信号を再生しないための第2の係数を伝送するステップと、
前記第1の係数に基づいて前記マルチチャネル信号をダウンミックスして前記第1、第2のオーディオ信号の両方を含むステレオ2チャネル信号を生成するモード又はタイトルと、前記第2の係数に基づいて前記マルチチャネル信号をダウンミックスして前記第1のオーディオ信号を含み、前記第2のオーディオ信号を含まないステレオ2チャネル信号を生成するモード又はタイトルの1つを選択するステップと、
前記選択されたモード又はタイトルでマルチチャネル信号をステレオ2チャネル信号にダウンミックスするステップとを、
有するオーディオ信号の伝送方法が提供される。
【0010】
また本発明によれば、少なくとも2チャネルの第1のオーディオ信号と少なくとも1チャネルの第2のオーディオ信号を含むマルチチャネル信号と、
前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1、第2のオーディオ信号の両方を再生するための第1の係数と、
前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1のオーディオ信号を再生して前記第2のオーディオ信号を再生しないための第2の係数とを、
有するデータ構造が記録されたオーディオディスクが提供される。
【0011】
また本発明によれば、音楽ソースを少なくとも2チャネルの第1のオーディオ信号と少なくとも1チャネルの第2のオーディオ信号を含むマルチチャネル信号と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1、第2のオーディオ信号の両方を再生するための第1の係数と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1のオーディオ信号を再生して前記第2のオーディオ信号を再生しないための第2の係数を有するデータ構造にフォーマット化する手段を、
有するエンコード装置が提供される。
【0012】
また本発明によれば、少なくとも2チャネルの第1のオーディオ信号と少なくとも1チャネルの第2のオーディオ信号を含むマルチチャネル信号と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1、第2のオーディオ信号の両方を再生するための第1の係数と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1のオーディオ信号を再生して前記第2のオーディオ信号を再生しないための第2の係数を有するデータ構造をデコードするデコード装置であって、
前記第1の係数に基づいて前記マルチチャネル信号をダウンミックスして前記第1、第2のオーディオ信号の両方を含むステレオ2チャネル信号を生成するモード又はタイトルと、前記第2の係数に基づいて前記マルチチャネル信号をダウンミックスして前記第1のオーディオ信号を含み、前記第2のオーディオ信号を含まないステレオ2チャネル信号を生成するモード又はタイトルの1つを選択する手段と、
前記選択されたモード又はタイトルでマルチチャネル信号をステレオ2チャネル信号にダウンミックスする手段とを、
有するデコード装置が提供される。
【0013】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
図1は一例としてDVDオーディオディスクの基本フォーマットを示している。この基本フォーマットはATS(オーディオ・タイトルセット)を有し、このATSは、先頭から順に
・ATSI(ATSインフォメーション)と、
・図2〜図6に詳しく示すオーディオ・オンリ・タイトル用のオーディオ・オブジェクト・セット(AOTT−AOBS)と
・バックアップ用のATSIにより構成されている。
【0014】
ATSIは先頭から順に
・図7〜図11に詳しく示すATSI−MAT(ATSIマネージメント・テーブル)と
・図12〜図24に詳しく示すATS−PGCIT(ATSプログラム・チェーン・インフォメーション・テーブル)により構成されている。
【0015】
AOTT−AOBSは図2に詳しく示すように、複数のオーディオ・オンリ・タイトル用のオーディオ・オブジェクト(AOTT−AOB)により構成されている。AOTT−AOBの各々は複数のプログラム(PG)により構成され、プログラムの各々は複数のセル(ATS−C)により構成されている。AOTT−AOBは、オーディオデータのみを含むものと、オーディオデータ及びリアル・タイム・インフォメーション・データ(RTIデータ)を含むものと、オーディオデータ、スチル・ピクチャ・データ(SPCTデータ)及びRTIデータを含むものの3種類のAOTT−AOBにより構成されている。そして、1枚のディスク中や1曲中に1種類以上のAOTT−AOBが配置される。
【0016】
オーディオデータのみを含む第1のAOTT−AOBの各プログラムは複数のオーディオセル(ATS−C)により構成され、このオーディオセルは複数のオーディオパックのみにより構成されている。オーディオデータ及びRTIデータを含む第2のAOTT−AOBの各プログラムは複数のオーディオセル(ATS−C)により構成され、このオーディオセルは2番目のパック位置に配置されたRTIパックと、他のパック位置に配置されたオーディオパックにより構成されている。
【0017】
また、オーディオデータ、SPCTデータ及びRTIデータを含む第3のAOTT−AOBの各プログラムは先頭から順にピクチャセルと、サイレントセルとオーディオセルにより構成されている。そして、ピクチャセルは複数のSPCTパックのみにより構成され、サイレントセルは複数のオーディオパック(無音)のみにより構成され、このオーディオセルは2番目のパック位置に配置されたRTIパックと、他のパック位置に配置されたオーディオパックにより構成されている。
【0018】
リニアPCMのAパックは2048バイト以下で構成され、その内訳は図3に示すように14バイトのパックヘッダとAパケットにより構成されている。Aパケットは17、9又は14バイトのパケットヘッダと、図4に詳しく示すプライベートヘッダと、1ないし2011バイトのオーディオデータ(リニアPCM)により構成されている。
【0019】
プライベートヘッダは、図4に示すように
・8ビットのサブストリームIDと、
・3ビットの保留領域と、
・5ビットのUPC/EAN−ISRC(Universal Product Code/European Article Number−International Standard Recording Code)番号と、
・8ビットのUPC/EAN−ISRCデータと、
・8ビットのプライベートヘッダ長と、
・16ビットの第1アクセスユニットポインタと、
・8バイトのオーディオデータインフォメーション(ADI)と
・0〜8バイトのスタッフィングバイト
により構成されている。
【0020】
ADIは
・1ビットのオーディオ・エンファシス・フラグと、
・1ビットの保留領域と、
・1ビットのダウンミックスモードと、
・1ビットのダウンミックスコード有効性と、
・4ビットのダウンミックスコードと、
・4ビットのグループ「1」の量子化ワード長「1」と、
・4ビットのグループ「2」の量子化ワード長「2」と、
・4ビットのグループ「1」のオーディオ・サンプリング周波数fs1と、
・4ビットのグループ「2」のオーディオ・サンプリング周波数fs2と、
・4ビットの保留領域と、
・4ビットのマルチチャネルタイプと、
・3ビットのチャネルグループ「2」のビットシフトデータ(図6参照)と、
・5ビットのチャネル割り当て情報(図12参照)と、
・8ビットのダイナミックレンジ制御情報と、
・8×2ビットの保留領域
により構成されている。
【0021】
次に図5を参照してRTIパックの構成を詳しく説明する。このパックは14バイトのパックヘッダとRTIパケットにより構成され、RTIパケットは17又は14バイトのパケットヘッダと、RTIプライベートヘッダと、1ないし2015バイトのRTIデータにより構成されている。RTIデータはオーディオデータに関する文字情報や再生制御情報である。
【0022】
RTIパケットのプライベートヘッダは、
・1バイトのサブストリームIDと、
・2バイトのUPC/EAN−ISRC番号及びデータ(図ではこれらを単にISRCと表記)と、
・1バイトのプライベートヘッダ長と、
・1バイトのRTI情報IDと、
・0〜7バイトのスタッフィングバイト
により構成されている。
上記UPC/EAN−ISRC番号及びデータは、SPCTパックに収められるスチルピクチャの著作権に関するUPC/EAN−ISRC番号及びデータである。
【0023】
SPCTパックは図6に詳しく示すように、14バイトのパックヘッダとSPCTパケットにより構成され、SPCTパケットは22又は19又は9バイトのパケットヘッダと2025バイト以下のSPCT(スチル・ピクチャ)データにより構成されている。ここで、1枚の静止画はMPEG1又はMPEG2方式で圧縮されてIピクチャとイントラ・コーデッド・ピクチャにより構成され、1つのピクチャセル内で分割されてSPCTパックのSPCTデータとして配置される。
SPCTパックのパケットヘッダ内に、RTIパックで説明したようにスチルピクチャの著作権に関するUPC/EAN−ISRC番号及びデータを含めてもよい。
【0024】
図1に示したATSI−MATは、図7に詳しく示すように2048バイト(リラティブ・バイト・ポジションRBP0〜2047)で構成され、先頭から順に
・12バイト(RBP0〜11)のATS識別子(ATS−ID)と、
・4バイト(RBP12〜15)のATSのエンドアドレス(ATS−EA)と、
・12バイト(RBP16〜27)の保留領域と、
・4バイト(RBP28〜31)のATSIのエンドアドレス(ATSI−EA)と、
・2バイト(RBP32〜33)のバージョン番号(VERN)と、
・94バイト(RBP34〜127)の保留領域と、
・4バイト(RBP128〜131)のATSI−MATのエンドアドレスと、
・60バイト(RBP132〜191)の保留領域と、
・4バイト(RBP192〜195)のAOTT用のVTSのスタートアドレスと、
・4バイト(RBP196〜199)のAOTT用のAOBSのスタートアドレス又はAOTT用のVOBSのスタートアドレスと、
・4バイト(RBP200〜203)の保留領域と、
・4バイト(RBP204〜207)のATS−PGCITのスタートアドレスと、
・48バイト(RBP208〜255)の保留領域と、
・128(16×8)バイト(RBP256〜383)のAOTT用のAOBのアトリビュート(AOTT−AOB−ATR)又はAOTT用のVOBのオーディオストリームのアトリビュート(AOTT−VOB−AST−ATR)と、
・288(18×8)バイト(RBP384〜671)の、マルチチャネルオーディオデータを2チャネルにダウンミックスするための係数(ATS−DM−COEFT#0〜#15)と、
・32バイト(RBP672〜703)の保留領域と、
・2バイト(RBP704〜705)の、AOTT用のAOBSにおけるスチルピクチャデータのアトリビュート(ATS−SPCT−ATR)と、
・1342バイト(RBP706〜2047)の保留領域により構成されている。
【0025】
128(16×8)バイト(RBP256〜383)のエリアには、このATSがAOTT用のAOBSを有する場合には、図8に詳しく示すAOTT−AOB−ATRが記述される。このAOTT−AOB−ATR(b127〜b0)は、MSB側から順に
・8ビット(b127〜b120)のオーディオ符号化モードと、
・8ビット(b119〜b112)の保留領域と、
・4ビット(b111〜b108)のチャネルグループ「1」の量子化ビット数Q1と、
・4ビット(b107〜b104)のチャネルグループ「2」の量子化ビット数Q2と、
・4ビット(b103〜b100)のチャネルグループ「1」のサンプリング周波数fs1と、
・4ビット(b99〜b96)のチャネルグループ「2」のサンプリング周波数fs2と、
・3ビット(b95〜b93)のマルチチャネル構造のタイプと、
・5ビット(b92〜b88)のチャネル割り当てと、
・8ビット×11(b87〜b0)の保留領域により構成されている。
【0026】
これに対し、このATSがAOTT用のAOBSを有しない場合には、図9に示すAOTT−VOB−AST−ATRが記述される。このAOTT−VOB−AST−ATR(b127〜b0)は、MSB側から順に
・8ビット(b127〜b120)のオーディオ符号化モードと、
・8ビット(b119〜b112)の保留領域と、
・4ビット(b111〜b108)の量子化ビット数Qと、
・4ビット(b107〜b104)の保留領域と、
・4ビット(b103〜b100)のサンプリング周波数fsと、
・4ビット(b99〜b96)の保留領域と、
・3ビット(b95〜b93)のマルチチャネル構造のタイプと、
・5ビット(b92〜b88)のチャネル割り当てと、
・3ビット(b87〜b85)のデコーディング・オーディオ・ストリーム数と、
・5ビット(b84〜b80)の保留領域と、
・2ビット(b79、b78)のMPEGオーディオ用DRCと、
・2ビット(b77、b76)の保留領域と、
・4ビット(b75〜b72)の圧縮オーディオチャネル数と、
・8ビット×9(b71〜b0)の保留領域により構成されている。
【0027】
上記データを以下に詳しく示す。
(1)オーディオ符号化モード(b127〜b120)
00000000b:リニアPCMモード
00000001b:圧縮オーディオ(ドルビーデジタル)用に保留
00000010b:圧縮オーディオ(MPEG2拡張無し)用に保留
00000011b:圧縮オーディオ(MPEG2拡張有り)用に保留
00000100b:圧縮オーディオ(DTS)用に保留
00000101b:圧縮オーディオ(SDDS)用に保留
その他 :その他の符号化モード用に保留
【0028】
(2)チャネルグループ1の量子化ビット数Q1(b111〜b108)
0000b:16ビット
0001b:20ビット
0010b:24ビット
その他 :保留
(3)チャネルグループ2の量子化ビット数Q2(b107〜b104)
・チャネルグループ1の量子化ビット数Q1が「0000b」の場合には「0000b」
・チャネルグループ1の量子化ビット数Q1が「0001b」の場合には「0000b」又は「0001b」
・チャネルグループ1の量子化ビット数Q1が「0010b」の場合には「0000b」、「0001b」又は「0010b」
ただし、0000b:16ビット
0001b:20ビット
0010b:24ビット
その他 :保留
【0029】
(4)チャネルグループ1のサンプリング周波数fs1(b103〜b100)
0000b:48kHz
0001b:96kHz
0010b:192kHz
1000b:44.1kHz
1001b:88.2kHz
1010b:176.4kHz
その他 :保留
【0030】
(5)チャネルグループ2のサンプリング周波数fs2(b99〜b96)
・チャネルグループ1のサンプリング周波数fs1が「0000b」の場合には「0000b」
・チャネルグループ1のサンプリング周波数fs1が「0001b」の場合には「0000b」又は「0001b」
・チャネルグループ1のサンプリング周波数fs1が「0010b」の場合には「0000b」、「0001b」又は「0010b」
・チャネルグループ1のサンプリング周波数fs1が「1000b」の場合には「1000b」
・チャネルグループ1のサンプリング周波数fs1が「1001b」の場合には「1000b」又は「1001b」
・チャネルグループ1のサンプリング周波数fs1が「1010b」の場合には「1000b」、「1001b」又は「1010b」
【0031】
(6)マルチチャネル構造のタイプ(b95〜b93)
000b:タイプ1
その他 :保留
(7)チャネル割り当て(b92〜b88)
図10は1チャネル(モノラル)から6チャネルまでのグループ「1」、「2」のチャネル割当情報を示している。ちなみに、図に示す記号を以下に説明する。
C(mono):モノラル
L,R :2チャネルステレオ
Lf :マルチチャネルのレフトフロント
Rf :マルチチャネルのライトフロント
C :マルチチャネルのセンター
LFE :マルチチャネルのLow Frequency Effect
S :マルチチャネルのサラウンド
Ls :マルチチャネルのレフトサラウンド
Rs :マルチチャネルのライトサラウンド
【0032】
(8)デコーディング・オーディオ・ストリーム数(b87〜b85)
「0」又は「1」
(9)MPEGオーディオ用DRC(b79、b78)
00b:MPEGオーディオストリーム内にDRCデータが存在しない。
01b:MPEGオーディオストリーム内にDRCデータが存在する。
【0033】
(10)圧縮オーディオチャネル数(b75〜b72)
オーディオ符号化モードがリニヤPCMオーディオの場合には「1111b」
0000b:1ch(モノ)
0001b:2ch(ステレオ)
0010b:3ch
0011b:4ch
0100b:5ch
0101b:6ch
0110b:7ch
0111b:8ch
その他 :保留
【0034】
図7に示した288(18×16)バイトのエリア(RBP384〜671)には、マルチチャネルオーディオデータを2チャネルにダウンミックスするために図11に示すようにテーブル番号「0」〜「15」の各ダウンミックス係数(ATS−DM−COEFT#0〜#15)が18バイトで記述される。
【0035】
図1に示したATS−PGCIT(ATSプログラム・チェーン・インフォメーション・テーブル)は、図12に詳しく示すように先頭から順に
・図13に詳しく示すオーディオ・タイトルセットPGCIテーブル・インフォメーション(ATS−PGCITI)と、
・図14、図15に詳しく示すn個のオーディオ・タイトルセットPGCIサーチポインタ(ATS−PGCI−SRP#1〜#n)と
・図16に詳しく示す複数のオーディオ・タイトルセットPGCI(ATS−PGCI)により構成されている。
【0036】
ATS−PGCITIは図13に詳しく示すように8バイトで構成され、先頭から順に
・2バイトのATS−PGCI−SRP#1〜#nの数と、
・2バイトの保留領域と、
・4バイトのATS−PGCITのエンドアドレスにより構成されている。ATS−PGCI−SRP#1〜#nの各々は、図14に詳しく示すように8バイトで構成され、先頭から順に
・図15に詳しく示すように4バイトのATS−PGCのカテゴリ(ATS−PGC−CAT)と
・4バイトのATS−PGCIのエンドアドレスにより構成されている。
【0037】
上記の4バイト(b31〜b0)のATS−PGCのカテゴリは、図15に詳しく示すように先頭から順に
・1ビット(b31)のエントリータイプと、
・7ビット(b30〜b24)のATSオーディオタイトル数(ATS−TTN)と、
・2ビット(b23、b22)のブロックモードと、
・2ビット(b21、b20)のブロックタイプと、
・4ビット(b19〜b16)のオーディオチャネル数と、
・8ビット(b15〜b8)のオーディオ符号化モードと、
・8ビット(b7〜b0)の保留領域により構成されている。
【0038】
上記カテゴリ(ATS−PGC−CAT)の内容を以下に詳しく示す。
(1)エントリータイプ(b31)
0b:エントリーPGCでない
1b:エントリーPGC
(2)ATSオーディオタイトル数(b30〜b24)
このATSのオーディオタイトル数を「1」〜「99」の範囲で記述する。
(3)ブロックモード(b23、b22)
00b:ATS−PGCブロックのATS−PGCでない
01b:ATS−PGCブロックの最初のATS−PGC
10b:保留
11b:ATS−PGCブロックの最後のATS−PGC
(4)ブロックタイプ(b21、b20)
00b:このブロックの一部でない
01b:オーディオコーディングモードのみの差分のブロック
10b:オーディオチャネルのみの差分のブロック
11b:オーディオコーディングモードとオーディオチャネルの両方の差分のブロック
(5)オーディオチャネル数(b19〜b16)
0000b:2チャネル以下
0001b:2チャネルを超える
【0039】
図12に示したオーディオ・タイトルセットPGCI(ATS−PGCI)の各々は、図16に詳しく示すように先頭から順に
・図17、図18に詳しく示すATS−PGCジェネラル・インフォメーション(ATS−PGC−GI)と、
・図19〜図21に詳しく示すATSプログラム・インフォメーション・テーブル(ATS−PGIT)と
・図22〜図24に詳しく示すATSセル・プレイバック・インフォメーション・テーブル(ATS−C−PBIT)により構成されている。
【0040】
ATS−PGC−GIは図17に詳しく示すように16バイト(RBP0〜15)で構成され、先頭から順に
・図18に詳しく示す4バイト(RBP0〜3)のATS−PGCコンテンツ(ATS−PGC−CNT)と、
・4バイト(RBP4〜7)のATS−PGCプレイバック・タイム(ATS−PGC−PB−TM)と、
・2バイト(RBP8、9)の保留領域と、
・2バイト(RBP10、11)のATS−PGITのスタートアドレスと、
・2バイト(RBP12、13)のATS−C−PBITのスタートアドレスと、
・2バイト(RBP14、15)の保留領域により構成されている。
【0041】
上記の4バイト(b31〜b0)のATS−PGCコンテンツは図18に詳しく示すように先頭から順に
・17ビット(b31〜b15)の保留領域と、
・7ビット(b14〜b8)のプログラム数と
・8ビット(b7〜b0)のセル数により構成されている。プログラム数は「1」〜「99」の範囲であり、セル数は「1」〜「255」の範囲である。
【0042】
図16に示したATSプログラム・インフォメーション・テーブル(ATS−PGIT)は、図19に詳しく示すようにn個のATSプログラム・インフォメーション(ATS−PGI)#1〜#nにより構成されている。ATS−PGI#1〜#nの各々は図20に詳しく示すように20バイト(RBP0〜19)で構成され、先頭から順に
・図21に詳しく示す4バイト(RBP0〜3)のATS−PGコンテンツ(ATS−PG−CNT)と、
・1バイト(RBP4)のATS−PGのエントリセル番号と、
・1バイト(RBP5)の保留領域と、
・4バイト(RBP6〜9)のATS−PGの最初のオーディオセルのスタート
・プレゼンテーション・タイム(FAC−S−PTM)と、
・4バイト(RBP10〜13)のATS−PGプレイバック・タイムと、
・4バイト(RBP14〜17)のATS−PGポーズ・タイムと、
・1バイト(RBP18)の保留領域(著作権管理データCMI用)と、
・1バイト(RBP19)の保留領域
により構成されている。
【0043】
上記2バイト(b31〜0)のATS−PGコンテンツは、図21に詳しく示すように先頭から順に
・1ビット(b31)の、前回と今回のPGの関係(R/A)と、
・1ビット(b30)のSTC不連続性フラグ(STC−F)と、
・3ビット(b29〜b27)のアトリビュート数(ATRN)と、
・3ビット(b26〜b24)のチャネルグループ(ChGr)「2」のビットシフトデータと、
・2ビット(b23、b22)の保留領域と、
・1ビット(b21)のダウンミックスモード(D−M)と、
・1ビット(b20)のダウンミックス係数の有効性(図示※)と、
・4ビット(b19〜b16)のダウンミックス係数テーブル番号(DM−COEFTN)と、
・各々が1ビット、合計16ビット(b15〜b0)のRTIフラグF15〜F0により構成されている。
【0044】
図16に示したATSセル・プレイバック・インフォメーション・テーブル(ATS−C−PBIT)は、図22に詳しく示すようにn個のATSセル・プレイバック・インフォメーション(ATS−C−PBI)#1〜#nにより構成されている。ATS−C−PBI#1〜#nの各々は、図23に詳しく示すように12バイト(RBP0〜11)により構成され、先頭から順に
・1バイト(RBP0)のATS−Cのインデックス番号と、
・図24に詳しく示すように1バイト(RBP1)のATS−Cタイプ(ATS−C−TY)と、
・2バイト(RBP2、3)の保留領域と、
・4バイト(RBP4〜7)のATS−Cのスタートアドレスと、
・4バイト(RBP8〜11)のATS−Cのエンドアドレスにより構成されている。
【0045】
1バイト(b7〜b0)のATS−Cタイプは、図24に詳しく示すように先頭から順に
・2ビット(b7、b6)のATSセル要素(ATS−C−COMP)と、
・2ビット(b5、b4)の保留領域と、
・4ビット(b3〜b0)のATSセル用途(ATS−C−Usage)により構成されている。
【0046】
上記データの内容を以下に詳しく示す。
(1)ATSセル要素(b7、b6)
00b:オーディオデータのみから成るオーディオセル
01b:オーディオデータとリアルタイムインフォメーションから成るオーディオセル
10b:サイレンス用のオーディオデータのみから成るサイレンスセル
11b:スチルピクチャのみから成るピクチャセル
(2)ATSセル用途(b3〜b0)
0000b:記述無し
0001b:スポットライトパート
その他 :保留
【0047】
次に上記のDVDオーディオディスクのエンコード装置について説明する。図25、図26はそれぞれエンコード装置の構成と処理を示している。アナログオーディオ信号AはA/Dコンバータ31により十分高いサンプリング周波数(サンプリング周期Δt)、例えば192kHzでサンプリングされて、例えば24ビットの高分解能のPCM信号に変換される。続くビットシフト/信号処理回路32では、圧縮を行わない場合には、A/Dコンバータ31により変換されたPCMデータがそのままDVDフォーマット化部34に印加される。これに対し、圧縮を行う場合には、A/Dコンバータ31により変換されたPCMデータがその符号化モードに応じてビットシフト/信号処理回路32により圧縮され、次いでDVDフォーマット化部34に印加される(ステップS5、S6)。ビットシフト/信号処理回路32ではまた、グループ「2」の各チャネルがビットシフトされる。
【0048】
また、ビデオ信号VはA/D変換器31Vによりデジタル信号に変換され、次いでこのデジタルビデオ信号がVエンコーダ32VによりMPEGフォーマットにエンコードされ、DVDフォーマット化部34に印加される(ステップS1、S2)。また、静止画信号SPはA/D変換器31SPによりデジタル信号に変換され、次いでこのデジタル静止画信号SPが圧縮エンコーダ32SPによりMPEGフォーマットにエンコードされ、DVDフォーマット化部34に印加される(ステップS3、S4)。また、著作権情報とリアルタイムテキスト(RT)情報がインタフェース(I/F)40を介して(ステップS7、S8)、また、文字情報とディスク識別子EXがDVDフォーマット化部34に印加される(ステップS9、S10)。
【0049】
そしてDVDフォーマット化部34は、各入力データを前述したようなフォーマットにパッキングする(ステップS11)。このDVDフォーマット化部34によりフォーマット化されたデータは、変調回路35によりディスクに応じた変調方式で変調されてこの変調データに基づいてディスクが製造されたり、記録部38にいったん記録されたり、通信I/F39を介して伝送される(ステップS12)。
【0050】
図27は上記エンコード装置の内のオーディオエンコード部を抜き出して示している。まず、入力端子101〜105にはマルチチャネル信号として、それぞれフロント左FL、センタC、フロント右FR、リア左又はカラオケ左RL/KL及びリア右/カラオケ右RR/KRの5チャネル信号が入力してDVDオーディオフォーマット化処理部106に印加される。また、この5チャネル信号をステレオ2チャネルにダウンミックスするための係数と文字データがそれぞれ入力端子107、109とI/F108、110を介してDVDオーディオフォーマット化処理部6に印加される。そして、DVDオーディオフォーマット化処理部106では操作入力部113の操作指示とシステムコントローラ114の制御に基づいて、マルチチャネル信号は図2に示すAパックに配置され、ダウンミックス係数は図11に示すATS−DM−COEFT#0〜#15に配置され、文字データは図2に示すRTIパックに配置される。
【0051】
ここで、入力ダウンミックス係数は、5チャネル信号をステレオ2チャネルにダウンミックスする場合に、熟練したミキサが推奨する複数通りの係数であり、また、ダウンミックス係数α、β、γを用いた変換式は次の通りである。
ステレオL=α×FL+β×C+γ×RL/KL
ステレオR=α×FR+β×C+γ×RR/KR
【0052】
そして、第1の利用例としては、伴奏音楽とボーカル音楽をそれぞれフロントチャネルFL、C、FRとリアチャネルRL/KL、RR/KRに配置して、
・通常の5チャネルのサラウンド再生を行うための係数α、β、γと、
・5チャネルを2チャネルL、Rにダウンミックスするとともに、リアチャネルRL/KL、RR/KRを2チャネルL、Rにミックスして再生を行うための係数α、β、γと、
・カラオケ再生を行うためにリアチャネルRL/KL、RR/KRを再生しないで5チャネルのサラウンド再生を行うための係数α、β、γと、
・5チャネルを2チャネルL、Rにダウンミックスするとともに、カラオケ再生を行うためにリアチャネルRL/KL、RR/KRを再生しないための係数α、β、γなどの複数通りの係数α、β、γを記録する方法が考えられる。
【0053】
また、第2の利用例としては、伴奏音楽をフロントチャネルFL、C、FRに配置するとともに、デュエットの男声ボーカルと女声ボーカルをそれぞれリアチャネルRL/KL、RR/KRに配置して、
・通常の5チャネルのサラウンド再生を行うための係数α、β、γと、
・2チャネルL、Rにダウンミックスして再生を行うための係数α、β、γと、
・男声、女声の両方を再生しないカラオケ再生を行うために5チャネルのサラウンド再生を行うための係数α、β、γと、
・男声、女声の両方を再生しないカラオケ再生を行うために2チャネルL、Rにダウンミックスして再生を行うための係数α、β、γと、
・男声、女声の一方を再生しないカラオケ再生を行うために5チャネルのサラウンド再生を行うための係数α、β、γと、
・男声、女声の一方を再生しないカラオケ再生を行うために2チャネルL、Rにダウンミックスして再生を行うための係数α、β、γなどの複数通りの係数α、β、γを記録する方法が考えられる。
【0054】
図28は上記のDVDオーディオディスクのデコード装置の具体的構成を示し、図29は図28の構成を機能的に示している。また、図30はその処理を示している。図28、図29において、まず、操作部18やリモコン装置19により曲目選択、再生、早送り、停止操作が行われると、制御部23はその操作に応じてドライブ装置2と再生装置17を制御し、再生時にはDVDオーディオディスク1に記録されたピットデータがドライブ装置2により読み取られた後、EFM復調される。
【0055】
再生装置17では、この信号が静止画及びVパック検出部3とA及びRTIパック検出部9に送られる。静止画パック、Vパックがディスク1に記録されている場合には、静止画及びVパック検出部3はこの再生データ中の静止画パック、Vパックを検出して制御パラメータをパラメータ部8に設定するとともに静止画パック、Vパックを静止画及びVパックバッファ4に順次書き込む。静止画及びVパックバッファ4に書き込まれた静止画パック、Vパック内のユーザデータ(ビデオ信号、静止画情報)は、バッファ取り出し部5により静止画パック、Vパック内のSCRに基づいてパック順に、また、出力時刻順に取り出され、次いで伸長及び画像変換部6、D/A変換部7、ビデオ出力端子15、15’を介してアナログビデオ信号として出力される。
【0056】
また、A及びRTIパック検出部9は再生データ中のAパックとRTIパックを検出して制御パラメータをパラメータ部14に設定するとともに、AパックとRTIパックをA及びRTIパックバッファ10に順次書き込む。A及びRTIパックバッファ10に書き込まれたAパック、RTIパック内のユーザデータ(オーディオ信号、リアルタイム・インフォメーション)は、バッファ取り出し部11によりパック順に、また、出力時刻順に取り出される。そして、オーディオ信号はPCM変換及びビットシフト/信号処理部12、D/A変換部13、オーディオ出力端子16を介してアナログオーディオ信号として出力される。また、リアルタイム・インフォメーションは表示信号生成部20に送られて表示信号が生成され、この表示信号は表示信号出力端子22を介して出力されたり、内蔵の文字表示部21に出力される。
【0057】
図30を参照してこのデコード装置の処理を説明する。まず、ディスク1にアクセスして記録データを読み出し(ステップS20)、次いで各分離ステップS21〜S29においてビデオ信号と、静止画信号と、オーディオ信号と、著作権情報及びリアルタイムテキスト(RT)情報と、文字情報及びディスク識別子(EX)が分離される。次いで各デコードステップS22〜S30においてそれぞれ各分離データがデコードされ、次いで同期再生される(ステップS31、S32)。
【0058】
図31は上記デコード装置の内、オーディオデコード部を抜き出して示している。まず、入力端子115を介して入力するデータがDVDオーディオデフォーマット化処理部116により5チャネル信号FL、C、FR、RL/KL及びRR/KRと、ダウンミックス係数α、β、γと文字データに分離される。そして、5チャネルとして出力する場合にはそのままマルチチャネル出力端子119〜123を介して出力され、他方、ダウンミックスして出力する場合には上記演算式に基づいてダウンミキサ117によりステレオ2チャネル信号L、Rに変換されてステレオ出力端子124、125を介して出力される。このとき、ユーザはディスク1から再生されたダウンミックス係数α、β、γの組み合わせから1つを選択することにより、熟練したミキサが推奨する係数を選択してボーカルを含む再生やボーカルを含まないカラオケ再生を行うことができる。
【0059】
すなわち、ユーザはダウンミックスするモードを選択する。一方、ダウンミックス係数をタイトルに固定させることにより、ユーザの選択操作を簡略化することができる。そのため、図1に示すAOTT−AOBSの中の複数のATSをあらかじめこれらの組み合わせとしておく。すなわち、伴奏だけのATS、ボーカルチャネルだけのATS、伴奏とボーカルチャネルのATSなどをあらかじめ用意し、ユーザはダウンミックスされたタイトルを選択する。
【0060】
図32、図33はそれぞれ第2の実施形態として3チャネル(左L、右R、ボーカルK)を用いた場合のオーディオエンコード部、オーディオデコード部を示している。オーディオエンコード部では、上記の3チャネルの内、2チャネルL、Rには伴奏音楽(あるいはピアノコンチェルトのオーケストラパート)が配置され、ボーカルチャネルKにはボーカル(あるいはピアノコンチェルトのピアノパート)が配置される。そして、ダウンミックス係数α、β、γとして、デコーダ側が3チャネル再生を行う際に、
FL=α×L
C=β×K
FR=γ×R
の演算を行うための係数が伝送される。
【0061】
この第2の実施形態によれば、図33に示すように2チャネル再生のデコーダ側は、β=1、α=γ=0に設定すればボーカルチャネルKのみを再生することができ、β=0、α=γ=1に設定すれば伴奏チャネルL、Rのみを再生することができ、また、
L=L+K
R=R+K
を演算すればボーカルチャネルKを伴奏チャネルL、Rにミックスして再生することができる(図示出力端子124、125)。また、3チャネル再生のデコーダ側は、各チャネルL、R、Kをそのまま再生したり、伝送された係数α、β、γに基づいてミックスして再生することができる(図示出力端子119、120、121)。
【0062】
図34、図35はそれぞれ第3の実施形態として6チャネル(フロント左FL、センタ又はボーカルC/K、フロント右FR、リア左RL、リア右RR、LFE)を用いた場合のオーディオエンコード部、オーディオデコード部を示している。オーディオエンコード部では、上記の6チャネルの内、例えばチャネルC/Kにはボーカルが配置され、残りの5チャネルには伴奏音楽が配置される。そして、デコーダ側がダウンミックスを行うために次のようなダウンミックス係数が伝送される。
L=α×FL+β×C/K+γ×RL+δ×LFE
R=α×FR+β×C/K+γ×RR+δ×LFE
【0063】
したがって、この第3の実施形態においても同様に、図35に示すように2チャネル再生のデコーダ側は、β=1、α=γ=δ=0に設定すればボーカルチャネルKのみを再生することができ、β=0、α=γ=δ=1に設定すれば伴奏チャネルL、Rのみを再生することができる。また、6チャネル再生のデコーダ側は全てのチャネルを再生することができることはもちろん、
FL=FL+α×C/K
C=0
FR=FR+α×C/K
を演算することにより5チャネルでも再生することができる。
【0064】
さらに、右ハンドル用のカーオーディオシステムに適用した場合、左チャネルの係数を0.5に設定すれば再生音声が左に移動するので、右側の運転手にとって最適な左右バランスで再生することができる。なお、ダウンミックス係数は図11に示すATS−DM−COEFT#0〜#15に配置する代わりに、図2に示すRTIパックに配置するようにしてもよい。また、伝送データはPCMデータの他、1ビットストリーム信号でもよい。この場合には、デコーダ側ではミキシングが困難であるので、2チャネルのダウンミックス出力を設けずにマルチチャネル出力のみを設け、ボーカルチャネルをミックスしないでミュートするようにしてもよい。
【0065】
ここで、静止画SPを再生する処理には次の3通りがある。
1)静止画SPが得られると、オーディオ信号Aの再生を中断してミュートする。
2)静止画SPが得られると、時間制御信号に基づいてオーディオ信号Aと共に再生する。
3)静止画SPが得られると、ユーザに指示されたページめくりコマンドに基づいてページめくり再生する。このときオーディオ信号Aはそのまま再生する。
【0066】
ここで、上記のオーディオデコード部は、ディスク再生装置の一部として組み込んで使用する方法の他に、製品単体としてICチップ化して構成し、DVDビデオ再生装置やパーソナルコンピュータの部品として使用することができる。
【0067】
次に、上記のようにフォーマット化されたデジタルオーディオ信号を通信回線を介して伝送する実施例について説明する。まず、図36〜図40を参照して送信側であるパッキング装置について説明する。パッキング装置は図36に示すようにパッキング処理部30と、バッファメモリ30Bと、コントロール回路29と、操作部27とディスプレイ28を有する。そして、図37〜図40において、まず、ビデオ信号Vと、静止画信号SPと、オーディオ信号Aとリアルタイム情報RTIとディスク識別子(EX)が入力されると、ステップS100では図38に詳しく示すようにオーディオパックを生成し(ステップS101)、次いでビデオパックを生成し(ステップS102)、次いで静止画パックを生成し(ステップS103)、次いでリアルタイムテキストを生成する(ステップS104)。
【0068】
次いでセル(ATS−C)を管理し(ステップS200)、次いでPTT(パートオブタイトル)を管理し(ステップS300)、次いでタイトル(AOTT−AOB)を管理し(ステップS400)、次いでタイトルセット(AOTT−AOBSを管理する(ステップS500)。続くステップS600ではATSを生成するために、図39に詳しく示すようにタイトルセットを生成し(ステップS601)、次いでメニューを生成する(ステップS602)。次いでATS−PGCIのカテゴリを記載し(ステップS603)、次いでビットシフトを含むPGコンテンツから成るPGITを生成してPGCIを生成することによりATS−PGCITを生成する(ステップS604)。次いで属性、係数のMATを生成することによりATSIを生成する(ステップS605)。次いでAMGを生成し(ステップS700)、最後にTOCを生成する(ステップS800)。
【0069】
次に、上記のようにフォーマット化されたデジタルオーディオ信号を通信回線を介して伝送する場合には、図40に示すように、送信バッファに蓄えられている送信データを所定長に分割してパケット化し(ステップS41)、次いでパケットの先頭には宛て先アドレスを含むヘッダを付与し(ステップS42)、次いでこれをネットワーク上に出力する(ステップS43)。
【0070】
次に図41〜図45を参照してデータ受信側について説明する。図41に示すようにデータ受信側のアンパッキング装置は、アンパッキング処理部60と、バッファメモリ60Bと、パラメータメモリ56と、コントロール回路59と、操作部57とディスプレイ58を有する。まず、図42に示すように、ネットワークから受信したパケットからヘッダを除去し(ステップS51)、次いで受信データを復元し(ステップS52)、次いでこれをメモリに転送する(ステップS53)。
【0071】
次に図43〜図45に示すように、まず、AMGをデコードしてATSを検出し(ステップS1100)、続くステップS1200では目的のATSのATSIをデコードするために、図44に詳しく示すようにATS−PGCIのカテゴリをデコードし(ステップS1201)、次いでビットシフトを含むPGコンテンツから成るPGITをデコードし(ステップS1202)、次いでMATの属性、係数をデコードし(ステップS1203)、次いでこれらのデコードした各パラメータをパラメータメモリ56に設定する(ステップS1204)。
【0072】
次いで再生が開始されると、パックを識別し(ステップS1300)、続くステップS1400ではパックをデコードするために、図45に詳しく示すようにオーディオパックをデコードし(ステップS1401)、次いでビデオパックをデコードし(ステップS1402)、次いで静止画パックをデコードし(ステップS1403)、次いでリアルタイムテキストをデコードする(ステップS1404)。そしてこれらの各パックからデコードしたオーディオ信号と、ビデオ信号と、静止画信号とリアルタイムテキスト信号を出力し(ステップS1500)、再生中にはステップS1300〜ステップS1500の処理を繰り返す。
【0073】
上記エンコード装置及びデコード装置は、上記エンコード方法及びデコード方法をコンピュータプログラムとしてROMなどのICチップに記憶しておき、このプログラムによりコンピュータのCPU(中央演算処理装置)を作動させることによっても実現できる。また、インターネットやカラオケ通信回線などの通信回線を介して伝送して再生側ではハードウエアやPC上のアプリケーションにより再生する場合にも適用することができる。
【0074】
【発明の効果】
以上説明したように本発明によれば、例えば伴奏音楽などの第1のオーディオ信号とボーカル音楽などの第2のオーディオ信号を含むマルチチャネル信号をステレオ2チャネルにダウンミックスするための最適な係数を記録媒体や通信媒体を介して伝送するようにしたので、マルチチャネルを2チャネルにダウンミックスして再生する場合にユーザにとって使い勝手を良くすることができる。
【図面の簡単な説明】
【図1】第1の実施形態のオーディオディスクのオーディオ・タイトルセット(ATS)とオーディオ・タイトルセット・インフォメーション(ATSI)を示す説明図である。
【図2】図1のオーディオ・オンリ・タイトル用オーディオ・オブジェクト・セット(AOTT−AOBS)を詳しく示す説明図である。
【図3】図2のオーディオパックの一例を詳しく示す説明図である。
【図4】図3のプライベートヘッダを詳しく示す説明図である。
【図5】図2のリアルタイム・インフォメーション(RTI)パックを詳しく示す説明図である。
【図6】図2のスチルピクチャ(SPCT)パックを詳しく示す説明図である。
【図7】図1のオーディオ・タイトルセット・インフォメーション・マネージメント・テーブル(ATSI−MAT))を詳しく示す説明図である。
【図8】図7のオーディオ・オンリ・タイトル用オーディオ・オブジェクト・アトリビュート(AOTT−AOB−ATR)を詳しく示す説明図である。
【図9】図7のオーディオ・オンリ・タイトル用ビデオ・オブジェクト・オーディオストリーム・アトリビュート(AOTT−VOB−AST−ATR)を詳しく示す説明図である。
【図10】図8及び図9のチャネル割当情報を詳しく示す説明図である。
【図11】図7のダウンミックス係数(ATS−DM−COEFT)を詳しく示す説明図である。
【図12】図1のオーディオ・タイトルセット・プログラム・チェーン・インフォメーション・テーブル(ATS−PGCIT)を詳しく示す説明図である。
【図13】図12のATS−PGCITインフォメーション(ATS−PGCITI)を詳しく示す説明図である。
【図14】図12のATS−PGCIサーチポインタ(ATS−PGCI−SRP)を詳しく示す説明図である。
【図15】図14のATS−PGCカテゴリ(ATS−PGCI−CAT)を詳しく示す説明図である。
【図16】図12のオーディオ・タイトルセット・プログラム・チェーン・インフォメーション(ATS−PGCI)を詳しく示す説明図である。
【図17】図16のATS−PGCジェネラル・インフォメーション(ATS−PGC−GI)を詳しく示す説明図である。
【図18】図17のATS−PGCコンテンツ(ATS−PGC−CNT)を詳しく示す説明図である。
【図19】図16のATSプログラム・インフォメーション・テーブル(ATS−PGIT)を詳しく示す説明図である。
【図20】図19のATSプログラム・インフォメーション(ATS−PGI)を詳しく示す説明図である。
【図21】図20のATS−PGコンテンツ(ATS−PG−CNT)を詳しく示す説明図である。
【図22】図19のATSセル・プレイバック・インフォメーション・テーブル(ATS−C−PBIT)を詳しく示す説明図である。
【図23】図22のATSセル・プレイバック・インフォメーション(ATS−C−PBI)を詳しく示す説明図である。
【図24】図23のATS−Cタイプ(ATS−C−TY)を詳しく示す説明図である。
【図25】DVDオーディオディスクのエンコード装置を示すブロック図である。
【図26】図25のエンコード装置の処理を示すフローチャートである。
【図27】図25のオーディオエンコード部を示すブロック図である。
【図28】DVDオーディオディスクのデコード装置を示すブロック図である。
【図29】図28のデコード装置を機能的に示すブロック図である。
【図30】図28、図29のデコード装置の処理を示すフローチャートである。
【図31】図29のオーディオデコード部を示すブロック図である。
【図32】第2の実施形態のオーディオエンコード部を示すブロック図である。
【図33】第2の実施形態のオーディオデコード部を示すブロック図である。
【図34】第3の実施形態のオーディオエンコード部を示すブロック図である。
【図35】第3の実施形態のオーディオデコード部を示すブロック図である。
【図36】オーディオ信号を伝送する場合のパッキング装置を示すブロック図である。
【図37】図36のパッキング装置のパッキング処理を示すフローチャートである。
【図38】図37のパック生成処理を詳しく示すフローチャートである。
【図39】図37のATS生成処理を詳しく示すフローチャートである。
【図40】図36のパッキング装置の送信処理を示すフローチャートである。
【図41】オーディオ信号を伝送する場合のアンパッキング装置を示すブロック図である。
【図42】図41のアンパッキング装置の受信処理を示すフローチャートである。
【図43】図41のアンパッキング装置のアンパッキング処理を示すフローチャートである。
【図44】図43のATSIデコード処理を詳しく示すフローチャートである。
【図45】図43のパックデコード処理を詳しく示すフローチャートである。
【符号の説明】
113 操作部(モード選択手段)
106 DVDオーディオフォーマット化処理部(フォーマット化手段)
116 DVDオーディオデフォーマット化処理部
117 ダウンミキサ(ダウンミックス手段)
132 システムコントローラ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an audio signal transmission method, an audio disc, an encoding device, and a decoding device for reproducing a multi-channel by downmixing it into two channels (also referred to as mixdown), and for example, transmitting an audio signal suitable for a karaoke system. The present invention relates to a method, an audio disc, an encoding device, and a decoding device.
[0002]
[Prior art]
In general, a music source is recorded as audio data of two channels on a recording medium such as a CD. However, the music source may be recorded in multi-channel, and in this case, the amount of multi-channel data is enormous as compared with two channels. Therefore, the performance time (recording time) decreases. Therefore, if multi-channel data is recorded on a DVD video having a recording capacity larger than that of a CD, the performance time (recording time) becomes longer, so that a long-time music source can be recorded. This is suitable for recording.
[0003]
Conventionally, as a method of transmitting music data for karaoke through a medium by multi-channel, for example, as shown in Japanese Patent Laid-Open No. 9-46799 (Patent No. 2766466), a general surround system such as karaoke is used. Transmits to the playback device whether the music source is in a normal multi-channel mode or a special-purpose mode such as karaoke, together with a multi-channel signal including the main channel and sub-channel of the music source for special use A method has been proposed. In this method, the music source is compressed by the Dolby AC-3 system and transmitted.
[0004]
In this method, the decoder side is equipped with a surround mixing coefficient generator and a special purpose (karaoke) mixing coefficient generator, and when the multi-channel mode is detected from the transmission data, both the primary channel and the secondary channel are output. Output in multi-channel as it is, or by multiplying the main channel and sub-channel by a predetermined surround mixing coefficient and down-mix to 2 channels, while in the case of special use mode For example, in order to reproduce only the accompaniment channel and not the vocal channel, the main channel and the sub-channel are multiplied by a predetermined special application mixing coefficient and output as multi-channel or down-mix 2 channel.
[0005]
[Problems to be solved by the invention]
However, in the above-described conventional method, when the special-purpose mode is detected on the decoder side, the coefficient of the special-purpose mixing coefficient generator is multiplied to each channel, so that it cannot be reproduced in a user-desired mixing condition. If the user can change the coefficient, this mixing operation requires a skill level, which makes the operation troublesome. Further, it is impossible for the user to reproduce only accompaniment from a normal music source including accompaniment and vocals, and not reproduce as karaoke without reproducing vocals.
[0006]
Further, in the above conventional method, in order to use a general surround system for a special purpose such as karaoke, information indicating whether the music source is a normal multi-channel mode or a special purpose mode such as karaoke. Therefore, the music source is determined in advance by the source provider as to whether the music source is a multi-channel mode or a special-purpose mode, and thus there is no flexibility for the user. In the above conventional example, since it is necessary to detect whether the playback device is in the normal multi-channel mode or the special purpose mode such as karaoke, the playback device that does not have this detection function is in the special purpose mode. Can't play. Further, in the above conventional example, the music source is compressed by the Dolby AC-3 system and transmitted, so the sound quality is poor.
[0007]
In view of the above-described problems of the conventional example, the present invention provides an audio signal transmission method, an audio disc, an encoding device, and a decoding device that are convenient for the user when the multi-channel is downmixed into two channels for reproduction. Objective.
[0008]
[Means for Solving the Problems]
In order to achieve the above object, the present invention provides an optimum coefficient for downmixing a multi-channel signal including a first audio signal such as accompaniment music and a second audio signal such as vocal music into two stereo channels. The data is transmitted via a recording medium or a communication medium.
[0009]
That is, according to the present invention, a multichannel signal including at least two channels of a first audio signal and at least one channel of a second audio signal, and down-mixing the multichannel signal into two stereo channels, the first, A first coefficient for reproducing both of the second audio signals and the multi-channel signal are down-mixed to two stereo channels to reproduce the first audio signal and not the second audio signal. Transmitting a second coefficient for:
A mode or title for downmixing the multi-channel signal based on the first coefficient to generate a stereo 2-channel signal including both the first and second audio signals, and based on the second coefficient Selecting one of the modes or titles to downmix the multi-channel signal to generate a stereo two-channel signal that includes the first audio signal and does not include the second audio signal;
Downmixing a multi-channel signal into a stereo 2-channel signal in the selected mode or title;
A method for transmitting an audio signal is provided.
[0010]
According to the invention, a multi-channel signal including at least two channels of first audio signals and at least one channel of second audio signals;
A first coefficient for downmixing the multi-channel signal into two stereo channels to reproduce both the first and second audio signals;
A second coefficient for down-mixing the multi-channel signal into two stereo channels to reproduce the first audio signal and not to reproduce the second audio signal;
An audio disc having a data structure recorded thereon is provided.
[0011]
According to the present invention, the music source is a multi-channel signal including a first audio signal of at least two channels and a second audio signal of at least one channel; A first coefficient for reproducing both the first and second audio signals, and the second audio signal by downmixing the multi-channel signal into two stereo channels to reproduce the first audio signal. Means for formatting into a data structure having a second coefficient for not reproducing
An encoding device is provided.
[0012]
According to the invention, a multichannel signal including at least two channels of a first audio signal and at least one channel of a second audio signal, and down-mixing the multichannel signal into two stereo channels, the first, A first coefficient for reproducing both of the second audio signals and the multi-channel signal are down-mixed to two stereo channels to reproduce the first audio signal and not the second audio signal. A decoding device for decoding a data structure having a second coefficient for:
A mode or title for downmixing the multi-channel signal based on the first coefficient to generate a stereo 2-channel signal including both the first and second audio signals, and based on the second coefficient Means for down-mixing the multi-channel signal to select one of the modes or titles for generating a stereo 2-channel signal that includes the first audio signal and does not include the second audio signal;
Means for downmixing a multi-channel signal into a stereo two-channel signal in the selected mode or title;
A decoding device is provided.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings.
FIG. 1 shows a basic format of a DVD audio disk as an example. This basic format has ATS (Audio Title Set), and this ATS is in order from the top.
-ATSI (ATS information),
Audio object set (AOTT-AOBS) for audio-only titles shown in detail in FIGS.
-It is configured with ATSI for backup.
[0014]
ATSI in order from the top
-ATSI-MAT (ATSI management table) shown in detail in FIGS.
It is composed of ATS-PGCIT (ATS program chain information table) shown in detail in FIGS.
[0015]
As shown in detail in FIG. 2, the AOTT-AOBS is composed of a plurality of audio objects for audio only titles (AOTT-AOB). Each of AOTT-AOB is composed of a plurality of programs (PG), and each of the programs is composed of a plurality of cells (ATS-C). AOTT-AOB includes audio data only, audio data and real time information data (RTI data), audio data, still picture data (SPCT data) and RTI data. It is composed of three types of AOTT-AOB. One or more types of AOTT-AOB are arranged in one disc or one song.
[0016]
Each program of the first AOTT-AOB including only audio data is composed of a plurality of audio cells (ATS-C), and this audio cell is composed of only a plurality of audio packs. Each program of the second AOTT-AOB including the audio data and the RTI data is composed of a plurality of audio cells (ATS-C), and the audio cell includes the RTI pack arranged at the second pack position and other packs. The audio pack is arranged at the position.
[0017]
Each program of the third AOTT-AOB including audio data, SPCT data, and RTI data is composed of a picture cell, a silent cell, and an audio cell in order from the top. The picture cell is composed of only a plurality of SPCT packs, the silent cell is composed of only a plurality of audio packs (silences), and this audio cell includes the RTI pack arranged at the second pack position and the other pack positions. The audio pack is arranged in
[0018]
The A-pack of linear PCM is composed of 2048 bytes or less, and the breakdown is composed of a 14-byte pack header and an A packet as shown in FIG. The A packet is composed of a 17, 9 or 14 byte packet header, a private header shown in detail in FIG. 4, and 1 to 2011 byte audio data (linear PCM).
[0019]
The private header is as shown in Figure 4
An 8-bit substream ID;
A 3-bit reserved area;
A 5-bit UPC / EAN-ISRC (Universal Product Code / European Article Number-International Standard Recording Code) number;
-8-bit UPC / EAN-ISRC data;
-8-bit private header length,
A 16-bit first access unit pointer;
・ 8-byte audio data information (ADI)
・ 0 to 8 bytes of stuffing bytes
It is comprised by.
[0020]
ADI is
1-bit audio emphasis flag,
A 1-bit reserved area;
-1-bit downmix mode,
・ Effectiveness of 1-bit downmix code,
・ 4-bit downmix code,
A quantization word length “1” of a 4-bit group “1”;
A quantization word length “2” of a 4-bit group “2”;
A 4-bit group “1” audio sampling frequency fs1,
A 4-bit group “2” audio sampling frequency fs2,
A 4-bit reserved area;
・ 4-bit multi-channel type,
The bit shift data (see FIG. 6) of the 3-bit channel group “2”;
-5-bit channel allocation information (see Fig. 12);
・ 8-bit dynamic range control information,
・ 8 × 2 bits reserved area
It is comprised by.
[0021]
Next, the configuration of the RTI pack will be described in detail with reference to FIG. This pack is composed of a 14-byte pack header and an RTI packet, and the RTI packet is composed of a 17- or 14-byte packet header, an RTI private header, and 1 to 2015-byte RTI data. RTI data is character information and reproduction control information related to audio data.
[0022]
The private header of the RTI packet is
A 1-byte substream ID,
-2-byte UPC / EAN-ISRC number and data (in the figure, these are simply expressed as ISRC),
-1 byte private header length,
-1-byte RTI information ID,
・ 0-7 byte stuffing byte
It is comprised by.
The UPC / EAN-ISRC number and data are the UPC / EAN-ISRC number and data related to the copyright of the still picture stored in the SPCT pack.
[0023]
As shown in detail in FIG. 6, the SPCT pack is composed of a 14-byte pack header and an SPCT packet. The SPCT packet is composed of a 22 or 19 or 9-byte packet header and 2025 bytes or less of SPCT (still picture) data. ing. Here, one still image is compressed by the MPEG1 or MPEG2 system, is composed of an I picture and an intra-coded picture, is divided within one picture cell, and is arranged as SPCT data of an SPCT pack.
The UPC / EAN-ISRC number and data related to the still picture copyright may be included in the packet header of the SPCT pack as described in the RTI pack.
[0024]
The ATSI-MAT shown in FIG. 1 is composed of 2048 bytes (relative byte positions RBP 0 to 2047) as shown in detail in FIG.
A 12-byte (RBP 0-11) ATS identifier (ATS-ID);
4 bytes (RBP 12-15) ATS end address (ATS-EA),
A 12-byte (RBP 16-27) reserved area;
-4-byte (RBP28-31) ATSI end address (ATSI-EA),
・ Version number (VERN) of 2 bytes (RBP 32-33),
94 bytes (RBP 34 to 127) reserved area,
-4-byte (RBP128-131) ATSI-MAT end address;
-60 bytes (RBP 132-191) reserved area;
4 bytes (RBP 192 to 195) AOTT VTS start address,
・ Start address of AOBS for AOTT of 4 bytes (RBP 196 to 199) or start address of VOBS for AOTT,
A reserved area of 4 bytes (RBP 200 to 203);
4 bytes (RBP 204 to 207) of ATS-PGCIT start address,
-48 bytes (RBP 208-255) reserved area,
128 A (16 × 8) bytes (RBP 256 to 383) AOT attribute for AOTT (AOTT-AOB-ATR) or VOT audio stream attribute for AOTT (AOTT-VOB-AST-ATR)
A coefficient (ATS-DM-COEFT # 0 to # 15) of 288 (18 × 8) bytes (RBP 384 to 671) for downmixing multi-channel audio data to two channels;
A 32-byte (RBP 672-703) reserved area;
Two-byte (RBP 704 to 705) attributes of still picture data (ATS-SPCT-ATR) in AOBS for AOTT,
-It is composed of a reserved area of 1342 bytes (RBP 706 to 2047).
[0025]
In the area of 128 (16 × 8) bytes (RBPs 256 to 383), when this ATS has AOTS for AOTT, AOTT-AOB-ATR shown in detail in FIG. 8 is described. This AOTT-AOB-ATR (b127-b0) is in order from the MSB side.
An audio encoding mode of 8 bits (b127 to b120);
An 8-bit (b119 to b112) reserved area;
A quantization bit number Q1 of a channel group “1” of 4 bits (b111 to b108);
A quantization bit number Q2 of a channel group “2” of 4 bits (b107 to b104);
A sampling frequency fs1 of a channel group “1” of 4 bits (b103 to b100);
A sampling frequency fs2 of a 4-bit (b99 to b96) channel group “2”;
3 bit (b95 to b93) multi-channel structure type;
-Channel assignment of 5 bits (b92 to b88);
-It is composed of a reserved area of 8 bits x 11 (b87 to b0).
[0026]
On the other hand, when this ATS does not have AOTS for AOTT, AOTT-VOB-AST-ATR shown in FIG. 9 is described. This AOTT-VOB-AST-ATR (b127-b0) is in order from the MSB side.
An audio encoding mode of 8 bits (b127 to b120);
An 8-bit (b119 to b112) reserved area;
A 4-bit (b111 to b108) quantization bit number Q;
A 4-bit (b107 to b104) reserved area;
A sampling frequency fs of 4 bits (b103 to b100),
A 4-bit (b99 to b96) reserved area;
3 bit (b95 to b93) multi-channel structure type;
-Channel assignment of 5 bits (b92 to b88);
3 bit (b87 to b85) decoding audio stream number;
A 5-bit (b84 to b80) reserved area;
A 2-bit (b79, b78) MPEG audio DRC;
A 2-bit (b77, b76) reserved area;
A 4-bit (b75-b72) number of compressed audio channels;
-It is composed of a reserved area of 8 bits x 9 (b71 to b0).
[0027]
The above data is shown in detail below.
(1) Audio encoding mode (b127 to b120)
00000000b: Linear PCM mode
00000001b: reserved for compressed audio (Dolby Digital)
00000010b: reserved for compressed audio (no MPEG2 extension)
00000011b: Reserved for compressed audio (with MPEG2 extension)
00000100b: reserved for compressed audio (DTS)
00000101b: Reserved for compressed audio (SDDS)
Other: Reserved for other encoding modes
[0028]
(2) Quantization bit number Q1 (b111 to b108) of channel group 1
0000b: 16 bits
0001b: 20 bits
0010b: 24 bits
Other: Hold
(3) Quantization bit number Q2 of channel group 2 (b107 to b104)
When the number of quantization bits Q1 of channel group 1 is “0000b”, “0000b”
“0000b” or “0001b” when the number of quantization bits Q1 of channel group 1 is “0001b”
“0000b”, “0001b” or “0010b” when the number of quantization bits Q1 of channel group 1 is “0010b”
However, 0000b: 16 bits
0001b: 20 bits
0010b: 24 bits
Other: Hold
[0029]
(4) Sampling frequency fs1 (b103 to b100) of channel group 1
0000b: 48 kHz
0001b: 96 kHz
0010b: 192 kHz
1000b: 44.1 kHz
1001b: 88.2 kHz
1010b: 176.4 kHz
Other: Hold
[0030]
(5) Sampling frequency fs2 of channel group 2 (b99 to b96)
“0000b” when the sampling frequency fs1 of channel group 1 is “0000b”
When the sampling frequency fs1 of the channel group 1 is “0001b”, “0000b” or “0001b”
When the sampling frequency fs1 of the channel group 1 is “0010b”, “0000b”, “0001b” or “0010b”
“1000b” when the sampling frequency fs1 of channel group 1 is “1000b”
When the sampling frequency fs1 of the channel group 1 is “1001b”, “1000b” or “1001b”
When the sampling frequency fs1 of the channel group 1 is “1010b”, “1000b”, “1001b”, or “1010b”
[0031]
(6) Type of multi-channel structure (b95 to b93)
000b: Type 1
Other: Hold
(7) Channel assignment (b92 to b88)
FIG. 10 shows channel assignment information of groups “1” and “2” from 1 channel (monaural) to 6 channels. Incidentally, the symbols shown in the figure will be described below.
C (mono): Monaural
L, R: 2-channel stereo
Lf: multi-channel left front
Rf: Multi-channel right front
C: Multi-channel center
LFE: Multi-channel Low Frequency Effect
S: Multi-channel surround
Ls: Multi-channel left surround
Rs: Multi-channel light surround
[0032]
(8) Number of decoding audio streams (b87 to b85)
“0” or “1”
(9) MPEG audio DRC (b79, b78)
00b: There is no DRC data in the MPEG audio stream.
01b: DRC data exists in the MPEG audio stream.
[0033]
(10) Number of compressed audio channels (b75 to b72)
“1111b” when the audio encoding mode is linear PCM audio
0000b: 1ch (mono)
0001b: 2ch (stereo)
0010b: 3ch
0011b: 4ch
0100b: 5ch
0101b: 6ch
0110b: 7ch
0111b: 8ch
Other: Hold
[0034]
In the area of 288 (18 × 16) bytes (RBP 384 to 671) shown in FIG. 7, in order to downmix multi-channel audio data into two channels, table numbers “0” to “15” as shown in FIG. Each downmix coefficient (ATS-DM-COEFT # 0 to # 15) is described in 18 bytes.
[0035]
The ATS-PGCIT (ATS program chain information table) shown in FIG. 1 is in order from the top as shown in detail in FIG.
Audio title set PGCI table information (ATS-PGCITI) shown in detail in FIG.
N audio title set PGCI search pointers (ATS-PGCI-SRP # 1 to #n) shown in detail in FIGS.
It is composed of a plurality of audio title sets PGCI (ATS-PGCI) shown in detail in FIG.
[0036]
The ATS-PGCITI is composed of 8 bytes as shown in detail in FIG.
The number of 2-byte ATS-PGCI-SRP # 1 to #n,
A 2-byte reserved area;
-Consists of a 4-byte ATS-PGCIT end address. Each of ATS-PGCI-SRP # 1 to #n is composed of 8 bytes as shown in detail in FIG.
As shown in detail in FIG. 15, the 4-byte ATS-PGC category (ATS-PGC-CAT) and
-It consists of a 4-byte ATS-PGCI end address.
[0037]
The 4-byte (b31 to b0) ATS-PGC category is in order from the top as shown in FIG.
-1-bit (b31) entry type,
7 bit (b30 to b24) ATS audio title number (ATS-TTN);
-2 bit (b23, b22) block mode;
-2-bit (b21, b20) block type;
The number of 4-bit (b19 to b16) audio channels;
An 8-bit (b15 to b8) audio encoding mode;
-It is composed of a reserved area of 8 bits (b7 to b0).
[0038]
The contents of the category (ATS-PGC-CAT) are shown in detail below.
(1) Entry type (b31)
0b: Not an entry PGC
1b: Entry PGC
(2) Number of ATS audio titles (b30 to b24)
The number of audio titles of this ATS is described in the range of “1” to “99”.
(3) Block mode (b23, b22)
00b: Not ATS-PGC of ATS-PGC block
01b: First ATS-PGC of the ATS-PGC block
10b: Hold
11b: ATS-PGC at the end of the ATS-PGC block
(4) Block type (b21, b20)
00b: Not part of this block
01b: Difference block only in audio coding mode
10b: Difference block of audio channel only
11b: difference block for both audio coding mode and audio channel
(5) Number of audio channels (b19 to b16)
0000b: 2 channels or less
0001b: over 2 channels
[0039]
Each of the audio title sets PGCI (ATS-PGCI) shown in FIG. 12 is in order from the top as shown in FIG.
ATS-PGC general information (ATS-PGC-GI) shown in detail in FIG. 17 and FIG. 18,
ATS program information table (ATS-PGIT) shown in detail in FIGS.
It is configured by an ATS cell playback information table (ATS-C-PBIT) shown in detail in FIGS.
[0040]
The ATS-PGC-GI is composed of 16 bytes (RBP0 to 15) as shown in detail in FIG.
-4-byte (RBP0-3) ATS-PGC content (ATS-PGC-CNT) shown in detail in FIG.
4 bytes (RBP4-7) ATS-PGC playback time (ATS-PGC-PB-TM),
A 2-byte (RBP8, 9) reserved area;
A 2-byte (RBP10, 11) ATS-PGIT start address;
A 2-byte (RBP 12, 13) ATS-C-PBIT start address;
-It consists of a reserved area of 2 bytes (RBP14, 15).
[0041]
The above ATS-PGC contents of 4 bytes (b31 to b0) are in order from the top as shown in detail in FIG.
A 17-bit (b31 to b15) reserved area;
・ The number of programs of 7 bits (b14 to b8)
-It is configured by the number of cells of 8 bits (b7 to b0). The number of programs is in the range of “1” to “99”, and the number of cells is in the range of “1” to “255”.
[0042]
The ATS program information table (ATS-PGIT) shown in FIG. 16 includes n ATS program information (ATS-PGI) # 1 to #n as shown in detail in FIG. Each of ATS-PGI # 1 to #n is composed of 20 bytes (RBP0 to 19) as shown in detail in FIG.
-4-byte (RBP0-3) ATS-PG content (ATS-PG-CNT) shown in detail in FIG.
1 byte (RBP4) ATS-PG entry cell number,
-1 byte (RBP5) reserved area;
Start of the first audio cell of 4 bytes (RBP 6-9) ATS-PG
・ Presentation time (FAC-S-PTM)
4 bytes (RBP 10-13) of ATS-PG playback time,
4 bytes (RBP 14-17) ATS-PG pause time,
1 byte (RBP18) reserved area (for copyright management data CMI),
-1 byte (RBP19) reserved area
It is comprised by.
[0043]
The 2-byte (b31-0) ATS-PG contents are in order from the top as shown in detail in FIG.
1 bit (b31), the relationship between the previous and current PG (R / A),
1-bit (b30) STC discontinuity flag (STC-F);
・ The number of attributes (ATRN) of 3 bits (b29 to b27),
3 bit (b26 to b24) channel group (ChGr) “2” bit shift data;
A 2-bit (b23, b22) reserved area;
1-bit (b21) downmix mode (D-M),
・ Effectiveness of 1-bit (b20) downmix coefficient (shown *),
A 4-bit (b19 to b16) downmix coefficient table number (DM-COEFTN);
Each is composed of RTI flags F15 to F0 of 1 bit and 16 bits (b15 to b0) in total.
[0044]
The ATS cell playback information table (ATS-C-PBIT) shown in FIG. 16 includes n ATS cell playback information (ATS-C-PBI) # 1 to 1 as shown in detail in FIG. #N. Each of ATS-C-PBI # 1 to #n is composed of 12 bytes (RBP0 to 11) as shown in detail in FIG.
1-byte (RBP0) ATS-C index number;
As shown in detail in FIG. 24, a 1-byte (RBP1) ATS-C type (ATS-C-TY),
A 2-byte (RBP2, 3) reserved area;
4 bytes (RBP 4-7) ATS-C start address,
• It is composed of an ATS-C end address of 4 bytes (RBP 8 to 11).
[0045]
The 1-byte (b7 to b0) ATS-C type is in order from the beginning as shown in detail in FIG.
A 2-bit (b7, b6) ATS cell element (ATS-C-COMP);
A 2-bit (b5, b4) reserved area;
-It is configured with 4-bit (b3 to b0) ATS cell usage (ATS-C-Usage).
[0046]
The contents of the data are shown in detail below.
(1) ATS cell element (b7, b6)
00b: Audio cell consisting only of audio data
01b: Audio cell consisting of audio data and real-time information
10b: Silence cell consisting only of audio data for silence
11b: Picture cell consisting only of still pictures
(2) ATS cell application (b3 to b0)
0000b: No description
0001b: Spotlight part
Other: Hold
[0047]
Next, the above-described DVD audio disk encoding apparatus will be described. 25 and 26 show the configuration and processing of the encoding apparatus, respectively. The analog audio signal A is sampled by the A / D converter 31 at a sufficiently high sampling frequency (sampling period Δt), for example, 192 kHz, and converted to a 24-bit high resolution PCM signal, for example. In the subsequent bit shift / signal processing circuit 32, when compression is not performed, the PCM data converted by the A / D converter 31 is applied to the DVD formatting unit 34 as it is. On the other hand, when compression is performed, the PCM data converted by the A / D converter 31 is compressed by the bit shift / signal processing circuit 32 according to the encoding mode, and then applied to the DVD formatting unit 34. (Steps S5 and S6). In the bit shift / signal processing circuit 32, each channel of the group “2” is bit shifted.
[0048]
The video signal V is converted into a digital signal by the A / D converter 31V, and then the digital video signal is encoded into the MPEG format by the V encoder 32V and applied to the DVD formatting unit 34 (steps S1 and S2). . The still image signal SP is converted into a digital signal by the A / D converter 31SP, and then the digital still image signal SP is encoded into the MPEG format by the compression encoder 32SP and applied to the DVD formatting unit 34 (step S3). , S4). Also, copyright information and real-time text (RT) information are applied via the interface (I / F) 40 (steps S7 and S8), and character information and disc identifier EX are applied to the DVD formatting unit 34 (step S7). S9, S10).
[0049]
Then, the DVD formatting unit 34 packs each input data into the format as described above (step S11). The data formatted by the DVD formatting unit 34 is modulated by a modulation circuit 35 in accordance with a modulation method corresponding to the disc, and a disc is manufactured based on the modulated data, recorded once in the recording unit 38, or communicated. The data is transmitted via the I / F 39 (step S12).
[0050]
FIG. 27 shows an audio encoding unit extracted from the encoding apparatus. First, 5-channel signals of front left FL, center C, front right FR, rear left or karaoke left RL / KL and rear right / karaoke right RR / KR are input to the input terminals 101 to 105 as multi-channel signals, respectively. And applied to the DVD audio formatting processing unit 106. Also, the coefficient and character data for downmixing the 5-channel signal to the stereo 2-channel are applied to the DVD audio formatting processor 6 via the input terminals 107 and 109 and the I / Fs 108 and 110, respectively. Then, in the DVD audio formatting processing unit 106, based on the operation instruction of the operation input unit 113 and the control of the system controller 114, the multi-channel signal is arranged in the A pack shown in FIG. 2, and the downmix coefficient is shown in FIG. -It is arranged in DM-COEFT # 0 to # 15, and the character data is arranged in the RTI pack shown in FIG.
[0051]
Here, the input downmix coefficient is a plurality of coefficients recommended by a skilled mixer when downmixing a 5-channel signal to two stereo channels, and conversion using the downmix coefficients α, β, and γ. The formula is as follows.
Stereo L = α × FL + β × C + γ × RL / KL
Stereo R = α × FR + β × C + γ × RR / KR
[0052]
As a first use example, accompaniment music and vocal music are arranged in the front channels FL, C, FR and rear channels RL / KL, RR / KR, respectively.
The coefficients α, β, γ for performing normal 5-channel surround playback,
The coefficients α, β, and γ for down-mixing 5 channels into 2 channels L and R and mixing the rear channels RL / KL and RR / KR into 2 channels L and R for playback,
-Coefficients α, β, γ for performing 5 channel surround playback without playing rear channels RL / KL, RR / KR for karaoke playback,
-Downmixing 5 channels to 2 channels L and R, and multiple coefficients α, β, such as coefficients α, β, γ, etc., for not playing the rear channels RL / KL and RR / KR for karaoke playback , Γ can be recorded.
[0053]
As a second example of use, accompaniment music is arranged in the front channels FL, C, FR, and duet male vocals and female vocals are arranged in the rear channels RL / KL, RR / KR, respectively.
The coefficients α, β, γ for performing normal 5-channel surround playback,
-Coefficients α, β, γ for down-mixing to 2 channels L and R for playback,
-Coefficients α, β, γ for performing surround playback of 5 channels to perform karaoke playback without playing both male and female voices,
-Coefficients α, β, γ for down-mixing to 2 channels L and R to perform karaoke playback without playing both male and female voices,
-Coefficients α, β, γ for performing surround playback of 5 channels in order to perform karaoke playback without playing either male or female voice,
・ Records multiple coefficients α, β, γ such as coefficients α, β, γ for downmixing to 2 channels L and R to perform karaoke playback without playing either male or female voice A method is conceivable.
[0054]
FIG. 28 shows a specific configuration of the above-described DVD audio disk decoding apparatus, and FIG. 29 functionally shows the configuration of FIG. FIG. 30 shows the processing. 28 and 29, first, when a song selection, playback, fast forward, and stop operation is performed by the operation unit 18 or the remote control device 19, the control unit 23 controls the drive device 2 and the playback device 17 according to the operation. During reproduction, the pit data recorded on the DVD audio disk 1 is read by the drive device 2 and then EFM demodulated.
[0055]
In the playback device 17, this signal is sent to the still image / V pack detection unit 3 and the A / RTI pack detection unit 9. When still image packs and V packs are recorded on the disc 1, the still image and V pack detection unit 3 detects the still image packs and V packs in the reproduction data and sets control parameters in the parameter unit 8. At the same time, the still image pack and the V pack are sequentially written in the still image and V pack buffer 4. The still image pack and the user data (video signal and still image information) written in the V pack buffer 4 are stored in the order of the pack based on the SCR in the still image pack and the V pack by the buffer extraction unit 5. Also, they are taken out in order of output time, and then output as analog video signals via the decompression and image conversion unit 6, the D / A conversion unit 7, and the video output terminals 15 and 15 '.
[0056]
The A and RTI pack detection unit 9 detects the A pack and RTI pack in the reproduction data, sets control parameters in the parameter unit 14, and sequentially writes the A pack and RTI pack in the A and RTI pack buffer 10. User data (audio signal, real-time information) in the A pack and the RTI pack written in the A and RTI pack buffer 10 is extracted by the buffer extraction unit 11 in the order of the pack and in the order of the output time. The audio signal is output as an analog audio signal via the PCM conversion and bit shift / signal processing unit 12, the D / A conversion unit 13, and the audio output terminal 16. The real-time information is sent to the display signal generation unit 20 to generate a display signal. This display signal is output via the display signal output terminal 22 or output to the built-in character display unit 21.
[0057]
The processing of this decoding apparatus will be described with reference to FIG. First, the recorded data is read by accessing the disc 1 (step S20), and then in each of the separation steps S21 to S29, a video signal, a still image signal, an audio signal, copyright information and real-time text (RT) information, Character information and disc identifier (EX) are separated. Next, in each decoding step S22 to S30, each separated data is decoded and then reproduced synchronously (steps S31 and S32).
[0058]
FIG. 31 shows an audio decoding unit extracted from the decoding apparatus. First, data input via the input terminal 115 is converted into 5-channel signals FL, C, FR, RL / KL, RR / KR, downmix coefficients α, β, γ, and character data by the DVD audio deformatting processing unit 116. Separated. In the case of outputting as 5 channels, it is output as it is through the multi-channel output terminals 119 to 123. On the other hand, in the case of downmixing and outputting, the stereo 2 channel signal L is output by the downmixer 117 based on the above equation. , R and output through stereo output terminals 124 and 125. At this time, the user selects one of the combinations of the downmix coefficients α, β, and γ reproduced from the disc 1 to select a coefficient recommended by a skilled mixer and does not include reproduction or vocals including vocals. Karaoke playback can be performed.
[0059]
That is, the user selects a downmix mode. On the other hand, the user's selection operation can be simplified by fixing the downmix coefficient to the title. Therefore, a plurality of ATSs in the AOTT-AOBS shown in FIG. That is, an ATS only for accompaniment, an ATS only for vocal channels, an ATS for accompaniment and vocal channels, and the like are prepared in advance, and the user selects a downmixed title.
[0060]
FIGS. 32 and 33 respectively show an audio encoding unit and an audio decoding unit in the case where three channels (left L, right R, vocal K) are used as the second embodiment. In the audio encoding unit, of the above three channels, accompaniment music (or piano concerto orchestra part) is arranged in 2 channels L and R, and vocal (or piano concerto piano part) is arranged in vocal channel K. The And when down-mix coefficients α, β, and γ, when the decoder side performs 3 channel reproduction,
FL = α × L
C = β × K
FR = γ × R
A coefficient for performing the calculation is transmitted.
[0061]
According to the second embodiment, as shown in FIG. 33, the decoder side of 2-channel reproduction can reproduce only the vocal channel K if β = 1 and α = γ = 0, and β = If set to 0, α = γ = 1, only the accompaniment channels L, R can be played,
L = L + K
R = R + K
Can be reproduced by mixing the vocal channel K with the accompaniment channels L and R (output terminals 124 and 125 in the figure). Further, the decoder side for three-channel reproduction can reproduce each channel L, R, K as it is, or can mix and reproduce based on the transmitted coefficients α, β, γ (illustrated output terminals 119, 120). 121).
[0062]
FIG. 34 and FIG. 35 respectively show an audio encoding unit using 6 channels (front left FL, center or vocal C / K, front right FR, rear left RL, rear right RR, LFE) as the third embodiment. The audio decoding part is shown. In the audio encoding unit, vocals are arranged on, for example, channel C / K among the above six channels, and accompaniment music is arranged on the remaining five channels. Then, the following downmix coefficient is transmitted for the decoder side to perform the downmix.
L = α × FL + β × C / K + γ × RL + δ × LFE
R = α × FR + β × C / K + γ × RR + δ × LFE
[0063]
Accordingly, in this third embodiment as well, as shown in FIG. 35, the decoder side for 2-channel playback reproduces only the vocal channel K if β = 1 and α = γ = δ = 0. If β = 0 and α = γ = δ = 1, only the accompaniment channels L and R can be reproduced. Of course, the 6-channel playback decoder can play back all channels.
FL = FL + α × C / K
C = 0
FR = FR + α × C / K
Can be reproduced even with 5 channels.
[0064]
Furthermore, when applied to a car audio system for the right steering wheel, the playback sound moves to the left if the left channel coefficient is set to 0.5, so that it can be played back with the right / left balance optimal for the right driver. . The downmix coefficient may be arranged in the RTI pack shown in FIG. 2 instead of being arranged in ATS-DM-COEFT # 0 to # 15 shown in FIG. The transmission data may be a 1-bit stream signal in addition to PCM data. In this case, since it is difficult to mix on the decoder side, only the multi-channel output may be provided without providing the 2-channel downmix output, and the vocal channel may be muted without mixing.
[0065]
Here, there are the following three processes for reproducing the still image SP.
1) When the still image SP is obtained, the reproduction of the audio signal A is interrupted and muted.
2) When the still image SP is obtained, it is reproduced together with the audio signal A based on the time control signal.
3) When the still image SP is obtained, the page turning reproduction is performed based on the page turning command instructed by the user. At this time, the audio signal A is reproduced as it is.
[0066]
Here, in addition to the method of incorporating and using the above audio decoding unit as a part of a disk playback device, it can be configured as an IC chip as a single product and used as a component of a DVD video playback device or a personal computer. it can.
[0067]
Next, an embodiment in which the digital audio signal formatted as described above is transmitted via a communication line will be described. First, the packing apparatus on the transmission side will be described with reference to FIGS. As shown in FIG. 36, the packing apparatus includes a packing processing unit 30, a buffer memory 30B, a control circuit 29, an operation unit 27, and a display 28. 37 to 40, first, when the video signal V, the still image signal SP, the audio signal A, the real-time information RTI, and the disc identifier (EX) are input, in step S100, as shown in detail in FIG. An audio pack is generated (step S101), then a video pack is generated (step S102), a still picture pack is then generated (step S103), and then real-time text is generated (step S104).
[0068]
Next, the cell (ATS-C) is managed (step S200), then the PTT (part of title) is managed (step S300), then the title (AOTT-AOB) is managed (step S400), and then the title set (AOTT) -Manage AOBS (step S500) In the following step S600, in order to generate an ATS, a title set is generated as shown in detail in Fig. 39 (step S601), and then a menu is generated (step S602). -The category of PGCI is described (step S603), and then ATS-PGCIT is generated by generating PGCI composed of PG contents including bit shift and generating PGCI (step S604). By creating A Generating a SI (step S605). Then generate AMG (step S700), finally to produce a TOC (step S800).
[0069]
Next, when the digital audio signal formatted as described above is transmitted via a communication line, as shown in FIG. 40, the transmission data stored in the transmission buffer is divided into predetermined lengths and packets are transmitted. Then, a header including the destination address is added to the beginning of the packet (step S42), and this is then output on the network (step S43).
[0070]
Next, the data receiving side will be described with reference to FIGS. As shown in FIG. 41, the unpacking device on the data receiving side includes an unpacking processing unit 60, a buffer memory 60B, a parameter memory 56, a control circuit 59, an operation unit 57, and a display 58. First, as shown in FIG. 42, the header is removed from the packet received from the network (step S51), then the received data is restored (step S52), and then transferred to the memory (step S53).
[0071]
Next, as shown in FIGS. 43 to 45, first, the AMG is decoded to detect the ATS (step S1100), and in the subsequent step S1200, in order to decode the ATSI of the target ATS, as shown in detail in FIG. ATS-PGCI category is decoded (step S1201), then PGIT composed of PG content including bit shift is decoded (step S1202), then MAT attributes and coefficients are decoded (step S1203), and then these are decoded. Each parameter is set in the parameter memory 56 (step S1204).
[0072]
Next, when playback is started, the pack is identified (step S1300), and in the subsequent step S1400, the audio pack is decoded as shown in detail in FIG. 45 to decode the pack (step S1401), and then the video pack is decoded. Then, the still picture pack is decoded (step S1403), and then the real-time text is decoded (step S1404). Then, an audio signal, a video signal, a still image signal, and a real-time text signal decoded from each pack are output (step S1500), and the processing from step S1300 to step S1500 is repeated during reproduction.
[0073]
The encoding device and the decoding device can also be realized by storing the encoding method and the decoding method as a computer program in an IC chip such as a ROM and operating a CPU (central processing unit) of the computer by this program. Further, the present invention can also be applied to a case where data is transmitted via a communication line such as the Internet or a karaoke communication line and is reproduced by hardware or an application on a PC on the reproduction side.
[0074]
【The invention's effect】
As described above, according to the present invention, for example, an optimum coefficient for downmixing a multichannel signal including a first audio signal such as accompaniment music and a second audio signal such as vocal music into two stereo channels is obtained. Since transmission is performed via a recording medium or a communication medium, it is possible to improve usability for the user when the multi-channel is down-mixed into two channels for reproduction.
[Brief description of the drawings]
FIG. 1 is an explanatory diagram showing an audio title set (ATS) and audio title set information (ATSI) of an audio disc according to a first embodiment.
FIG. 2 is an explanatory diagram showing in detail the audio object set (AOTT-AOBS) for audio-only titles in FIG. 1;
FIG. 3 is an explanatory diagram showing in detail an example of the audio pack of FIG. 2;
4 is an explanatory diagram showing in detail the private header of FIG. 3. FIG.
FIG. 5 is an explanatory diagram showing in detail the real-time information (RTI) pack in FIG. 2;
6 is an explanatory diagram showing in detail the still picture (SPCT) pack of FIG. 2; FIG.
7 is an explanatory diagram showing in detail the audio title set information management table (ATSI-MAT) in FIG. 1; FIG.
FIG. 8 is an explanatory diagram showing in detail the audio object attribute (AOTT-AOB-ATR) for audio-only titles in FIG. 7;
FIG. 9 is an explanatory diagram showing in detail the video object audio stream attribute (AOTT-VOB-AST-ATR) for audio-only titles in FIG. 7;
10 is an explanatory diagram showing in detail the channel assignment information of FIGS. 8 and 9. FIG.
11 is an explanatory diagram showing in detail the downmix coefficient (ATS-DM-COEFT) of FIG. 7; FIG.
12 is an explanatory diagram showing in detail the audio title set program chain information table (ATS-PGCIT) in FIG. 1; FIG.
13 is an explanatory diagram showing in detail the ATS-PGCIT information (ATS-PGCITI) in FIG. 12. FIG.
14 is an explanatory diagram showing in detail an ATS-PGCI search pointer (ATS-PGCI-SRP) in FIG. 12; FIG.
15 is an explanatory diagram showing in detail the ATS-PGC category (ATS-PGCI-CAT) in FIG. 14; FIG.
16 is an explanatory diagram showing in detail the audio title set program chain information (ATS-PGCI) in FIG. 12; FIG.
FIG. 17 is an explanatory diagram showing in detail the ATS-PGC general information (ATS-PGC-GI) in FIG. 16;
18 is an explanatory diagram showing in detail the ATS-PGC content (ATS-PGC-CNT) in FIG. 17; FIG.
FIG. 19 is an explanatory diagram showing in detail the ATS program information table (ATS-PGIT) of FIG. 16;
FIG. 20 is an explanatory diagram showing in detail the ATS program information (ATS-PGI) of FIG. 19;
FIG. 21 is an explanatory diagram showing in detail the ATS-PG content (ATS-PG-CNT) in FIG. 20;
22 is an explanatory diagram showing in detail the ATS cell playback information table (ATS-C-PBIT) in FIG. 19; FIG.
23 is an explanatory diagram showing in detail the ATS cell playback information (ATS-C-PBI) of FIG. 22. FIG.
24 is an explanatory diagram showing in detail the ATS-C type (ATS-C-TY) in FIG. 23. FIG.
FIG. 25 is a block diagram showing an encoding apparatus for a DVD audio disk.
26 is a flowchart showing processing of the encoding apparatus of FIG. 25. FIG.
27 is a block diagram showing an audio encoding unit in FIG. 25. FIG.
FIG. 28 is a block diagram showing a DVD audio disk decoding device.
29 is a block diagram functionally showing the decoding device of FIG. 28. FIG.
30 is a flowchart showing processing of the decoding device of FIGS. 28 and 29. FIG.
31 is a block diagram showing an audio decoding unit in FIG. 29. FIG.
FIG. 32 is a block diagram illustrating an audio encoding unit according to the second embodiment;
FIG. 33 is a block diagram illustrating an audio decoding unit according to the second embodiment.
FIG. 34 is a block diagram illustrating an audio encoding unit according to a third embodiment;
FIG. 35 is a block diagram illustrating an audio decoding unit according to a third embodiment.
FIG. 36 is a block diagram showing a packing device when transmitting an audio signal.
FIG. 37 is a flowchart showing a packing process of the packing apparatus of FIG.
38 is a flowchart showing in detail the pack generation process of FIG. 37. FIG.
FIG. 39 is a flowchart showing in detail the ATS generation process of FIG. 37;
40 is a flowchart showing transmission processing of the packing device of FIG. 36. FIG.
FIG. 41 is a block diagram showing an unpacking apparatus when transmitting an audio signal.
42 is a flowchart showing reception processing of the unpacking apparatus in FIG. 41. FIG.
43 is a flowchart showing an unpacking process of the unpacking apparatus in FIG. 41. FIG.
44 is a flowchart showing in detail the ATSI decoding process of FIG. 43. FIG.
45 is a flowchart showing in detail the pack decoding process of FIG. 43. FIG.
[Explanation of symbols]
113 Operation unit (mode selection means)
106 DVD audio formatting processor (formatting means)
116 DVD audio deformatting processing unit
117 Downmixer (Downmix means)
132 System Controller

Claims (12)

少なくとも2チャネルの第1のオーディオ信号と少なくとも1チャネルの第2のオーディオ信号を含むマルチチャネル信号と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1、第2のオーディオ信号の両方を再生するための第1の係数と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1のオーディオ信号を再生して前記第2のオーディオ信号を再生しないための第2の係数を伝送するステップと、
前記第1の係数に基づいて前記マルチチャネル信号をダウンミックスして前記第1、第2のオーディオ信号の両方を含むステレオ2チャネル信号を生成するモード又はタイトルと、前記第2の係数に基づいて前記マルチチャネル信号をダウンミックスして前記第1のオーディオ信号を含み、前記第2のオーディオ信号を含まないステレオ2チャネル信号を生成するモード又はタイトルの1つを選択するステップと、
前記選択されたモード又はタイトルでマルチチャネル信号をステレオ2チャネル信号にダウンミックスするステップとを、
有するオーディオ信号の伝送方法。
A multi-channel signal including at least two channels of a first audio signal and at least one channel of a second audio signal, and both the first and second audio signals by downmixing the multi-channel signal to two stereo channels. And a second coefficient for down-mixing the multi-channel signal into two stereo channels to reproduce the first audio signal and not to reproduce the second audio signal. Transmitting, and
A mode or title for downmixing the multi-channel signal based on the first coefficient to generate a stereo 2-channel signal including both the first and second audio signals, and based on the second coefficient Selecting one of the modes or titles to downmix the multi-channel signal to generate a stereo two-channel signal that includes the first audio signal and does not include the second audio signal;
Downmixing a multi-channel signal into a stereo 2-channel signal in the selected mode or title;
A method for transmitting an audio signal.
少なくとも2チャネルの第1のオーディオ信号と少なくとも1チャネルの第2のオーディオ信号を含むマルチチャネル信号と、
前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1、第2のオーディオ信号の両方を再生するための第1の係数と、
前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1のオーディオ信号を再生して前記第2のオーディオ信号を再生しないための第2の係数とを、
有するデータ構造が記録されたオーディオディスク。
A multi-channel signal including at least two channels of a first audio signal and at least one channel of a second audio signal;
A first coefficient for downmixing the multi-channel signal into two stereo channels to reproduce both the first and second audio signals;
A second coefficient for down-mixing the multi-channel signal into two stereo channels to reproduce the first audio signal and not to reproduce the second audio signal;
An audio disc having a data structure recorded thereon.
音楽ソースを少なくとも2チャネルの第1のオーディオ信号と少なくとも1チャネルの第2のオーディオ信号を含むマルチチャネル信号と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1、第2のオーディオ信号の両方を再生するための第1の係数と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1のオーディオ信号を再生して前記第2のオーディオ信号を再生しないための第2の係数を有するデータ構造にフォーマット化する手段を、
有するエンコード装置。
A music source is a multi-channel signal including a first audio signal of at least two channels and a second audio signal of at least one channel, and the multi-channel signal is down-mixed into two stereo channels, and the first and second audios A first coefficient for reproducing both signals, and a second coefficient for downmixing the multi-channel signal into two stereo channels to reproduce the first audio signal and not to reproduce the second audio signal. Means for formatting into a data structure having
Encoding device having.
少なくとも2チャネルの第1のオーディオ信号と少なくとも1チャネルの第2のオーディオ信号を含むマルチチャネル信号と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1、第2のオーディオ信号の両方を再生するための第1の係数と、前記マルチチャネル信号をステレオ2チャネルにダウンミックスして前記第1のオーディオ信号を再生して前記第2のオーディオ信号を再生しないための第2の係数を有するデータ構造をデコードするデコード装置であって、
前記第1の係数に基づいて前記マルチチャネル信号をダウンミックスして前記第1、第2のオーディオ信号の両方を含むステレオ2チャネル信号を生成するモード又はタイトルと、前記第2の係数に基づいて前記マルチチャネル信号をダウンミックスして前記第1のオーディオ信号を含み、前記第2のオーディオ信号を含まないステレオ2チャネル信号を生成するモード又はタイトルの1つを選択する手段と、
前記選択されたモード又はタイトルでマルチチャネル信号をステレオ2チャネル信号にダウンミックスする手段とを、
有するデコード装置。
A multi-channel signal including at least two channels of a first audio signal and at least one channel of a second audio signal, and both the first and second audio signals by downmixing the multi-channel signal to two stereo channels. And a second coefficient for down-mixing the multi-channel signal into two stereo channels to reproduce the first audio signal and not to reproduce the second audio signal. A decoding device for decoding a data structure having
A mode or title for downmixing the multi-channel signal based on the first coefficient to generate a stereo 2-channel signal including both the first and second audio signals, and based on the second coefficient Means for down-mixing the multi-channel signal to select one of the modes or titles for generating a stereo 2-channel signal that includes the first audio signal and does not include the second audio signal;
Means for downmixing a multi-channel signal into a stereo two-channel signal in the selected mode or title;
Having a decoding device.
前記第1のオーディオ信号は伴奏音楽であり、前記第2のオーディオ信号はボーカル音楽であることを特徴とする請求項1記載のオーディオ信号の伝送方法。2. The audio signal transmission method according to claim 1, wherein the first audio signal is accompaniment music, and the second audio signal is vocal music. 前記第1のオーディオ信号は伴奏音楽であり、前記第2のオーディオ信号はボーカル音楽であることを特徴とする請求項2記載のオーディオディスク。3. The audio disk according to claim 2, wherein the first audio signal is accompaniment music, and the second audio signal is vocal music. 前記第1のオーディオ信号は伴奏音楽であり、前記第2のオーディオ信号はボーカル音楽であることを特徴とする請求項3記載のエンコード装置。4. The encoding apparatus according to claim 3, wherein the first audio signal is accompaniment music, and the second audio signal is vocal music. 前記第1のオーディオ信号は伴奏音楽であり、前記第2のオーディオ信号はボーカル音楽であることを特徴とする請求項4記載のデコード装置。5. The decoding apparatus according to claim 4, wherein the first audio signal is accompaniment music, and the second audio signal is vocal music. 請求項1又は5記載のオーディオ信号の伝送方法において、
前記マルチチャネル信号をミックスして前記第1のオーディオ信号を含み、前記第2のオーディオ信号を含まないマルチチャネル信号を生成するための第3の係数を伝送するステップと、
前記第3の係数に基づいて前記マルチチャネル信号をミックスするステップとを、
更に有することを特徴とするオーディオ信号の伝送方法。
In the audio signal transmission method according to claim 1 or 5,
Transmitting a third coefficient for mixing the multi-channel signal to generate a multi-channel signal that includes the first audio signal and does not include the second audio signal;
Mixing the multi-channel signal based on the third coefficient;
An audio signal transmission method, further comprising:
請求項2又は6記載のオーディオディスクにおいて、
前記データ構造はさらに、前記マルチチャネル信号をミックスして前記第1のオーディオ信号を含み、前記第2のオーディオ信号を含まないマルチチャネル信号を生成するための第3の係数を有することを特徴とするオーディオディスク。
The audio disc according to claim 2 or 6,
The data structure further includes a third coefficient for mixing the multi-channel signal to generate a multi-channel signal that includes the first audio signal and does not include the second audio signal. Audio disc to play.
請求項3又は7記載のエンコード装置において、
前記フォーマット化手段は、前記マルチチャネル信号をミックスして前記第1のオーディオ信号を含み、前記第2のオーディオ信号を含まないマルチチャネル信号を生成するための第3の係数をフォーマット化することを特徴とするエンコード装置。
The encoding device according to claim 3 or 7,
The formatting means mixes the multi-channel signal to format a third coefficient for generating a multi-channel signal that includes the first audio signal and does not include the second audio signal. Characteristic encoding device.
請求項4又は8記載のデコード装置において、
前記データ構造はさらに、前記マルチチャネル信号をミックスして前記第1のオーディオ信号を含み、前記第2のオーディオ信号を含まないマルチチャネル信号を生成するための第3の係数を有し、
前記第3の係数に基づいて前記マルチチャネル信号をミックスする手段を更に有することを特徴とするデコード装置。
The decoding device according to claim 4 or 8,
The data structure further comprises a third coefficient for mixing the multi-channel signal to generate a multi-channel signal that includes the first audio signal and does not include the second audio signal;
The decoding apparatus further comprising means for mixing the multi-channel signal based on the third coefficient.
JP26901798A 1998-09-07 1998-09-07 Audio signal transmission method, audio disc, encoding device, and decoding device Expired - Fee Related JP3632891B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26901798A JP3632891B2 (en) 1998-09-07 1998-09-07 Audio signal transmission method, audio disc, encoding device, and decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26901798A JP3632891B2 (en) 1998-09-07 1998-09-07 Audio signal transmission method, audio disc, encoding device, and decoding device

Publications (2)

Publication Number Publication Date
JP2000090582A JP2000090582A (en) 2000-03-31
JP3632891B2 true JP3632891B2 (en) 2005-03-23

Family

ID=17466526

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26901798A Expired - Fee Related JP3632891B2 (en) 1998-09-07 1998-09-07 Audio signal transmission method, audio disc, encoding device, and decoding device

Country Status (1)

Country Link
JP (1) JP3632891B2 (en)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1427252A1 (en) * 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
US7987097B2 (en) 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
JP5394931B2 (en) * 2006-11-24 2014-01-22 エルジー エレクトロニクス インコーポレイティド Object-based audio signal decoding method and apparatus
JP2011066868A (en) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd Audio signal encoding method, encoding device, decoding method, and decoding device
KR20150032649A (en) 2012-07-02 2015-03-27 소니 주식회사 Decoding device and method, encoding device and method, and program
JPWO2014007097A1 (en) * 2012-07-02 2016-06-02 ソニー株式会社 Decoding device and method, encoding device and method, and program
TWI517142B (en) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
CN103748629B (en) 2012-07-02 2017-04-05 索尼公司 Decoding apparatus and method, code device and method and program
US10219091B2 (en) 2016-07-18 2019-02-26 Bose Corporation Dynamically changing master audio playback device

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56117304A (en) * 1980-02-19 1981-09-14 Matsushita Electric Ind Co Ltd Multichannel recording and reproducing device
JP2766466B2 (en) * 1995-08-02 1998-06-18 株式会社東芝 Audio system, reproduction method, recording medium and recording method on recording medium
JP3761639B2 (en) * 1995-09-29 2006-03-29 ユナイテッド・モジュール・コーポレーション Audio decoding device
JP3437371B2 (en) * 1996-03-22 2003-08-18 パイオニア株式会社 Information recording device and information reproducing device
JPH1039881A (en) * 1996-07-19 1998-02-13 Yamaha Corp Karaoke marking device
JPH10136500A (en) * 1996-10-29 1998-05-22 Pioneer Electron Corp Multitrack signal carrier memory card and mixer using the same
JP3173482B2 (en) * 1998-11-16 2001-06-04 日本ビクター株式会社 Recording medium and audio decoding device for audio data recorded on recording medium

Also Published As

Publication number Publication date
JP2000090582A (en) 2000-03-31

Similar Documents

Publication Publication Date Title
JP3632891B2 (en) Audio signal transmission method, audio disc, encoding device, and decoding device
JP3743671B2 (en) Audio disc and audio playback device
JP3832747B2 (en) DVD audio disk and decoding device
JP3743669B2 (en) Audio disc and audio playback device
JP3832748B2 (en) DVD audio disk and decoding device
JP3743668B2 (en) Audio disc and audio playback device
JP3826919B2 (en) Audio signal encoding method and decoding apparatus
JP3832757B2 (en) Audio disc and decoding device
JP2000100076A (en) Digital audio disk, encoding device, decoding device and transmission method
JP2004079176A (en) Encoding method and decoding device for audio signal
JP2004127497A (en) Encoding method and decoding device for audio signal
JP2004079173A (en) Encoding method and decoding method for audio signal
JP2004111043A (en) Encoding method and decoding device for audio signal
JP2004079171A (en) Encoding method and decoding method for audio signal
JP2004079172A (en) Method for encoding and decoding audio signal
JP2004095173A (en) Dvd audio disk and decoding device
JP2004006054A (en) Method for encoding and decoding audio signal
JP2004079170A (en) Encoding method and decoding method for audio signal
JP2004087117A (en) Audio disk and decoder
JP2004095169A (en) Dvd audio disk and decoding device
JP2004006060A (en) Digital video disk audio disk and decoder
JP2004087111A (en) Audio disk and decoder
JP2004087114A (en) Audio disk and decoder
JP2004095170A (en) Dvd audio disk and decoding device
JP2004079178A (en) Encoding method and decoding device for audio signal

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041216

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100107

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110107

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120107

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120107

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130107

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130107

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees