JP4055129B2 - Audio data encoding method and decoding method - Google Patents

Audio data encoding method and decoding method Download PDF

Info

Publication number
JP4055129B2
JP4055129B2 JP2003119932A JP2003119932A JP4055129B2 JP 4055129 B2 JP4055129 B2 JP 4055129B2 JP 2003119932 A JP2003119932 A JP 2003119932A JP 2003119932 A JP2003119932 A JP 2003119932A JP 4055129 B2 JP4055129 B2 JP 4055129B2
Authority
JP
Japan
Prior art keywords
audio
information
data
bytes
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003119932A
Other languages
Japanese (ja)
Other versions
JP2003331512A (en
Inventor
美昭 田中
昭治 植野
徳彦 渕上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2003119932A priority Critical patent/JP4055129B2/en
Publication of JP2003331512A publication Critical patent/JP2003331512A/en
Application granted granted Critical
Publication of JP4055129B2 publication Critical patent/JP4055129B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、音楽ソースのようなオーディオデータを記録したオーディオデータのエンコード方法及びデコード方法に関し、特にDVDオーディオディスクに代表されるディスクのデータ構造に関する。
【0002】
【従来の技術】
オーディオ用光ディスクとしては、CD(Compact Disc)が市場に出てから10数年が経過し、オーディオ情報の記録媒体としては既に従来のカセットテープを凌駕してめざましく普及している。また、デジタルディスクであるCDの物理・論理フォーマットは、8ビット固定データ長シンボルのEFM変調記録方式や、サブコード、オーディオデータ、CRCなどのデータフォーマットとして確立しており、さらに、各種のアプリケーション機能を付加したCDプレーヤが開発されている。
【0003】
ところで、CDにおけるオーディオ信号は、標本化周波数が44.1kHz、量子化ビット数が16ビット、左右2チャネルであり、再生周波数帯域幅が約22kHz、S/N比が約96dBの特性を有する。なお、電子出版の分野で利用されているCD−ROMでは、オーディオデータがADPCMで圧縮されているので上記の特性はCDより劣る。
【0004】
一方、数年来、CDのチャネル数(左右2チャネル方式の音場)は不満足であるという考え方が定着しつつあり、この問題点を解決するために例えば6チャネルのようなマルチチャネルによる優れた音場特性が求められている。また、CDの再現特性に関しては上記の再生周波数帯域幅とS/N比は、共に不満足であるという考え方が定着しつつ有り、上記の特性がより優れた次世代オーディオディスクの規格化が要望されている。例えば再生周波数帯域幅としては100kHz、S/N比としては144〜120dB程度の高い特性が求められている。したがって、マルチチャネルや広帯域の方式は、CD方式と比較して優れた利点を有し、また、CDの特性に対する不満足さを十分に補うことができるので、今後、オーディオ機器への採用とその普及が期待される。
【0005】
しかしながら、これまでのオーディオ伝送系、特に再生装置の増幅器(オーディオアンプ)やスピーカは2チャネル方式及び狭帯域方式を採用しているので、直ちにマルチチャネル方式や広帯域方式のオーディオ機器に切り替わることはない。
【0006】
一方、マルチメディア時代の本格的な到来を迎えてDVDの規格が定まり、既にその規格に準拠した再生システムが販売されているとともに、DVD用のAV(Audio-Visual)ソフトも供給されているので、DVDが高密度記録媒体として非常に広範に普及することは想像に難くない。そこで、オーディオ伝送系に係る狭帯域及び2チャネル方式をDVDのオーディオ規格と両立性をもたせることにより、多くのチャネル数と優れた再生周波数帯域幅及びS/N比を有するDVD方式の普及も併せて実現することができると考えられる。特にDVD規格の中のオーディオフォーマットに対して両立性を有するようにすれば、従来の伝送系との相関性も確保することができるので都合がよい。
【0007】
【発明が解決しようとする課題】
しかしながら、近年では、デジタルオーディオの著作権を尊重する気運が高まっており、したがって、2チャネル方式や狭帯域方式のオーディオデータとマルチチャネル方式や広帯域方式の高品質オーディオデータの両方を伝送する場合には、特に高品質オーディオデータのコピープロテクトの問題点が発生する。
【0008】
そこで、本発明は、2チャネル方式や狭帯域方式のオーディオデータとマルチチャネル方式や広帯域方式の高品質オーディオデータの両方を伝送する場合にそのコピープロテクトの問題点を解決することができるオーディオデータのエンコード方法及びデコード方法を提供することを目的とする。
【0009】
【課題を解決するための手段】
本願発明は、以下の1)及び2)に記載の手段よりなる。
すなわち、
1)アナログ音声信号がマルチチャネルの前方のチャネルと後方用のチャネル毎に異なるサンプリング周波数でサンプリングされ、かつ前方のチャネルと後方用のチャネル毎に異なる量子化ビット数で量子化されたデジタル音声信号として記録され、更に、前記マルチチャネルと同一又は異なるサンプリング周波数及び量子化ビット数で量子化され、ステレオ用の2チャネルのデジタル音声信号として記録されるオーディオエリアと、
前記オーディオエリアに記録されているデジタル音声信号の前方のチャネルと後方用のチャネル毎のサンプリング周波数および量子化ビット数が記録される量子化制御情報エリアと、
前記オーディオエリアに記録されているマルチチャネルとステレオ用の2チャネルのデジタル音声信号のコピーを管理するコピー管理データが記録されるコピー管理データエリアと、
前記デジタル音声信号のタイトルをサーチするためのサーチ情報が記録されるタイトルサーチ情報エリアと、
前記デジタル音声信号のタイトルのメニューの管理情報が記録されるオーディオ・マネージャ・メニューのエリア(AMGM)とを、
所定のフォーマットによりフォーマット化するステップを、有するオーディオデータのエンコード方法。
2)上記1)記載のオーディオデータのエンコード方法により記録されたオーディオ信号をデコードして、前記コピー管理データに基づいて前記オーディオエリアに記録されているマルチチャネルとステレオ用の2チャネルのデジタル音声信号のコピーを管理するステップを、有するオーディオデータのデコード方法。
【0010】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。図1はDVD−ビデオのフォーマットと、本発明に係るDVD−オーディオのフォーマットの一実施形態を示す説明図、図2は図1のオーディオマネージャ(AMG)のフォーマットを詳しく示す説明図、図3は図1のオーディオタイトルセット(ATS)のフォーマットを詳しく示す説明図、図4は図2のオーディオマネージャインフォメーション(AMGI)のフォーマットを詳しく示す説明図、図5は図4のオーディオタイトルセット・アトリビュートテーブル(ATS−ATRT)のフォーマットを詳しく示す説明図、図6は図5のオーディオタイトルセット・アトリビュートデータ(ATS−ATR)のフォーマットを詳しく示す説明図、図7は図3のオーディオタイトルセットインフォメーション(ATSI)のフォーマットを詳しく示す説明図、図8は図7のオーディオタイトルセットインフォメーション・マネージメントテーブル(ATSI−MAT)のフォーマットを詳しく示す説明図、図9は図8のオーディオタイトルセットメニュー・オーディオストリーム・アトリビュートデータ(ATSM−AST−ATR)を詳しく示す説明図、図10は図8のオーディオタイトルセット・オーディオストリーム・アトリビュートテーブル(ATS−AST−ATRT)のフォーマットを詳しく示す説明図、図11は図10の各オーディオストリームのアトリビュートデータ(ATS−AST−ATR)を詳しく示す説明図である。
【0011】
また、図12は図1のオーディオコンテンツブロックユニット(ACBU)を示す説明図、図13は図12のオーディオパックとビデオパックのフォーマットを詳しく示す説明図、図14は図12のオーディオコントロール(A−CONT)パックのフォーマットを詳しく示す説明図、図15は図14のオーディオキャラクタディスプレイ(ACD)エリアのフォーマットを詳しく示す説明図、図16は図15のネームスペース情報により表示される例を示す説明図、図17は図14のオーディオサーチデータ(ASD)エリアのフォーマットを詳しく示す説明図、図18は図1のオーディオコンテンツブロックユニットの変形例を示す説明図である。
【0012】
また、図19は本発明に係るオーディオデータのエンコード装置を示すブロック図、図20は本発明に係るオーディオディスクに記録される2チャネルとマルチチャネルのサンプリング周波数と量子化ビット数を示す説明図、図21は本発明に係るオーディオディスクに記録されるコピー管理データを示す説明図、図22は図21のCGMCAPSコードを詳しく示す説明図、図23はオーディオデータのデコード装置を示すブロック図、図24は図23の再生装置の再生処理を示すフローチャート、図25は本発明に係るコピー処理を示すフローチャートである。
【0013】
ここで、この説明のDVD−オーディオディスクには、CD世代からDVD−オーディオ世代に移行する際の過渡期に対応するように、オーディオ信号としてステレオ用2チャネルと5/6/8チャネルのマルチチャネルの両方の信号が記録される。また、この過渡期が経過したときには5/6/8チャネルのマルチチャネル信号のみが記録されるようになると考えられる。
【0014】
図1(a)、(b)はそれぞれDVD−ビデオ、DVD−オーディオの各フォーマットを示し、DVD−オーディオのフォーマットはエリアの名称が異なるがDVD−ビデオと互換性を有する。まず、大別してDVD−ビデオのフォーマットは先頭のビデオマネージャ(VMG)と、それに続く複数のビデオタイトルセット(VTS)の各エリアにより構成され、他方、DVD−オーディオのフォーマットはこれに対応して図2に詳しく示すオーディオマネージャ(AMG)と、図3に詳しく示すようにAMGに続く複数のオーディオタイトルセット(ATS)の各エリアにより構成されている。
【0015】
VTSの各々は先頭のVTSインフォメーション(VTSI)と、それに続く1以上のビデオコンテンツブロックセット(VCBS)と最後のVTSIにより構成され、他方、ATSの各々はこれに対応して先頭のATSインフォメーション(ATSI)と、それに続く1以上のオーディオコンテンツブロックセット(ACBS)と最後のATSIにより構成されている。ATSIには、ACBS内の各曲の演奏時間が実時間でセットされる。
【0016】
VCBSの各々は複数のVCBにより構成され、他方、ACBSの各々は複数のACBにより構成されている。VCBの各々はビデオの1タイトル(Title)分であり、ACBの各々はこれに対応してオーディオの1タイトル分である。VCBの各々(1タイトル)は複数のチャプタ(Chapter)により構成され、他方、ACBの各々(1タイトル)はこれに対応して複数のトラック(Track)により構成されている。チャプタはパートオブタイトル(PTT)を含み、トラックはパートオブタイトル(PTT)を含む。
【0017】
チャプタの各々は複数のセル(CELL)により構成され、他方、トラックの各々はこれに対応して複数のインデックス(Index)により構成されている。セルの各々は複数のVCBユニット(VCBU)により構成され、他方、インデックスの各々はこれに対応して複数のACBユニット(ACBU)により構成されている。VCBユニットとACBユニットの各々は、複数のパックにより構成され、1パックは2048バイトで構成されている。
【0018】
VCBユニットの各々は、先頭のコントロールパック(以下、CONTパック)と、それに続く複数のビデオ(V)パック、オーディオ(A)パック及びサブピクチャ(SP)パックにより構成され、他方、ACBユニットの各々は、これに対応して先頭のオーディオコントロールパック(以下、A−CONTパック)と、それに続く複数のAパックとVパックにより構成されている。
【0019】
CONTパックには後続のVパックを制御する情報が配置され、A−CONTパックにはCDのTOC情報のように後続のAパックのオーディオ信号を管理するための情報が配置される。Aパックにはオーディオデータが配置され、Vパックにはビデオデータの他、オーディオデータ以外の例えばクローズドキャプション(CC)データが配置される。
【0020】
AMG(オーディオマネージャ)は図2に示すように、
・図4に詳しく示すオーディオマネージャインフォメーション(AMGI)と、
・AMGメニュー用のオーディオコンテンツブロックセット(AMGM−ACBS)と、
・バックアップ用のAMGI
を有する。AMGM−ACBSはコントロール情報として
・プレゼンテーションコントロールインフォメーション(PCI)と、
・データサーチインフォメーション(DSI)
を有する。
【0021】
ATS(オーディオタイトルセット)は図3に示すように、
・図7に詳しく示すオーディオタイトルセットインフォメーション(ATSI)と、
・ATSメニュー用のオーディオコンテンツブロックセット(ATSM−ACBS)と、
・ATSタイトル用のオーディオコンテンツブロックセット(ATSA−ACBS)と、
・バックアップ用のATSI
を有する。ATSM−ACBSとATSA−ACBSは共に、前述(図2)したPCIとDSIを有する。
【0022】
AMGI(オーディオマネージャインフォメーション)は図4に詳しく示すように、
・AMGIのマネージメントテーブル(AMGI−MAT)と、
・タイトルのサーチポインタテーブル(T−SRPT)と、
・オーディオマネージャメニューPGCIユニットテーブル(AMGM−PGCI−UT)と、
・ペアレンタルマネージメントインフォメーションテーブル(PTL−MAIT)と、
・図5に詳しくオーディオタイトルセット・アトリビュートテーブル(ATS−ATRT)と、
・テキストデータマネージャ(TXTDT−MG)と、
・オーディオマネージャメニューセル(インデックス)アドレステーブル(AMGM−C−ADT)と、
・オーディオマネージャメニュー・オーディオコンテンツブロックユニット・アドレスレスマップ(AMGM−ACBU−ADMAP)
を有する。
【0023】
ATS−ATRT(オーディオタイトルセット・アトリビュートテーブル)は図5に詳しく示すように、
・オーディオタイトルセットアトリビュートテーブルインフォメーション(ATS−ATRTI)と、
・複数(n)個のATSの各々のオーディオタイトルセットアトリビュートサーチポインタ(ATS−ATR−SRP#1〜#n)と、
・図6に詳しく示すような複数(n)個のATSの各々のオーディオタイトルセット・アトリビュートデータ(ATS−ATR−#1〜#n)
を有する。
【0024】
オーディオタイトルセット・アトリビュートデータ(ATS−ATR−#1〜#n)の各々は、図6に詳しく示すように
・ATS−ATR−EA(エンドアドレス)と、
・ATS−CAT(カテゴリー)と、
・ATS−ATRI(インフォメーション)
を有する。
【0025】
図3に示すATSI(ATSインフォメーション)は図7に詳しく示すように、
・図8に詳しく示すオーディオタイトルセットインフォメーション・マネージメントテーブル(ATSI−MAT)と、
・オーディオタイトルセット・パートオブタイトル・サーチポインタテーブル(ATS−PTT−SRPT)と、
・オーディオタイトルセット・プログラムチェーンインフォメーションテーブル(ATS−PGCIT)と、
・オーディオタイトルセットメニュー・PGCI・ユニットテーブル(ATSM−PGCI−UT)と、
・オーディオタイトルセット・タイムマップテーブル(ATS−TMAPT)と、
・オーディオタイトルセットメニュー・セル・アドレステーブル(ATSM−C−ADT)と、
・オーディオタイトルセットメニュー・オーディオコンテンツブロックユニット・アドレスマップ(ATSM−ACBU−ADMAP)と、
・オーディオタイトルセット・セル・アドレステーブル(ATS−C−ADT)と、
・オーディオタイトルセット・オーディオコンテンツブロックユニット・アドレスマップ(ATS−ACBU−ADMAP)
を有する。
【0026】
図7に示すATSI−MAT(オーディオタイトルセットインフォメーション・マネージメントテーブル)は図8に詳しく示すように、
・ATS−ID(識別子)と、
・ATS−EA(エンドアドレス)と、
・ATSI−EAと、
・VERN(DVDオーディオスペックのバージョン番号)と、
・ATS−CAT(カテゴリー)と、
・ATSI−MAT−EAと、
・ATSM−ACBS−SA(スタートアドレス)と、
・ATSA−ACBS−SAと、
・ATS−PTT−SRPT−SAと、
・ATS−PGCIT−SAと、
・ATSM−PGCI−UT−SAと、
・ATS−TMAP−SAと、
・ATSM−C−ADT−SAと、
・ATSM−ACBU−ADMAP−SAと、
・図9に詳しく示すようなATSM−AST−ATR(ATSMのオーディオストリーム・アトリビュート)と、
・ATS−AST−Ns(ATSのオーディオストリームの数)と、
・図10に詳しく示すようなATS−AST−ATRT(ATSのオーディオストリーム・アトリビュートテーブル)
を有する。
【0027】
ATSM−AST−ATRは図9に詳しく示すように8バイト(ビットb63〜b0)により構成され、このディスクに記録されている符号化オーディオ信号の属性として次のようなデータ(1)〜(4)が配置される(他のビットは保留)。
(1)オーディオ符号化モード(3ビットb63〜b61)
000b:ドルビーAC−3
010b:MPEG−1又はMPEG−2(拡張ビットストリーム無し)
011b:MPEG−2(拡張ビットストリーム有り)
100b:リニヤPCMオーディオ
101b:リニヤPCMオーディオ(2ch+5ch、2ch+6ch、2ch+8chを含む。)
【0028】
(2)量子化/DRC(ダイナミックレンジコントロール)情報(2ビットb55、b54)
・オーディオ符号化モードが「000b」の場合には「11b」
・オーディオ符号化モードが「010b」又は「011b」の場合、
00b:MPEGオーディオストリーム内にダイナミックレンジコントロールデータが存在しない
01b:MPEGオーディオストリーム内にダイナミックレンジコントロールデータが存在する
10b,11b:保留
・オーディオ符号化モードが「100b」、「101b」の場合、ステレオ2chに対して
00b:16ビット
01b:20ビット
10b:24ビット
11b:保留
【0029】
(3)サンプリング周波数fs(2ビットb53、b52)
ステレオ2chに対して
00b:48kHz
01b:96kHz
10b:192kHz
(4)オーディオチャネル数(3ビットb50〜b48)
000b:1ch(モノラル)
001b:2ch(ステレオ)
010b:3ch
011b:4ch
100b:(ステレオ2ch+5ch)
101b:(ステレオ2ch+6ch)
110b:7ch
111b:(ステレオ2ch+8ch)
【0030】
図10に示すATS−AST−ATRT(ATSのオーディオストリーム・アトリビュートテーブル)は図11に詳しく示すように、オーディオストリーム#0〜#7毎のATS−AST−ATRを有し、ATS−AST−ATRの各々は8バイトで構成されている(合計64バイト)。
【0031】
1つのオーディオストリームのATS−AST−ATRは図11に示すように、図9に示すオーディオタイトルセットメニュー・オーディオストリーム・アトリビュートデータ(ATSM−AST−ATR)と同様な8バイト(ビットb63〜b0)で構成され、上記属性データ(1)〜(4)の他に、
(5)マルチチャネル・イクステンション(ME)(1ビットb60)と、
(6)オーディオタイプ(2ビットb59、b58)と、
(7)オーディオアプリケーションモード(2ビットb57、b56)と、
(8)そのストリーム(AST)の間引き情報(2ビットb47、b46)と、
(9)LFE(Low Frequency Effect)1chのみの間引き情報(2ビットb45、b44)
の各データを有する。そして、このDVDオーディオディスクの(7)オーディオアプリケーションモードには、
11b:2ch+サラウンドモード
が記録され、また、(8)そのストリームの間引き情報と、(9)LFE1chのみの間引き情報には共に、帯域情報として
00b:フル(1/1)
01b:ハーフ(1/2)
10b:クオータ(1/4)
が記録される。
【0032】
ただし、このATSM−AST−ATRにおける(4)オーディオチャネル数は、オーディオストリーム#0では必ず2chとなり、また、オーディオストリーム#1はフロントの3chを含む。すなわち、例えば1つのタイトルのオーディオ信号を2+6chで記録する場合、2chのステレオ信号をオーディオストリーム#0に割り当て、6chの内、3chのフロント信号をオーディオストリーム#1に割り当て、2chのリヤ信号とLFE1ch信号をオーディオストリーム#2に割り当てる。そして、図4に示すオーディオマネージャインフォメーション・マネージメントテーブル(AMGI−MAT)と図8に示すオーディオタイトルセットインフォメーション・マネージメントテーブル(ATSI−MAT)には共に、ストリーム#0〜#2の利用データとして「3」が記録される。
【0033】
また、この2+6chのアナログオーディオ信号を例えば次のようなサンプリング周波数fsでサンプリングし、次のような量子化ビット数で量子化して記録する場合、
ステレオ2ch :48kHz、20ビット
フロント3ch :96kHz、16ビット
リヤ2ch、LFE1ch:48kHz、16ビット(間引きなし)
図9に示すオーディオタイトルセットメニュー・オーディオストリーム・アトリビュートデータ(ATSM−AST−ATR)にはステレオ2chの属性として
(1)オーディオ符号化モード
101b:リニヤPCMオーディオ(2ch+5ch、2ch+6ch、2ch+8chを含む。)
(2)量子化/DRC
01b:20ビット
(3)サンプリング周波数fs
00b:48kHz
(4)オーディオチャネル数
101b:(ステレオ2ch+6ch)
が記録される。
【0034】
また、オーディオストリーム#0のATS−AST−ATRには
(1)オーディオ符号化モード
101b:リニヤPCMオーディオ(2ch+5ch、2ch+6ch、2ch+8chを含む。)
(2)量子化/DRC
01b:20ビット
(3)サンプリング周波数fs
00b:48kHz
(4)オーディオチャネル数
001b:2ch(ステレオ)
(7)オーディオアプリケーションモード
11b:2ch+サラウンドモード
(8)そのストリームの間引き情報
00b:フル(1/1)
(9)LFE1chのみ間引き情報
00b:フル(1/1)
が記録される。
【0035】
また、オーディオストリーム#1のATS−AST−ATRには
(1)オーディオ符号化モード
101b:リニヤPCMオーディオ(2ch+5ch、2ch+6ch、2ch+8chを含む。)
(2)量子化/DRC
00b:16ビット
(3)サンプリング周波数fs
01b:96kHz
(4)オーディオチャネル数
010b:3ch
(7)オーディオアプリケーションモード
11b:2ch+サラウンドモード
(8)そのストリームの間引き情報
00b:フル(1/1)
(9)LFE1chのみ間引き情報
00b:フル(1/1)
が記録される。
【0036】
また、オーディオストリーム#2のATS−AST−ATRには
(1)オーディオ符号化モード
101b:リニヤPCMオーディオ(2ch+5ch、2ch+6ch、2ch+8chを含む。)
(2)量子化/DRC
00b:16ビット
(3)サンプリング周波数fs
00b:48kHz
(4)オーディオチャネル数
010b:3ch
(7)オーディオアプリケーションモード
11b:2ch+サラウンドモード
(8)そのストリームの間引き情報
00b:フル(1/1)
(9)LFE1chのみ間引き情報
00b:フル(1/1)
が記録される。
【0037】
次に、オーディオストリームが記録されるAパックとその制御パックについて説明する。図12に示すようにVCBユニットは0.4〜1.0秒分の任意の数のパックにより構成され、ACBユニットは0.5〜1.0秒分の任意の数のパックにより構成されている。また、DVD−オーディオのACBユニットにおけるA−CONTパックは、DVD−ビデオのVCBユニットにおける第3パックに配置される。
【0038】
A−CONTパックは基本的にオーディオ時間の0.5秒単位に配置され、インデックスの切れ目では0.5〜1.0秒の範囲で完結するように配置される。また、オーディオの時間(GOF:Group of Audio Frame)はA−CONTパックにより示され、そのデータ位置はオーディオフレームナンバと、ファーストアクセスユニットポインタとフレームヘッダの数により決まる。また、A−CONTパック直前のAパックは、オーディオ時間の0.5秒単位でパディングすることを強制しない。
【0039】
隣接するAパックは、オーディオ信号がお互いに関連するように配置され、例えばステレオの場合にはLチャネルパックとRチャネルパックが隣接して配置され、また、5/6/8チャネルのマルチチャネルの場合にも同様に隣接して配置される。Vパックはオーディオ信号の再生時に映像を表示する場合にそのAパックに隣接して配置される。AパックとVパックは、図13に示すように2034バイトのユーザデータ(Aデータ、Vデータ)に対して4バイトのパックスタート情報と、6バイトのSCR(System Clock Reference:システム時刻基準参照値)情報と、3バイトのMux レート(rate)情報(ストリームの多重化速度情報)と1バイトのスタッフィングの合計14バイトのパックヘッダが付加されて構成されている(1パック=合計2048バイト)。この場合、タイムスタンプであるSCR情報を、ACBユニット内の先頭パックでは「1」として同一タイトル内で連続とすることにより同一タイトル内のAパックの時間を管理することができる。
【0040】
これに対し、A−CONTパックは図14に示すように、14バイトのパックヘッダと、24バイトのシステムヘッダと、1003バイトのACD(オーディオキャラクタディスプレイ)パケットと、1007バイトのASD(オーディオサーチデータ)パケットにより構成されている。また、ACDパケットは6バイトのパケットヘッダと、1バイトのサブストリームIDと、図15に詳しく示すような636バイトのACD(オーディオキャラクタディスプレイ)情報と、360バイトの保留エリアにより構成されている。ASDパケットは同じく6バイトのパケットヘッダ及び1バイトのサブストリームIDと、図17に詳しく示すような1000バイトのASD(オーディオサーチデータ)により構成されている。
【0041】
636バイトのACD情報エリアは、図15に詳しく示すように48バイトのジェネラル情報エリアと、第1の言語の文字「1」及び第2の言語の文字「2」毎に294バイトのエリアを有し、この各エリアは93バイトのネームスペースエリア、各々93バイトの2つのフリースペースエリアと15バイトのデータポインタエリアにより構成されている。第1の言語の文字「1」と第2の言語の文字「2」の一方のネームスペースエリアには、例えば図16に示すように楽曲名を日本語で表示するためのデータが配置され、他方のネームスペースエリアには英語で表示するためのデータが配置される。なお、この表示言語はディスク発行元が決定してよい。
【0042】
48バイトのジェネラル情報は、例えば16バイトのサービスレベル情報と、12バイトの言語コード情報と、6バイトの文字セットコード情報と、6バイトの表示アイテム情報と、2バイトの「前のACD情報との相違」情報と、6バイトの保留情報により構成される。16バイトのサービスレベル情報は、表示サイズ、表示の種類、オーディオ/ビデオ/SPの区別、ストリームなどを示し、また、文字はマンダトリー(必須)、ビットマップはオプション(随意)である。12バイトの言語コード情報はビデオファイルと同様に文字「1」「2」の言語をそれぞれ2バイトで示し、1ファイル中最大8言語分を示す。英語はマンダトリーである。
【0043】
6バイトの文字セットコード情報は、言語コードに対応した文字コードを最大15個持つことが可能であり、文字「1」「2」の言語の有無と種類を1バイトで示す。コード例を以下に示す。
1.ISO646
2.ISO8859−1
3.MS−JIS
6バイトの表示アイテム情報は、図15に示すフリースペース「1」「2」、データポインタの有無、IDを示す。ネームスペースはマンダトリーであり、タイトルネーム、ミュージックネーム、アーティストネームは必ず記述する。
【0044】
1000バイトのASD(オーディオサーチデータ)は、図17に詳しく示すように16バイトのジェネラル情報と、8バイトの現在の番号(No.)情報と、16バイトの現在時刻情報と、8バイトのタイトルセットサーチ情報と、8バイトのタイトルサーチ情報と、404バイトのトラックサーチ情報と、408バイトのインデックスサーチ情報と、80バイトのハイライトサーチ情報と、52バイトの保留エリアにより構成されている。
【0045】
8バイトの現在の番号情報は、タイトルセットの現在のタイトル番号(2バイト:BCD)と、タイトルセットの現在のトラック番号(2バイト:BCD)と、トラックの現在のインデックス番号(2バイト:BCD)と保留領域(2バイト)により構成されている。16バイトの現在時刻情報は、トラックのプレイバック時間(4バイト:BCD)と、トラックの残りのプレイバック時間(4バイト:BCD)と、タイトルの絶対時間(4バイト:BCD)とタイトルの残りの絶対時間(4バイト:BCD)により構成されている。
【0046】
8バイトのタイトルセットサーチ情報は、タイトルセットの最初のセクタ番号(4バイト)と、タイトルセットの最後のセクタ番号(4バイト)により構成されている。8バイトのタイトルサーチ情報は、タイトルの最初のセクタ番号(4バイト)と、タイトルの最後のセクタ番号(4バイト)により構成されている。404バイトのトラックサーチ情報は、タイトルのトラック及びセクタ番号(4バイト×99)と、タイトルの最初のトラック番号(4バイト)とタイトルの最後のトラック番号(4バイト)により構成されている。
【0047】
408バイトのインデックスサーチ情報は、トラックのインデックス及びセクタ番号(4バイト×100)と、トラックの最初のインデックス番号(4バイト)とトラックの最後のインデックス番号(4バイト)により構成されている。80バイトのハイライトサーチ情報は、トラックのインセクタ番号(4バイト×10)とトラックのアウトセクタ番号(4バイト×10)により構成されている。
【0048】
このようなフォーマットによれば、複数のAパックの先頭に、CDのTOC情報のように後続のAパックのオーディオ信号を管理するためのA−CONTパックが配置されるので、オーディオデータはビデオデータなどとは一体化されず、記録容量を多くすることができる。また、A−CONTパックによりオーディオ時間を管理することができ、また、A−CONTパックによりオーディオデータに関する曲名などの簡単な文字情報を取り出すことができる。
【0049】
また、A−CONTパック内にタイトル、スタートアドレス、演奏時間などのTOC情報を配置するので、オーディオ再生中であってもユーザの操作に応じた情報をA−CONTパックから取り出して再生を開始することができる。また、オーディオマネージャインフォメーション(AMGI)とオーディオタイトルセットインフォメーション(ATSI)内にTOC情報を配置することにより、必要なTOC情報を再生装置内のメモリに記憶させて、ユーザの操作に応じた情報をメモリから即座に読み出して再生を開始することができる。また、DVD−ビデオにおけるプログラムチェーンインフォメーション(PGCI)のような大きな容量の情報を記憶する必要がないので、ディスクを効率的に管理することができる。
【0050】
さらに、
1.コンテンツ内に画像(V)データがない場合、
(1)タイトル、曲、インデックスの3階層に対するサーチ、ランダムアクセスが可能になる。
(2)GOF(オーディオフレーム)単位の頭出し、タイムサーチ、ランダムアクセスが可能になる。
(3)タイトル、曲、インデックスの時間を実時間で管理することができる。
【0051】
また、
2.コンテンツ内に画像(V)データがある場合、
オーディオデータに関しては、
上記(1)〜(3)の他に、
(4)タイトル、曲中の現在時間、残り時間を実時間で表示、管理することができる。
【0052】
ビデオデータに関しては、
(1)タイトル、PTT、セルの3階層に対するサーチ、ランダムアクセスが可能になる。
(2)ビデオフレーム単位の頭出し、タイムサーチ、ランダムアクセスが可能になる。
(3)タイトル、PTT、セルの時間を実時間で管理することができる。
(4)PTT又はタイトル中の現在時間、残り時間をビデオフレーム単位時間で表示、管理することができる。
【0053】
なお、図1(b)のACBUは、A−CONTパックとCONTパックを含んでいるが、図18に示すようにVパックとCONTパックは含まないように構成してもよい。この場合にはビデオ信号は記録されないが、オーディオ信号の記録容量が割り増しになる特徴があり、ディスクサイズを小型化することができ、また、再生機能を簡略化することができるのでポータブル用の再生装置に適するものを提供することができる。
【0054】
図19は本発明に係るオーディオデータのエンコード装置を示している。まず、A/D変換器1には同じオーディオソースに関する2チャネル又はマルチチャネルのオーディオ信号Aが選択的に入力して例えば図20に示すようなサンプリング周波数と量子化ビット(bit)数でA/D変換される。図20は
(1)2チャネルのみ、
(2)2+6チャネル、
(3)6チャネルのみ
の場合の伝送レートとDVDに対する収容時間を示している。当然に、サンプリング周波数と量子化ビット数を小さくすると収容時間は多くなり、逆にサンプリング周波数と量子化ビット数を大きくすると収容時間は少なくなるが、市場に対するオーディオディスクとしては収容時間は80分以上が望ましく、また、あまり長時間記録することは望ましくないので、2+6チャネルをfs=48kHz、量子化ビット数=20又は24ビットで記録することが望ましい。
【0055】
図19に戻り、この2チャネルとマルチチャネルのデジタルオーディオ信号Aが信号処理回路2及びメモリ3を経由してDVDフォーマット化部6に送られて図13に示すようなオーディオパック内に収容される。また、このオーディオソースに関するメニュー画面や静止画のビデオ(V)データがA/D変換器4によりA/D変換され、このデータがVエンコーダ5を介してDVDフォーマット化部6に送られて図13に示すようなビデオパック内に収容される。DVDフォーマット化部6はまた、図1〜図18に示すようなDVDフォーマットを生成する。続くコンテンツ暗号部7はこのDVDフォーマットを所定のCSS(コンテンツ・スクランブル・システム)でスクランブルし、続く変調回路8はコンテンツ暗号部7の出力信号をEFMplus変調する。
【0056】
変調回路8により変調されたデータは図示省略のDVDカッティングマシン(プレーヤ)に供給されてDVDオーディオディスクの原盤(マスタ)が製造される。次いでこの原盤の上に金属薄膜がスパッタ法とメッキ法により形成され、更に厚くメッキして原盤から剥離されてスタンパが製造される。次いでこのスタンパによりディスクの基になる基材が射出成形により形成されて貼り合わされ、DVDオーディオディスクが製造される。
【0057】
また、ディスクのリードイン部には16バイト(128ビット)ないし188バイト(1504ビット)の可変長の著作権管理情報(CMI)エリアが設けられる。そして、このCMIエリアには図21に示すように、例えば64ビットのディスク製造年月日データと、52ビットの工場コードと、8ビットのスクランブル用同期信号と、60ビットのISRCコード(International Standard Recording Code)と、8バイトのSID(ソースID)コードと、コピー管理データを示す4ビットの第1のCGMCAPS(Copy Generation Management Control Audio Protection System)又はSCMS(Serial Copy Management System)コード(以下、単にCGMCAPSともいう)と同じく4ビットの第2のCGMCAPSコードが記録される。このデータは数回例えば8回繰り返して記録され、また、ISRCコードとSIDコードがスクランブルされて記録される。
【0058】
第1、第2のCGMCAPSコードは、リードイン部のコントロールデータ領域をあらかじめRAM領域として製造しておいて記録される。そして、第1のCGMCAPSコードは、2チャネル方式のデータ素材のコピーガード管理コードであり、また、その下位4ビットには同じデータが記録される。また、第2のCGMCAPSコードは、マルチチャネル方式のデータ素材(コンテンツ)のコピーガード管理コードであり、また、その下位4ビットには同じデータが記録される。
【0059】
そして、図22に示すように、この4ビットのデータの内、2ビット又は3ビットが実際のコピー管理情報として使用され、残りの1ビット又は2ビットはブランクとして使用される。このデータは再生専用機(及び再生を行う録音再生機)に対しては再生許可/禁止情報として使用され、コピーを行う録音再生機に対してはコピー許可/禁止情報として使用される。なお、図22に示す情報の内容は、図24、図25に示すフローチャートを参照する際に詳細に説明する。
【0060】
また、ディスク中に複数の曲が別々にコピー管理用のために管理されている場合には、それぞれに対してCGMCAPSコードが設けられる。例えば、AMGやATSIなどの曲の管理領域にフラグ情報として繰り返さずに記録される。またさらに、曲を構成するトラックのそれぞれに対してCGMCAPSコードが設けられる。すなわち、図49に示すように、図13のユーザデータ(2034バイト)がパケットヘッダ、サブストリームID、オーディオフレーム情報、オーディオデータ情報(ADI)及びオーディオデータにより構成され、このトラックに対するサンプリング周波数などの記録条件を記録する管理領域(ADI)にフラグ情報として記録される。またさらに、TOC情報の中にCGMCAPSコードが設けられる。なお、第1、第2のCGMCAPSコードの各々は各1バイトエリアに繰り返して記録する代わりに、4ビット(実データは2又は3ビット)で構成して1バイトエリアに記録してもよい。また、ディスク内周のCMIエリアに設ける代わりに、CGMCAPSコードなどが記憶されたメモリとCPUを有するICをディスクに埋め込み、再生専用機や録音再生機がこのICに対して読み込み制御信号を送信してCGMCAPSコードなどを読み込むようにしてもよい。
【0061】
次に図23を参照して本発明に係るオーディオデータのデコード装置について説明する。上記DVDオーディオディスクから再生されたストリーム信号は、復調回路11によりEFMplus復調され、次いでスクランブル復号部12によりデ・スクランブルされ、次いでDVDデ・フォーマット化部13によりリードインエリアデータ、A−CONTパック、Aパック、Vパックなどに分離される。Aパックは信号処理回路14及びメモリ15に送られて2チャネル又はマルチチャネルのオーディオデータに復元され、この各チャネルのオーディオデータはD/A変換器16によりアナログ信号に変換されて出力される。また、VパックはVデコーダ17に送られてメニュー画面や静止画のV信号に変換されて出力される。さらに、リードインエリアデータとA−CONTパックは制御部18に送られ、制御部18は特にリードインエリアデータに基づいて図24、図25に示すような処理を実行する。
【0062】
図24は再生のみを行う場合の処理を示している。図24において、まず、リードインエリアの情報を読み込み(ステップS30)、次いでそのディスクがROMディスクか又はRAMディスクかを判断する(ステップS31、S32)。そして、ROMディスクの場合には、CGMCAPSコードを判断して
・(1,1)のときには再生を禁止し(ステップS33、S34)、
・(1,0)のときには再生を禁止し(ステップS35、S36)、
・(1,0,1)のときには再生を禁止し(ステップS37、S38)、
・(0,0)のときには再生を許可し(ステップS39、S40)、
・CGMCAPSコードを検出しないときには再生を許可する(ステップS41、S42)。
【0063】
また、RAMディスクの場合には、同じくCGMCAPSコードを判断して
・(1,1)のときには再生を禁止し(ステップS43、S44)、
・(1,0)のときには再生を禁止し(ステップS45、S46)、
・(1,0,1)のときには再生を許可し(ステップS47、S48)、
・(0,0)のときには再生を許可し(ステップS49、S50)、
・CGMCAPSコードを検出しないときには再生を許可する(ステップS51、S52)。
【0064】
次に、図22、図25を参照してコピー時の処理について説明する。まず、リードインエリアのROM/RAMタイプ情報とCGMCAPSコード情報を読み込み(ステップS60)、次いでCGMCAPSコードを判断して
・(1,1)のときにはコピーを禁止し(ステップS61、S62)、
・(1,0)のときにはコピー元ディスクのCGMCAPSコードを(1,0,1)に書き換えてコピーを許可し(ステップS63、S64)、
・(1,0,1)のときにはコピーを禁止し(ステップS65、S66)、
・(0,0)のときにはコピーを許可し(ステップS67、S68)、
・CGMCAPSコードを検出しないときにはコピーを許可する(ステップS69、S70)。したがって、CGMCAPSコードが(1,0)から(1,0,1)に書き換えられたディスクは図22、図24に示すように再生を禁止される。なお、CGMCAPSコードが(1,1)のディスクは、市販のプレーヤが再生することができず、特定のプレーヤのみが再生することができる特定用途向けである。
【0065】
ここで、上記実施形態では、同じオーディオソースに関する2チャネルとマルチチャネルのオーディオ信号をディスクに記録するようにしたので、2チャネル方式のアンプとスピーカを有するユーザは2チャネルを再生することができ、また、マルチチャネル方式のそれを有するユーザはマルチチャネルを再生することができる。しかしながら、将来、マルチチャネル方式が2チャネルより普及することを考慮すると、このときにはマルチチャネル方式のデータを2チャネルより多くディスクに記録する方が望まれると思われる。
【0066】
図26はこのような市場に対応するために、1枚のディスクに対して例えば複数の曲を記録する場合に、ある曲については2+6チャネルで記録し、他の曲については6チャネルのみで記録する方法を示している。したがって、このような記録方法によれば、マルチチャネル方式のアンプとスピーカを有するユーザが2チャネル方式のそれを有するユーザより多くなれば便利となる。また、6チャネルのみで記録する曲のサンプリング周波数と量子化ビット数については、2+6チャネルで記録する曲の6チャネル分のそれと異なるように、例えばより高品質で記録するようにしてもよい。
【0067】
図27はコピー管理データの変形例を示している。ディスクのエリアは、概略的に内周から外周に向かってPCA(ポスト・カッティング・エリア)部、リードイン部、データ部、リードアウト部により構成され、また、1セクタは2048バイトで構成されている。リードイン部のコントロールエリアは16セクタ「1」〜「16」で構成され、セクタ「1」には物理フォーマット情報が記録され、セクタ「2」にはディスク製造情報が記録され、セクタ「3」及び「4」には図28に詳しく示すような著作権情報が記録される。
【0068】
セクタ「3」及び「4」の1バイト目と2バイト目にはそれぞれ4ビットの第1、第2のCGMCAPSコードが記録される。そして、第1のCGMCAPSコードは2チャネル方式のデータ素材のコピーガード管理コードであり、第2のCGMCAPSコードは、マルチチャネル方式のデータ素材(コンテンツ)のコピーガード管理コードである。3バイト目から19バイト目は楽曲(プログラムソース)を示すISRC(国際標準レコーディングコード:International Standard Recording Code )コード及びディスク製作者を示すSID(ソースID)コードの領域である。3バイト目には8ビットのISRCコード及びSIDコードのスクランブル用同期信号が記録され、4バイト目から11バイト目には60ビットのISRCコードがスクランブルされて記録され、12〜19バイト目以降には8文字分のSIDコードがスクランブルされて記録される。
【0069】
以下同様に、16バイト分に1タイトル分のISRCコード及びSIDコードが記録され、合計99タイトル分が記録される。なお、ISRCコード及びSIDコードの両方をスクランブルする代わりにSIDコードのみをスクランブルするようにしてもよい。なお、図28においてSIDコードの一例として示す「IFPI・L231〜7」は、「IFPI」が国際レコード・ビデオ製作者連盟(International Federation of Phonogram Industries、現名はInternational Federation of Phonogram and Video Industries)を示し、「L231〜7」が日本ビクター株式会社のIFPIマスタリングコードを示している。また、ISRCコードは12文字で構成され、第1〜第5文字は6ビット、第6〜第12文字は4ビットで構成されている(6ビット分はブランク)。
【0070】
ここで、上記実施形態では、2+6チャネルをfs=48kHz、量子化ビット数=20又は24ビットで記録することが望ましいと述べたが、現状の2チャネルではCD規格のfs=44.1kHz、量子化ビット数=16ビットが普及している。そこで、このようなCD規格の再生装置を有するユーザの利便性を考慮すると、図29に示すように2チャネルについてはこの規格に合うようにfs=44.1kHz、88.2kHz、量子化ビット数=16、20、24ビットなどで記録するようにしてもよい。また、この場合にも同様に、1枚のディスクに対して、例えば複数の曲を記録する場合に、ある曲については2+6チャネルで記録し、他の曲については6チャネルのみで記録するようにしてもよい。また図30に示すように、6チャネルのみで記録する曲のサンプリング周波数と量子化ビット数については、2+6チャネルで記録する曲の6チャネル分のそれと異なるように、例えばより高品質で記録するようにしてもよい。
【0071】
次に、第2の実施形態について説明する。図31は第2の実施形態としてDVD−Van(ビデオ+オーディオナビゲーション)ディスクの基本フォーマットを示し、図32は図31の実施形態のACBU及びVCBUを示し、図33は第2の実施形態のACD(オーディオキャラクタディスプレイ)情報の他の例を示し、図34は第2の実施形態のASD(オーディオサーチデータ)を示し、図35は図31のCONTパックを詳しく示し、図36は図35のPCIデータを詳しく示し、図37は図36のPCI一般情報を詳しく示し、図38は図36の記録情報を詳しく示し、図39は図35のDSIを詳しく示し、図40は図39のDSI一般情報を詳しく示し、図41は図39のシームレス再生情報を詳しく示し、図42は図39のシームレス用アングル情報によるシームレス・アングル変更の概念を示し、図43は図39のVOBUサーチ情報の一例を示し、図44は図39のVOBUサーチ情報を詳しく示し、図45は図39の同期情報を詳しく示している。
また、図46は第1、第2の実施形態のディスクのリードインエリアの構成を示し、図47は図46のコントロールデータブロックを詳しく示し、図48は図47のフィジカル・フォーマット・インフォメーションを詳しく示している。
【0072】
ここで、上記第1の実施形態では、オーディオプレーヤがAパックの再生を制御するために、図14に詳しく示すA−CONTパック内のASD(オーディオサーチデータ)を用いており、このときシームレス再生する時には現在番号及び現在時刻に基づいており、また、ジャンプ再生する時にはタイトルセットサーチ、タイトルサーチ、トラックサーチ、インデックスサーチ、ハイライトサーチのサーチ情報に基づいている。
【0073】
これに対し、この第2の実施形態のDVD−Vanディスクでは、各種のDVDプレーヤを用いて再生可能なように、その基本フォーマットは図31(a)に示すように、大別して先頭のビデオマネージャ(VMG)及びオーディオマネージャ(AMG)と、それに続く複数のビデオタイトルセット(VTS)及びオーディオタイトルセット(ATS)の各エリアにより構成されている。すなわち、このDVD−Vanディスクの基本フォーマットは、図1(a)に示すDVDビデオディスクと図1(b)、図31(b)に示すDVDオーディオディスクの両方を含んでいる。なお、これらAMGとATSは図1(b)、図31(b)に示したAMGとATSと同じ機能を持つので説明を省略する。
【0074】
そして、VTS及びATSの各々はそれぞれ、先頭のVTSインフォメーション(VTSI)及びATSインフォメーション(ATSI)と、それに続く1以上のビデオコンテンツブロックセット(VCBS)及びオーディオコンテンツブロックセット(ACBS)と、最後のVTSI及びATSIにより構成されている。また、VCBSの各々は複数のVCBにより構成され、他方、ACBSの各々は複数のACBにより構成されている。VCBの各々はビデオの1タイトル分であり、ACBの各々はこれに対応してオーディオの1タイトル分である。VCBの各々(1タイトル)は複数のチャプタにより構成され、他方、ACBの各々(1タイトル)はこれに対応して複数のトラックにより構成されている。チャプタはパートオブタイトル(PTT)を含み、トラックはパートオブタイトル(PTT)を含む。
【0075】
チャプタの各々は複数のセルにより構成され、他方、トラックの各々はこれに対応して複数のインデックスにより構成されている。セルの各々は複数のVCBユニット(VCBU)により構成され、他方、インデックスの各々はこれに対応して複数のACBユニット(ACBU)により構成されている。そして、VCBユニット(VCBU)は図32に詳しく示すようにA−CONTパックは含まず、先頭のCONTパックと、比較的多い数のAパックと比較的少ない数のVパックにより構成されている。また、このACBUはVパックの後の最初のAパックを先頭としてVCBUと略同じ間隔の0.4〜1.0秒分の任意の数のパックにより構成されている。ここで、VCBUはDVDビデオ規格ではVOBUとも呼ばれている。
【0076】
そして、ACBUがA−CONTパックを含まないので、第1の実施形態においてA−CONTパック内に含まれていたACDパケットとASDパケットは図31(a)に示すVMG(ビデオマネージャ)とVTS(ビデオタイトルセット)の一方又は両方に配置される。
【0077】
ここで、第1の実施形態のACDパケットは、ACBユニット毎(0.5〜1.0秒毎)に1つ設けられるA−CONTパック内に設けられているので多数の画面分のデータを収容することができるが、第2の実施形態ではVMG(ビデオマネージャ)とAMG(オーディオマネージャ)やVTS(ビデオタイトルセット)とATS(オーディオタイトルセット)のように、DVDビデオディスクとDVDオーディオディスクの両方のデータを収容するので、収容データ量が制限され、したがって、曲毎や楽章毎のタイトル名などのみの比較的少ないデータ量で収容される。また、以下に詳しく示すオーディオ再生制御情報も1種類程度で収容してもよい。
【0078】
また、このACDパケット内のACDエリアは第1の実施形態(図15)のように第1の言語の文字「1」と第2の言語の文字「2」のデータを有するように構成してもよいが、代わりに図33に示すように文字「2」に関するデータを省略して、48バイトのジェネラル情報エリアと、例えば図16に示すような楽曲名などのいわゆる「オーディオ・ナビゲーション」を表示するための1つの言語の文字「1」に関する294バイトのエリアと294バイトのオーディオ再生制御情報エリアにより構成してもよい。文字「1」のエリアは、第1の実施形態と同様に93バイトのネームスペースエリアと、各々93バイトの2つのフリースペースエリアと、15バイトのデータポインタエリアにより構成されている。
【0079】
オーディオ再生制御情報エリアの内容は任意であり、例えば各々25バイトの10種類分のオーディオ再生制御情報エリア(250バイト)と44バイトの保留エリアにより構成される。1種類分のオーディオ再生制御情報エリアには20バイトのグラフィックイコライザ情報と、3バイトのレベルバランス情報と2バイトの残響付加情報が配置され、この情報はユーザにより選択されてオーディオ信号の音質が制御される。これらのオーディオ再生制御情報は、Aパックに配置されている楽曲をユーザが再生する場合に、例えばその楽曲のジャンル(クラシック、ジャズ、ロック、BGM)に応じて、また、同一ジャンルであってもその楽曲の演奏状態、録音状態、雰囲気などに応じて再生時の音質が最も良くなるようにいわゆるプロのミキサが推奨するデータである。保留エリアにはオーディオ信号のチャネル数が6の場合、チャネル数を2にミクスダウンしてステレオ再生できるようなミキシング係数を収納させる。
【0080】
また、Aパックをシームレス再生する時にはCONTパックを用いるので、ASDは図34に示すように、第1の実施形態(図17)における8バイトの現在の番号情報と16バイトの現在時刻情報が省略され、その分が保留エリア(76バイト)として用いられている。このため、第1の実施形態のようにきめ細かい表示や再生制御はできないが、第1の実施形態のようにDVDオーディオディスク専用プレーヤのみが再生でき、DVDビデオディスク専用プレーヤが再生できないディスクが普及するまでの過渡期において有効なオーディオディスクを実現することができる。
【0081】
次に図35を参照してCONTパックの構成について詳しく説明する。このCONTパックはDVDビデオ規格ではナビゲーション・パック、通称ナビ(NV)パックと呼ばれており、14バイトのパックヘッダと、24バイトのシステムヘッダと、PCI(プレゼンテーション・コントロール・インフォメーション)パケットとDSI(データ・サーチ・インフォメーション)パケットにより構成されている。PCIは再生制御情報と呼ばれており、このPCIパケットは6バイトのパケットヘッダと、1バイトのサブストリームIDと図36に詳しく示す979バイトのPCIデータにより構成され(合計986バイト)、また、DSIパケットは6バイトのパケットヘッダと、1バイトのサブストリームIDと図39に詳しく示す1017バイトのDSIにより構成されている(合計1024バイト)。
【0082】
PCIデータはVOBUの再生を制御するナビゲーション・データであり、図36に詳しく示すように60バイトのPCI一般情報(PCI GI)と、36バイトの非シームレス用アングル情報(NSML AGLI)と、694バイトのハイライト情報(HLI)と189バイトの記録情報(RECI)の4つの情報により構成されている。
【0083】
PCI一般情報は図37に詳しく示すように、
・4バイトの「NVパック(=CONTパック)のLBN」(NV PCK LBN)と、
・2バイトの「VOBUのカテゴリ」(VOBU CAT)と、
・2バイトの保留エリアと、
・4バイトの「VOBUのユーザ操作制御情報」(VOBU UOP CTL)と、
・4バイトの「VOBUの開始PTM」(VOBU S PTM)と、
・4バイトの「VOBUの終了PTM」(VOBU E PTM)と、
・4バイトの「VOBU内シーケンス・エンドの終了PTM」(VOBU SES PTM)と、
・4バイトの「セル内経過時間」(C ELTM)と、
・32バイトの保留エリアにより構成されている。
【0084】
「NVパックのLBN」(NV PCK LBN)には、本PCIが含まれるNVパックのアドレスが本PCIが含まれるVOBSの先頭LBからRLBNで記述されており、また、「VOBUのカテゴリ」(VOBU CAT)には、本VOBUのアナログ・プロテクション・システム(APS)の状態が記述されている。
【0085】
図36に示した非シームレス用アングル情報(NSML AGLI)は、アングル変更時の行き先アドレスに関する情報であり、また、アングル・セル変更が非シームレスに変更されるとき、すなわちシームレス・アングル変更フラグが「非シームレス」に設定されている場合のみ、有効である。図36に示したハイライト情報(HLI)はサブピクチャ表示領域内の一矩形領域をハイライトする情報であり、この情報に基づいて特定矩形領域内のビデオとサブピクチャの色の混合比(コントラスト)を変更することができる。また、各サブピクチャ・ストリームのサブピクチャ・ユニット(SPU)の再生期間は、ハイライト情報(HLI)の有効期間と同一である。
【0086】
図36に示した記録情報(RECI)は図38に詳しく示すように、
・10バイトの「ビデオストリーム内のビデオデータのISRC」(ISRC V)と、
・10バイトの「デコーディング・オーディオ・ストリーム#0内オーディオデータのISRC」(ISRC A0)と、
・10バイトの「デコーディング・オーディオ・ストリーム#1内オーディオデータのISRC」(ISRC A1)と、
・10バイトの「デコーディング・オーディオ・ストリーム#2内オーディオデータのISRC」(ISRC A2)と、
・10バイトの「デコーディング・オーディオ・ストリーム#3内オーディオデータのISRC」(ISRC A3)と、
・10バイトの「デコーディング・オーディオ・ストリーム#4内オーディオデータのISRC」(ISRC A4)と、
・10バイトの「デコーディング・オーディオ・ストリーム#5内オーディオデータのISRC」(ISRC A5)と、
・10バイトの「デコーディング・オーディオ・ストリーム#6内オーディオデータのISRC」(ISRC A6)と、
・10バイトの「デコーディング・オーディオ・ストリーム#7内オーディオデータのISRC」(ISRC A7)と、
・10バイトの「デコーディング・SPストリーム#0、#8、#16又は#24内SPデータのISRC」(ISRC SP0)と、
・10バイトの「デコーディング・SPストリーム#1、#9、#17又は#25内SPデータのISRC」(ISRC SP1)と、
・10バイトの「デコーディング・SPストリーム#2、#10、#18又は#26内SPデータのISRC」(ISRC SP2)と、
・10バイトの「デコーディング・SPストリーム#3、#11、#19又は#27内SPデータのISRC」(ISRC SP3)と、
・10バイトの「デコーディング・SPストリーム#4、#12、#20又は#28内SPデータのISRC」(ISRC SP4)と、
・10バイトの「デコーディング・SPストリーム#5、#13、#21又は#29内SPデータのISRC」(ISRC SP5)と、
・10バイトの「デコーディング・SPストリーム#6、#14、#22又は#30内SPデータのISRC」(ISRC SP6)と、
・10バイトの「デコーディング・SPストリーム#7、#15、#23又は#31内SPデータのISRC」(ISRC SP7)と、
・1バイトの「ISRC用に選択されたSPストリームのグループ」(ISRCSP SEL)と、
・18バイトの保留エリアにより構成されている。
【0087】
図35に示したデータサーチ情報(DSI)はデータをサーチして、VOBUのシームレス再生を実行するためのナビゲーションデータであり、図39に詳しく示すように
・32バイトのDSI一般情報(DSI GI)と、
・148バイトのシームレス再生情報(SML PBI)と、
・54バイトのシームレス用アングル情報(SML AGLI)と、
・168バイトのVOBUサーチ情報(VOBU SRI)と、
・144バイトの同期情報(SYNCI)と、
・471バイトの保留エリアにより構成されている。
【0088】
DSI一般情報(DSI GI)は図40に詳しく示すように
・4バイトの「NV PCKのSCRベース」(NV PCK SCR)と、
・4バイトの「NV PCKのLBN」(NV PCK LBN)と、
・4バイトの「VOBUの終了アドレス」(VOBU EA)と、
・4バイトの「VOBUの第1リファレンス・ピクチャの終了アドレス」(VOBU 1STREF EA)と、
・4バイトの「VOBUの第2リファレンス・ピクチャの終了アドレス」(VOBU 2NDREF EA)と、
・4バイトの「VOBUの第3リファレンス・ピクチャの終了アドレス」(VOBU 3RDREF EA)と、
・2バイトの「VOBUのVOB ID番号」(VOBU VOB IDN)と、
・1バイトの保留エリアと、
・1バイトの「VOBUのセルID番号」(VOBU C IDN)と、
・4バイトの「セル経過時間」(C ELTM)により構成されている。
【0089】
図39に示したシームレス再生情報(SML PBI)は、図41に詳しく示すように
・2バイトの「シームレスVOBUのカテゴリ」(VOBU SML CAT)と、
・4バイトの「インタリーブド・ユニットの終了アドレス」(ILVU EA)と、
・4バイトの「次のインタリーブド・ユニットの開始アドレス」(NXT ILVU SA)と、
・2バイトの「次のインタリーブド・ユニットのサイズ」(NXT ILVU SZ)と、
・4バイトの「VOB内のビデオの開始PTM」(VOB V S PTM)と、
・4バイトの「VOB内のビデオの終了PTM」(VOB V E PTM)と、
・8バイト×8の「VOB内のオーディオの終了PTM」(VOB A STPPTM)と、
・8バイト×8の「VOB内のオーディオのギャップ長」(VOB A GAPLEN)により構成されている。
【0090】
図39に示したシームレス用アングル情報は、図42に示すようにアングル変更時の行き先アドレスに関する情報であり、アングル変更がシームレスで実行される場合、すなわちシームレス・アングル変更フラグが「シームレス」に設定されている場合にのみ、有効である。
【0091】
図39に示したVOBUサーチ情報(VOBU SRI)には、図43に示すようにこのセルで、本DSIが含まれるVOBUの再生開始時刻の前後0.5×n秒に再生されるVOBUの先頭アドレスが記述され、また、1つのセル内でのみ有効である。この情報は図44に詳しく示すように、
・4バイトの「ビデオデータを持つ次のVOBU先頭アドレス」(FWDI Video)と、
・4バイトの「+240VOBU先頭アドレスとビデオ存在フラグ」(FWDI240)と、
・4バイトの「+120VOBU先頭アドレスとビデオ存在フラグ」(FWDI120)と、
・4バイトの「+60VOBU先頭アドレスとビデオ存在フラグ」(FWDI 60)と、
・4バイトの「+20VOBU先頭アドレスとビデオ存在フラグ」(FWDI 20)と、
・4バイトの「+15VOBU先頭アドレスとビデオ存在フラグ」(FWDI 15)と、
・4バイトの「+14VOBU先頭アドレスとビデオ存在フラグ」(FWDI 14)と、
・4バイトの「+13VOBU先頭アドレスとビデオ存在フラグ」(FWDI 13)と、
・4バイトの「+12VOBU先頭アドレスとビデオ存在フラグ」(FWDI 12)と、
・4バイトの「+11VOBU先頭アドレスとビデオ存在フラグ」(FWDI 11)と、
・4バイトの「+10VOBU先頭アドレスとビデオ存在フラグ」(FWDI 10)と、
・4バイトの「+9VOBU先頭アドレスとビデオ存在フラグ」(FWDI 9)と、
・4バイトの「+8VOBU先頭アドレスとビデオ存在フラグ」(FWDI 8)と、
・4バイトの「+7VOBU先頭アドレスとビデオ存在フラグ」(FWDI 7)と、
・4バイトの「+6VOBU先頭アドレスとビデオ存在フラグ」(FWDI 6)と、
・4バイトの「+5VOBU先頭アドレスとビデオ存在フラグ」(FWDI 5)と、
・4バイトの「+4VOBU先頭アドレスとビデオ存在フラグ」(FWDI 4)と、
・4バイトの「+3VOBU先頭アドレスとビデオ存在フラグ」(FWDI 3)と、
・4バイトの「+2VOBU先頭アドレスとビデオ存在フラグ」(FWDI 2)と、
・4バイトの「+1VOBU先頭アドレスとビデオ存在フラグ」(FWDI 1)と、
・4バイトの「次のVOBU先頭アドレスとビデオ存在フラグ」(FWDI Next)と、
・4バイトの「前のVOBU先頭アドレスとビデオ存在フラグ」(BWDI Prev)と、
・4バイトの「−1VOBU先頭アドレスとビデオ存在フラグ」(BWDI 1)と、
・4バイトの「−2VOBU先頭アドレスとビデオ存在フラグ」(BWDI 2)と、
・4バイトの「−3VOBU先頭アドレスとビデオ存在フラグ」(BWDI 3)と、
・4バイトの「−4VOBU先頭アドレスとビデオ存在フラグ」(BWDI 4)と、
・4バイトの「−5VOBU先頭アドレスとビデオ存在フラグ」(BWDI 5)と、
・4バイトの「−6VOBU先頭アドレスとビデオ存在フラグ」(BWDI 6)と、
・4バイトの「−7VOBU先頭アドレスとビデオ存在フラグ」(BWDI 7)と、
・4バイトの「−8VOBU先頭アドレスとビデオ存在フラグ」(BWDI 8)と、
・4バイトの「−9VOBU先頭アドレスとビデオ存在フラグ」(BWDI 9)と、
・4バイトの「−10VOBU先頭アドレスとビデオ存在フラグ」(BWDI 10)と、
・4バイトの「−11VOBU先頭アドレスとビデオ存在フラグ」(BWDI 11)と、
・4バイトの「−12VOBU先頭アドレスとビデオ存在フラグ」(BWDI 12)と、
・4バイトの「−13VOBU先頭アドレスとビデオ存在フラグ」(BWDI 13)と、
・4バイトの「−14VOBU先頭アドレスとビデオ存在フラグ」(BWDI 14)と、
・4バイトの「−15VOBU先頭アドレスとビデオ存在フラグ」(BWDI 15)と、
・4バイトの「−20VOBU先頭アドレスとビデオ存在フラグ」(BWDI 20)と、
・4バイトの「−60VOBU先頭アドレスとビデオ存在フラグ」(BWDI 60)と、
・4バイトの「−120VOBU先頭アドレスとビデオ存在フラグ」(BWDI120)と、
・4バイトの「−240VOBU先頭アドレスとビデオ存在フラグ」(BWDI240)と、
・4バイトの「ビデオデータを持つ前のVOBU先頭アドレス」(BWDI Video)により構成されている。
【0092】
図39に示した同期情報(SYNCI)は、本DSIが含まれるVOBUのビデオデータと同期して再生されるオーディオデータとサブピクチャデータのアドレス情報であり、図45に詳しく示すように
・2バイト×8の「対象オーディオパック(A PCK)のアドレス」(A SYNCA 0 to 7)と、
・4バイト×32の「対象サブピクチャパック(SP PCK)用VOBU先頭アドレス」(SP SYNCA 0 to 31)により構成されている。
【0093】
次に第1、第2の実施形態のディスクの識別子について説明する。DVDの記録エリアは、図46に示すように概略的にリードインエリアとデータエリアにより構成されている。また、DVDのリードインエリアは
・リードインスタートからセクタ番号「02F000h」の前までのオール00hのブロックと、
・セクタ番号「02F000h」からセクタ番号「02F020h」の前までの2ブロック分のリファレンスコードブロックと、
・セクタ番号「02F020h」からセクタ番号「02F200h」の前までの30ブロック分のオール00hのブロックと、
・セクタ番号「02F200h」からセクタ番号「02FE00h」の前までの192ブロック分のコントロールデータブロックと、
・セクタ番号「02FE00h」からセクタ番号「030000h」の前までの32ブロック分のオール00hのブロックにより構成されている。
【0094】
また、データエリアの先頭(セクタ番号「030000h」)からはISO9660とマイクロUDF(ユニバーサル・ディスク・フォーマット)のデータが記録され、次にオーディオタイトルセット(TS)、ビデオTS、コンピュータTSなどが記録される。
【0095】
上記のリードインエリアにおけるコントロールデータブロックは図47に示すように、フィジカル・フォーマット・インフォメーションのセクタと、ディスク製造インフォメーションのセクタと、著作権インフォメーションのセクタにより構成されている。また、フィジカル・フォーマット・インフォメーションのセクタは図48に示すように、ブックタイプ及びパートバージョンのエリアと、ディスクサイズ及びミニマムリードアウトレートのエリアと、ディスク構造のエリアと、記録密度のエリアと、データエリアアロケーションのエリアなどにより構成されている。
【0096】
そして、ブックタイプ及びパートバージョンのエリアはディスク識別子として割り当てられ、その上位ビットにより、
・「DVD−ROMディスク」か、
・「DVD−RAMディスク」か又は
・「DVD−ライトワンス(Write Once)ディスク」かが示され、さらに「DVD−ROMディスク」の場合には、下位ビットにより
・「コンピュータプログラム・ディスク」か、
・「純粋ビデオ・ディスク」か、
・「ビデオ+オーディオ・ナビゲーション・ディスク:Vanディスク」か又は・「オーディオ・ディスク」か
を示す識別子が記述される。
【0097】
したがって、このブックタイプ及びパートバージョンにより、第1の実施形態に係るディスクには「DVD−ROM−オーディオディスク」を示すディスク識別子が記述され、また、第2の実施形態に係るディスクには「DVD−ROM−Vanディスク」を示すディスク識別子が記述される。また、「DVD−ROM−純粋ビデオ・ディスク」には曲や楽章の頭出し情報などのTOC情報が設けられていないが、第1の実施形態の「DVD−ROM−オーディオディスク」と第2の実施形態の「DVD−ROM−Vanディスク」のリードインエリアにはこのTOC情報が設けられる。このTOC情報はSAPPともいわれる。
【0098】
次に、上記のようにフォーマット化されたデジタルオーディオ信号を通信回線(ネットワーク)を介して伝送する実施例を説明する。図50は図19に示す構成に対して、記録部19と通信I/F(インタフェース)20が追加されたエンコード装置を示している。図50において、DVDフォーマット化部6によりフォーマット化されてコンテンツ暗号部7により暗号化されたデータは、変調回路8により記録媒体に応じた変調方式で変調されてこの変調データに基づいて記録媒体が製造されたり、記録部19にいったん記録されたり、通信I/F20及び通信回線を介して伝送される。また、通信回線及び通信I/F20を介して受信したデータが記録部19にいったん記録されるなどして変調回路8に供給される。
【0099】
上記のようにフォーマット化されたデジタルオーディオ信号を通信回線(ネットワーク)を介して送信する場合には、図51に示すように通信I/F20内の不図示の送信バッファに蓄えられた送信データを所定長に分割してパケット化し(ステップS71)、次いでパケットの先頭に宛先アドレスを含むヘッダを付与し(ステップS72)、次いでこれをネットワーク上に出力する(ステップS73)。
【0100】
上記のようにフォーマット化されたデジタルオーディオ信号を通信回線(ネットワーク)を介して受信する場合には、図52に示すようにネットワークから受信したパケットからヘッダを除去し(ステップS81)、次いで受信データを復元し(ステップS82)、次いでこれを記録部19内のメモリに転送する(ステップS83)。この受信データは図23に示すデコード装置によりデコードすることができる。
【0101】
ここで、オーディオ信号の量子化方法は、PCM方式の代わりに1ビットストリームデータでもよい。なお、1ビットストリームデータは1ビットのΔΣ変調信号で表す信号であり、DSDデータとも言われている。図53(A)、(B)はPCM方式の量子化及び逆量子化方法例を示し、図53(C)は16ビットのΔΣ変調による量子化及び逆量子化方法例を示し、図53(D)は1ビットのΔΣ変調変調による量子化及び逆量子化方法例を示している。
【0102】
なお、1ビットストリームデータはPCM方式より高能率圧縮が可能である。例えば図29にはPCM方式の量子化例として
2チャネル:88.2kHz/24ビット(4.234Mbps)
6チャネル:44.1kHz/16ビット(4.234Mbps)
が記載されている。そこで、この代わりに1ビットストリーム方式で量子化すると、
2チャネル:88.2×24kHz/1ビット(4.234Mbps)
6チャネル:44.1×16kHz/1ビット(4.234Mbps)
になるが、例えば1/2に圧縮すれば、
6チャネル:88.2×16kHz×1/2/1ビット(4.234Mbps)
で量子化することができる。したがって、この場合には、データ量が多いマルチチャネル信号のサンプリング周波数を2チャネル信号と同じとすることができるので、2チャネルと6チャネルの周波数帯域を同じにして記録することができる。
【0103】
【発明の効果】
以上説明したように第1の発明によれば、2チャネル方式や狭帯域方式のオーディオデータとマルチチャネル方式や広帯域方式の高品質オーディオデータの両方を伝送する場合に、コピー管理データをディスクに記録して、少なくともマルチチャネルのオーディオソースのコピーを管理するようにしたので、そのコピープロテクトの問題点を解決することができる。
また第2の発明によれば、2チャネル方式や狭帯域方式のオーディオデータとマルチチャネル方式や広帯域方式の高品質オーディオデータの両方を伝送する場合に、コピー管理データをディスクに記録して、少なくとも比較的高いサンプリング周波数でA/D変換されて記録されたオーディオソースのコピーを管理するようにしたので、そのコピープロテクトの問題点を解決することができる。
【図面の簡単な説明】
【図1】DVD−ビデオのフォーマットと、本発明に係るDVD−オーディオのフォーマットの一実施形態を示す説明図である。
【図2】図1のオーディオマネージャ(AMG)のフォーマットを詳しく示す説明図である。
【図3】図1のオーディオタイトルセット(ATS)のフォーマットを詳しく示す説明図である。
【図4】図2のオーディオマネージャインフォメーション(AMGI)のフォーマットを詳しく示す説明図である。
【図5】図4のオーディオタイトルセット・アトリビュートテーブル(ATS−ATRT)のフォーマットを詳しく示す説明図である。
【図6】図5のオーディオタイトルセット・アトリビュートデータ(ATS−ATR)のフォーマットを詳しく示す説明図である。
【図7】図3のオーディオタイトルセットインフォメーション(ATSI)のフォーマットを詳しく示す説明図である。
【図8】図7のオーディオタイトルセットインフォメーション・マネージメントテーブル(ATSI−MAT)のフォーマットを詳しく示す説明図である。
【図9】図8のオーディオタイトルセットメニュー・オーディオストリーム・アトリビュートデータ(ATSM−AST−ATR)を詳しく示す説明図である。
【図10】図8のオーディオタイトルセット・オーディオストリーム・アトリビュートテーブル(ATS−AST−ATRT)のフォーマットを詳しく示す説明図である。
【図11】図10の各オーディオストリームのアトリビュートデータ(ATS−AST−ATR)を詳しく示す説明図である。
【図12】図1のオーディオコンテンツブロックユニット(ACBU)を示す説明図である。
【図13】図12のオーディオパックとビデオパックのフォーマットを詳しく示す説明図である。
【図14】図12のオーディオコントロール(A−CONT)パックのフォーマットを詳しく示す説明図である。
【図15】図14のオーディオキャラクタディスプレイ(ACD)エリアのフォーマットを詳しく示す説明図である。
【図16】図15のネームスペース情報により表示される例を示す説明図である。
【図17】図14のオーディオサーチデータ(ASD)エリアのフォーマットを詳しく示す説明図である。
【図18】図1のオーディオコンテンツブロックユニットの変形例を示す説明図である。
【図19】本発明に係るオーディオデータのエンコード装置を示すブロック図である。
【図20】本発明に係るオーディオディスクに記録される2チャネルとマルチチャネルのサンプリング周波数と量子化ビット数を示す説明図である。
【図21】本発明に係るオーディオディスクに記録されるコピー管理データを示す説明図である。
【図22】図21のCGMCAPSコードを詳しく示す説明図である。
【図23】オーディオデータのデコード装置を示すブロック図である。
【図24】図23の再生装置の再生処理を示すフローチャートである。
【図25】本発明に係るコピー処理を示すフローチャートである。
【図26】第1の実施形態の変形例における2チャネルとマルチチャネルのサンプリング周波数と量子化ビット数を示す説明図である。
【図27】第1の実施形態の変形例におけるリードインエリアを示す説明図である。
【図28】図27の著作権情報エリアを詳しく示す説明図である。
【図29】第1の実施形態の他の変形例における2チャネルとマルチチャネルのサンプリング周波数と量子化ビット数を示す説明図である。
【図30】第1の実施形態の更に他の変形例における2チャネルとマルチチャネルのサンプリング周波数と量子化ビット数を示す説明図である。
【図31】第2の実施形態としてDVD−Vanディスクの基本フォーマットを示す説明図である。
【図32】図31の実施形態のACBU及びVCBUを示す説明図である。
【図33】第2の実施形態のACD(オーディオキャラクタディスプレイ)情報の他の例を示す説明図である。
【図34】第2の実施形態のASD(オーディオサーチデータ)を示す説明図である。
【図35】図31のCONTパックを詳しく示す説明図である。
【図36】図34のPCIデータを詳しく示す説明図である。
【図37】図36のPCI一般情報を詳しく示す説明図である。
【図38】図36の記録情報を詳しく示す説明図である。
【図39】図35のDSIを詳しく示す説明図である。
【図40】図39のDSI一般情報を詳しく示す説明図である。
【図41】図39のシームレス再生情報を詳しく示す説明図である。
【図42】図39のシームレス用アングル情報によるシームレス・アングル変更の概念を示す説明図である。
【図43】図39のVOBUサーチ情報の一例を示す説明図である。
【図44】図39のVOBUサーチ情報を詳しく示す説明図である。
【図45】図39の同期情報を詳しく示す説明図である。
【図46】第1、第2の実施形態のリードインエリアの構成を示す説明図である。
【図47】図46のコントロールデータブロックを詳しく示す説明図である。
【図48】図47のフィジカル・フォーマット・インフォメーションを詳しく示す説明図である。
【図49】本発明に係るオーディオディスクにおけるオーディオパックのフォーマットを示す説明図である。
【図50】オーディオ信号を通信回線を介して伝送する実施例におけるエンコード装置を示すブロック図である。
【図51】オーディオ信号を通信回線を介して送信する処理を示すフローチャートである。
【図52】オーディオ信号を通信回線を介して受信する処理を示すフローチャートである。
【図53】PCM方式と1ビットストリーム方式の量子化方法及び逆量子化方法を説明するためのブロック図である。
【符号の説明】
1、4 A/D変換器
2、14 信号処理回路
3、15 メモリ
5 Vエンコーダ
6 DVDフォーマット化部(フォーマット化手段)
7 コンテンツ暗号部
8 変調回路
11 復調回路
12 スクランブル復号部
13 DVDデ・フォーマット化部
16 D/A変換器
17 Vデコーダ
18 制御部(コピー管理手段)
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an audio data encoding method and decoding method for recording audio data such as a music source, and more particularly to a data structure of a disk represented by a DVD audio disk.
[0002]
[Prior art]
As an optical disk for audio, more than ten years have passed since CD (Compact Disc) was put on the market, and as an audio information recording medium, it has already surpassed the conventional cassette tape and has been remarkably widespread. In addition, the physical and logical format of CDs, which are digital discs, has been established as an EFM modulation and recording system for 8-bit fixed data length symbols, data formats such as subcodes, audio data, CRC, and various application functions. CD players to which are added are being developed.
[0003]
By the way, an audio signal in a CD has a sampling frequency of 44.1 kHz, a quantization bit number of 16 bits, two left and right channels, a reproduction frequency bandwidth of about 22 kHz, and an S / N ratio of about 96 dB. In a CD-ROM used in the field of electronic publishing, the above characteristics are inferior to CD because audio data is compressed by ADPCM.
[0004]
On the other hand, the idea that the number of CD channels (the sound field of the left and right two-channel system) has been unsatisfactory for several years has become established, and in order to solve this problem, excellent sound by multi-channels such as 6 channels, for example. Field characteristics are required. In addition, regarding the reproduction characteristics of CDs, the idea that the above-mentioned reproduction frequency bandwidth and S / N ratio are both unsatisfactory is firmly established, and there is a demand for the standardization of next-generation audio discs with superior above characteristics. ing. For example, high characteristics such as a reproduction frequency bandwidth of 100 kHz and an S / N ratio of about 144 to 120 dB are required. Therefore, the multi-channel and broadband systems have superior advantages over the CD system, and can sufficiently compensate for the unsatisfactory characteristics of the CD. There is expected.
[0005]
However, since conventional audio transmission systems, particularly amplifiers (audio amplifiers) and speakers of playback apparatuses employ a two-channel method and a narrow-band method, they are not immediately switched to multi-channel or wide-band audio devices. .
[0006]
On the other hand, the DVD standard has been established with the full-scale arrival of the multimedia era, and a playback system that conforms to the standard has already been sold, and AV (Audio-Visual) software for DVD is also available. It is not difficult to imagine that DVD is very widespread as a high-density recording medium. Therefore, by making the narrow band and two-channel system related to the audio transmission system compatible with the DVD audio standard, the DVD system having a large number of channels, an excellent reproduction frequency bandwidth and an S / N ratio is also spread. Can be realized. In particular, if the compatibility with the audio format in the DVD standard is provided, it is convenient because the correlation with the conventional transmission system can be ensured.
[0007]
[Problems to be solved by the invention]
However, in recent years, there has been a growing interest in respecting the copyright of digital audio. Therefore, when transmitting both 2-channel or narrowband audio data and multi-channel or broadband audio data. In particular, the problem of copy protection of high-quality audio data occurs.
[0008]
Therefore, the present invention is an audio data that can solve the problem of copy protection when transmitting both 2-channel or narrowband audio data and multi-channel or wideband high-quality audio data. An object is to provide an encoding method and a decoding method.
[0009]
[Means for Solving the Problems]
  The present invention comprises means described in 1) and 2) below.
  That is,
  1)An analog audio signal is recorded as a digital audio signal that is sampled at a different sampling frequency for each of the front channel and the rear channel of the multi-channel and quantized with a different number of quantization bits for each of the front channel and the rear channel. An audio area that is quantized with the same or different sampling frequency and number of quantization bits as the multi-channel, and recorded as a stereo 2-channel digital audio signal;
A quantization control information area in which the sampling frequency and the number of quantization bits for each of the front channel and the rear channel of the digital audio signal recorded in the audio area are recorded;
A copy management data area for recording copy management data for managing a copy of a digital audio signal of two channels for multi-channel and stereo recorded in the audio area;
A title search information area in which search information for searching for a title of the digital audio signal is recorded;
Of the digital audio signalTitleAudio manager menu area (AMGM) where menu management information is recorded,
Audio data having a step of formatting according to a predetermined formatEncoding method.
  2) Above 1)The audio signal recorded by the audio data encoding method described above is decoded, and the multi-channel and stereo 2-channel digital audio signals recorded in the audio area are managed based on the copy management data. Audio data having steps,Decoding method.
[0010]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is an explanatory diagram showing an embodiment of a DVD-video format and a DVD-audio format according to the present invention, FIG. 2 is an explanatory diagram showing in detail the format of the audio manager (AMG) of FIG. 1, and FIG. 1 is an explanatory diagram showing in detail the format of the audio title set (ATS) in FIG. 1, FIG. 4 is an explanatory diagram showing in detail the format of the audio manager information (AMGI) in FIG. 2, and FIG. 5 is an audio title set attribute table (FIG. 6 is an explanatory diagram showing in detail the format of ATS-ATRT, FIG. 6 is an explanatory diagram showing in detail the format of audio title set attribute data (ATS-ATR) in FIG. 5, and FIG. 7 is an audio title set information (ATSI) in FIG. Format 8 is an explanatory diagram showing in detail the format of the audio title set information management table (ATSI-MAT) in FIG. 7, and FIG. 9 is an audio title set menu, audio stream attribute data (ATSM-AST) in FIG. FIG. 10 is an explanatory diagram showing in detail the format of the audio title set / audio stream attribute table (ATS-AST-ATRT) in FIG. 8, and FIG. 11 is an attribute of each audio stream in FIG. It is explanatory drawing which shows data (ATS-AST-ATR) in detail.
[0011]
12 is an explanatory diagram showing the audio content block unit (ACBU) in FIG. 1, FIG. 13 is an explanatory diagram showing in detail the format of the audio pack and video pack in FIG. 12, and FIG. 14 is an audio control (A-) in FIG. FIG. 15 is an explanatory diagram showing in detail the format of the audio character display (ACD) area of FIG. 14, and FIG. 16 is an explanatory diagram showing an example displayed by the name space information of FIG. 17 is an explanatory diagram showing in detail the format of the audio search data (ASD) area of FIG. 14, and FIG. 18 is an explanatory diagram showing a modification of the audio content block unit of FIG.
[0012]
FIG. 19 is a block diagram showing an audio data encoding apparatus according to the present invention. FIG. 20 is an explanatory diagram showing two-channel and multi-channel sampling frequencies and the number of quantization bits recorded on the audio disk according to the present invention. 21 is an explanatory diagram showing copy management data recorded on the audio disc according to the present invention, FIG. 22 is an explanatory diagram showing in detail the CGMCAPS code of FIG. 21, FIG. 23 is a block diagram showing an audio data decoding device, and FIG. Is a flowchart showing the reproduction process of the reproduction apparatus of FIG. 23, and FIG.
[0013]
Here, in the DVD-audio disc of this description, two channels for stereo and 5/6/8 channels are used as audio signals so as to correspond to a transition period when the CD generation is shifted to the DVD-audio generation. Both signals are recorded. Further, it is considered that only the 5/6/8 channel multi-channel signal is recorded when this transition period has passed.
[0014]
FIGS. 1A and 1B show DVD-video and DVD-audio formats, respectively, and the DVD-audio format is compatible with DVD-video although the area names are different. First of all, the DVD-video format is composed of the head video manager (VMG) and the following areas of a plurality of video title sets (VTS), while the DVD-audio format corresponds to this. 2 includes an audio manager (AMG) shown in detail in FIG. 2 and a plurality of audio title sets (ATS) following AMG as shown in detail in FIG.
[0015]
Each VTS is composed of a leading VTS information (VTSI), followed by one or more video content block sets (VCBS) and a last VTSI, while each ATS corresponds to the leading ATS information (ATSI). ) Followed by one or more audio content block sets (ACBS) and the last ATSI. The performance time of each song in ACBS is set in ATSI in real time.
[0016]
Each VCBS is composed of a plurality of VCBs, while each ACBS is composed of a plurality of ACBs. Each VCB corresponds to one video title, and each ACB corresponds to one audio title. Each VCB (one title) is composed of a plurality of chapters (Chapter), while each ACB (one title) is composed of a plurality of tracks (Track) corresponding thereto. The chapter includes a part of title (PTT), and the track includes a part of title (PTT).
[0017]
Each chapter is composed of a plurality of cells (CELL), while each track is composed of a plurality of indexes (Index). Each cell is composed of a plurality of VCB units (VCBU), while each index is composed of a plurality of ACB units (ACBU) corresponding thereto. Each of the VCB unit and the ACB unit is composed of a plurality of packs, and one pack is composed of 2048 bytes.
[0018]
Each VCB unit is composed of a leading control pack (hereinafter referred to as a CONT pack), followed by a plurality of video (V) packs, audio (A) packs, and sub-picture (SP) packs. Corresponding to this, it is composed of a leading audio control pack (hereinafter referred to as A-CONT pack), followed by a plurality of A packs and V packs.
[0019]
Information for controlling the subsequent V pack is arranged in the CONT pack, and information for managing the audio signal of the subsequent A pack is arranged in the A-CONT pack like the TOC information of the CD. Audio data is arranged in the A pack, and closed caption (CC) data other than the audio data is arranged in the V pack, in addition to the video data.
[0020]
As shown in Fig. 2, AMG (Audio Manager)
・ Audio Manager Information (AMGI) shown in detail in FIG.
-Audio content block set (AMGM-ACBS) for AMG menu,
・ AMGI for backup
Have AMGM-ACBS is used as control information
・ Presentation control information (PCI)
・ Data search information (DSI)
Have
[0021]
The ATS (Audio Title Set) is shown in FIG.
・ Audio title set information (ATSI) shown in detail in FIG.
An audio content block set (ATSM-ACBS) for the ATS menu;
-Audio content block set (ATSA-ACBS) for ATS title,
・ ATSI for backup
Have Both the ATSM-ACBS and ATSA-ACBS have the PCI and DSI described above (FIG. 2).
[0022]
AMGI (Audio Manager Information) is shown in detail in FIG.
・ AMGI management table (AMGI-MAT),
-Title search pointer table (T-SRPT);
Audio manager menu PGCI unit table (AMGM-PGCI-UT),
・ Parental management information table (PTL-MAIT),
-Audio title set attribute table (ATS-ATRT) in detail in FIG.
Text data manager (TXTDT-MG),
An audio manager menu cell (index) address table (AMGM-C-ADT);
・ Audio manager menu ・ Audio content block unit ・ Addressless map (AMGM-ACBU-ADMAP)
Have
[0023]
ATS-ATRT (Audio Title Set / Attribute Table) is shown in detail in FIG.
Audio title set attribute table information (ATS-ATRTI),
An audio title set attribute search pointer (ATS-ATR-SRP # 1 to #n) of each of a plurality (n) of ATSs;
Audio title set attribute data (ATS-ATR- # 1 to #n) of each of a plurality (n) ATSs as shown in detail in FIG.
Have
[0024]
Each of the audio title set attribute data (ATS-ATR- # 1 to #n) is shown in detail in FIG.
ATS-ATR-EA (end address),
・ ATS-CAT (category),
・ ATS-ATRI (Information)
Have
[0025]
As shown in FIG. 7 in detail, ATSI (ATS information) shown in FIG.
・ Audio title set information management table (ATSI-MAT) shown in detail in FIG.
Audio title set Part of title Search pointer table (ATS-PTT-SRPT)
・ Audio title set ・ Program chain information table (ATS-PGCIT),
・ Audio title set menu ・ PGCI ・ Unit table (ATSM-PGCI-UT),
・ Audio title set ・ Time map table (ATS-TMAPT)
・ Audio title set menu ・ Cell address table (ATSM-C-ADT)
Audio title set menu Audio content block unit Address map (ATSM-ACBU-ADMAP),
・ Audio title set ・ Cell address table (ATS-C-ADT)
Audio title set Audio content block unit Address map (ATS-ACBU-ADMAP)
Have
[0026]
As shown in detail in FIG. 8, the ATSI-MAT (Audio Title Set Information Management Table) shown in FIG.
ATS-ID (identifier)
ATS-EA (end address),
・ ATSI-EA,
・ VERN (DVD audio spec version number) and
・ ATS-CAT (category),
・ ATSI-MAT-EA,
・ ATSM-ACBS-SA (start address),
ATSA-ACBS-SA,
ATS-PTT-SRPT-SA,
ATS-PGCIT-SA,
・ ATSM-PGCI-UT-SA,
ATS-TMAP-SA,
・ ATSM-C-ADT-SA,
ATSM-ACBU-ADMAP-SA,
ATSM-AST-ATR (ATSM audio stream attributes) as shown in detail in FIG. 9,
ATS-AST-Ns (number of ATS audio streams);
ATS-AST-ATRT (ATS audio stream attribute table) as shown in detail in FIG.
Have
[0027]
The ATSM-AST-ATR is composed of 8 bytes (bits b63 to b0) as shown in detail in FIG. 9, and the following data (1) to (4) are used as attributes of the encoded audio signal recorded on this disc. ) Is placed (other bits are reserved).
(1) Audio encoding mode (3 bits b63 to b61)
000b: Dolby AC-3
010b: MPEG-1 or MPEG-2 (no extension bitstream)
011b: MPEG-2 (with extended bitstream)
100b: Linear PCM audio
101b: Linear PCM audio (including 2ch + 5ch, 2ch + 6ch, 2ch + 8ch)
[0028]
(2) Quantization / DRC (dynamic range control) information (2 bits b55, b54)
"11b" when the audio encoding mode is "000b"
When the audio encoding mode is “010b” or “011b”
00b: No dynamic range control data exists in the MPEG audio stream
01b: Dynamic range control data exists in the MPEG audio stream
10b, 11b: Hold
-When the audio encoding mode is "100b" or "101b", for stereo 2ch
00b: 16 bits
01b: 20 bits
10b: 24 bits
11b: Hold
[0029]
(3) Sampling frequency fs (2 bits b53, b52)
For stereo 2ch
00b: 48 kHz
01b: 96 kHz
10b: 192 kHz
(4) Number of audio channels (3 bits b50 to b48)
000b: 1ch (monaural)
001b: 2ch (stereo)
010b: 3ch
011b: 4ch
100b: (stereo 2ch + 5ch)
101b: (stereo 2ch + 6ch)
110b: 7ch
111b: (stereo 2ch + 8ch)
[0030]
As shown in detail in FIG. 11, the ATS-AST-ATRT (ATS audio stream attribute table) shown in FIG. 10 has ATS-AST-ATR for each of audio streams # 0 to # 7, and ATS-AST-ATR. Each is composed of 8 bytes (64 bytes in total).
[0031]
As shown in FIG. 11, the ATS-AST-ATR of one audio stream is 8 bytes (bits b63 to b0) similar to the audio title set menu audio stream attribute data (ATSM-AST-ATR) shown in FIG. In addition to the attribute data (1) to (4),
(5) Multi-channel extension (ME) (1 bit b60);
(6) Audio type (2 bits b59, b58);
(7) Audio application mode (2 bits b57, b56);
(8) Thinning information (2 bits b47, b46) of the stream (AST),
(9) Thinning information only for LFE (Low Frequency Effect) 1ch (2 bits b45, b44)
Each data. And (7) audio application mode of this DVD audio disc is
11b: 2ch + surround mode
And (8) the stream thinning information and (9) the thinning information only for LFE1ch are both as band information.
00b: Full (1/1)
01b: Half (1/2)
10b: Quarter (1/4)
Is recorded.
[0032]
However, (4) the number of audio channels in this ATSM-AST-ATR is always 2ch in the audio stream # 0, and the audio stream # 1 includes the front 3ch. That is, for example, when an audio signal of one title is recorded in 2 + 6ch, a 2ch stereo signal is assigned to the audio stream # 0, and among the 6ch, a 3ch front signal is assigned to the audio stream # 1, a 2ch rear signal and the LFE1ch. Assign the signal to audio stream # 2. Both the audio manager information management table (AMGI-MAT) shown in FIG. 4 and the audio title set information management table (ATSI-MAT) shown in FIG. Is recorded.
[0033]
Also, when the 2 + 6ch analog audio signal is sampled at the following sampling frequency fs and quantized with the following number of quantization bits, for example,
Stereo 2ch: 48kHz, 20 bits
Front 3ch: 96kHz, 16bit
Rear 2ch, LFE1ch: 48kHz, 16 bits (no thinning)
The audio title set menu, audio stream, and attribute data (ATSM-AST-ATR) shown in FIG.
(1) Audio encoding mode
101b: Linear PCM audio (including 2ch + 5ch, 2ch + 6ch, 2ch + 8ch)
(2) Quantization / DRC
01b: 20 bits
(3) Sampling frequency fs
00b: 48 kHz
(4) Number of audio channels
101b: (stereo 2ch + 6ch)
Is recorded.
[0034]
Also, the ATS-AST-ATR of audio stream # 0
(1) Audio encoding mode
101b: Linear PCM audio (including 2ch + 5ch, 2ch + 6ch, 2ch + 8ch)
(2) Quantization / DRC
01b: 20 bits
(3) Sampling frequency fs
00b: 48 kHz
(4) Number of audio channels
001b: 2ch (stereo)
(7) Audio application mode
11b: 2ch + surround mode
(8) Thinning information of the stream
00b: Full (1/1)
(9) Thinning information only for LFE1ch
00b: Full (1/1)
Is recorded.
[0035]
Also, the ATS-AST-ATR of audio stream # 1
(1) Audio encoding mode
101b: Linear PCM audio (including 2ch + 5ch, 2ch + 6ch, 2ch + 8ch)
(2) Quantization / DRC
00b: 16 bits
(3) Sampling frequency fs
01b: 96 kHz
(4) Number of audio channels
010b: 3ch
(7) Audio application mode
11b: 2ch + surround mode
(8) Thinning information of the stream
00b: Full (1/1)
(9) Thinning information only for LFE1ch
00b: Full (1/1)
Is recorded.
[0036]
Also, the ATS-AST-ATR of audio stream # 2
(1) Audio encoding mode
101b: Linear PCM audio (including 2ch + 5ch, 2ch + 6ch, 2ch + 8ch)
(2) Quantization / DRC
00b: 16 bits
(3) Sampling frequency fs
00b: 48 kHz
(4) Number of audio channels
010b: 3ch
(7) Audio application mode
11b: 2ch + surround mode
(8) Thinning information of the stream
00b: Full (1/1)
(9) Thinning information only for LFE1ch
00b: Full (1/1)
Is recorded.
[0037]
Next, the A pack in which the audio stream is recorded and the control pack will be described. As shown in FIG. 12, the VCB unit is composed of an arbitrary number of packs for 0.4 to 1.0 seconds, and the ACB unit is composed of an arbitrary number of packs for 0.5 to 1.0 seconds. Yes. The A-CONT pack in the DVD-audio ACB unit is arranged in the third pack in the DVD-video VCB unit.
[0038]
The A-CONT pack is basically arranged in units of 0.5 second of the audio time, and is arranged so as to be completed within the range of 0.5 to 1.0 seconds at the index break. The audio time (GOF: Group of Audio Frame) is indicated by an A-CONT pack, and the data position is determined by the number of audio frame numbers, first access unit pointers, and frame headers. Also, the A pack immediately before the A-CONT pack does not force padding in units of 0.5 second of the audio time.
[0039]
Adjacent A packs are arranged so that audio signals are related to each other. For example, in the case of stereo, an L channel pack and an R channel pack are arranged adjacent to each other, and a 5/6/8 channel multi-channel is arranged. In the same way, they are arranged adjacent to each other. The V pack is arranged adjacent to the A pack when video is displayed during reproduction of the audio signal. As shown in FIG. 13, the A pack and the V pack are a 4-byte pack start information and a 6-byte SCR (System Clock Reference) for 2034 bytes of user data (A data and V data). ) Information, 3-byte Mux rate information (stream multiplexing rate information), and 1-byte stuffing total 14-byte pack headers are added (1 pack = total 2048 bytes). In this case, the time of the A pack in the same title can be managed by setting the SCR information as a time stamp as “1” in the first pack in the ACB unit and continuing in the same title.
[0040]
On the other hand, as shown in FIG. 14, the A-CONT pack has a 14-byte pack header, a 24-byte system header, a 1003-byte ACD (audio character display) packet, and a 1007-byte ASD (audio search data). ) Consists of packets. The ACD packet includes a 6-byte packet header, a 1-byte substream ID, 636-byte ACD (audio character display) information as shown in detail in FIG. 15, and a 360-byte reserved area. The ASD packet is similarly composed of a 6-byte packet header, a 1-byte substream ID, and a 1000-byte ASD (audio search data) as shown in detail in FIG.
[0041]
As shown in detail in FIG. 15, the 636-byte ACD information area has a 48-byte general information area and a 294-byte area for each of the first language character “1” and the second language character “2”. Each area is composed of a 93-byte name space area, two 93-byte free space areas, and a 15-byte data pointer area. In one name space area of the character “1” in the first language and the character “2” in the second language, for example, data for displaying the song name in Japanese is arranged as shown in FIG. Data for displaying in English is arranged in the other namespace area. The display language may be determined by the disc publisher.
[0042]
The 48-byte general information includes, for example, 16-byte service level information, 12-byte language code information, 6-byte character set code information, 6-byte display item information, and 2-byte “previous ACD information”. Difference information and 6-byte hold information. The 16-byte service level information indicates the display size, display type, audio / video / SP distinction, stream, etc., and the character is mandatory (required) and the bitmap is optional (optional). The 12-byte language code information indicates the language of the characters “1” and “2” by 2 bytes, as in the video file, and indicates a maximum of 8 languages in one file. English is mandatory.
[0043]
The 6-byte character set code information can have a maximum of 15 character codes corresponding to language codes, and indicates the presence / absence and type of characters “1” and “2” in 1 byte. A code example is shown below.
1. ISO646
2. ISO8859-1
3. MS-JIS
The 6-byte display item information indicates the free space “1” and “2” shown in FIG. The name space is mandatory, and the title name, music name, and artist name must be written.
[0044]
As shown in detail in FIG. 17, 1000-byte ASD (audio search data) includes 16-byte general information, 8-byte current number (No.) information, 16-byte current time information, and 8-byte title. It consists of set search information, 8-byte title search information, 404-byte track search information, 408-byte index search information, 80-byte highlight search information, and a 52-byte reserved area.
[0045]
The current number information of 8 bytes includes the current title number of the title set (2 bytes: BCD), the current track number of the title set (2 bytes: BCD), and the current index number of the track (2 bytes: BCD). ) And a reserved area (2 bytes). The current time information of 16 bytes includes the track playback time (4 bytes: BCD), the remaining playback time of the track (4 bytes: BCD), the absolute time of the title (4 bytes: BCD), and the remaining title. The absolute time (4 bytes: BCD).
[0046]
The 8-byte title set search information is composed of the first sector number (4 bytes) of the title set and the last sector number (4 bytes) of the title set. The 8-byte title search information is composed of the first sector number (4 bytes) of the title and the last sector number (4 bytes) of the title. The 404-byte track search information includes a title track and sector number (4 bytes × 99), a title first track number (4 bytes), and a title last track number (4 bytes).
[0047]
The 408-byte index search information includes a track index and sector number (4 bytes × 100), a track first index number (4 bytes), and a track last index number (4 bytes). The 80-byte highlight search information includes a track in-sector number (4 bytes × 10) and a track out-sector number (4 bytes × 10).
[0048]
According to such a format, since the A-CONT pack for managing the audio signal of the subsequent A pack such as the TOC information of the CD is arranged at the head of the plurality of A packs, the audio data is the video data. The recording capacity can be increased. Also, the audio time can be managed by the A-CONT pack, and simple character information such as a song name related to the audio data can be extracted by the A-CONT pack.
[0049]
Further, since TOC information such as title, start address, performance time, etc. is arranged in the A-CONT pack, information corresponding to the user's operation is taken out from the A-CONT pack and playback is started even during audio playback. be able to. Further, by arranging the TOC information in the audio manager information (AMGI) and the audio title set information (ATSI), the necessary TOC information is stored in the memory in the playback device, and information corresponding to the user's operation is stored in the memory. Can be read immediately and playback can be started. Further, since it is not necessary to store a large amount of information such as program chain information (PGCI) in DVD-video, the disk can be managed efficiently.
[0050]
further,
1. If there is no image (V) data in the content,
(1) Search and random access to three levels of title, song, and index are possible.
(2) Finding of GOF (audio frame) units, time search, and random access are possible.
(3) The title, song, and index times can be managed in real time.
[0051]
Also,
2. If there is image (V) data in the content,
For audio data,
In addition to the above (1) to (3)
(4) The title, the current time in the song, and the remaining time can be displayed and managed in real time.
[0052]
For video data,
(1) Search and random access to the three layers of title, PTT, and cell are possible.
(2) Cueing in units of video frames, time search, and random access are possible.
(3) The title, PTT, and cell time can be managed in real time.
(4) Current time and remaining time in PTT or title can be displayed and managed in video frame unit time.
[0053]
The ACBU in FIG. 1B includes the A-CONT pack and the CONT pack, but may be configured not to include the V pack and the CONT pack as shown in FIG. In this case, the video signal is not recorded, but the recording capacity of the audio signal is increased, the disc size can be reduced, and the playback function can be simplified, so that playback for portable use is possible. What is suitable for the device can be provided.
[0054]
FIG. 19 shows an audio data encoding apparatus according to the present invention. First, a two-channel or multi-channel audio signal A relating to the same audio source is selectively input to the A / D converter 1, and the A / D converter 1 has an A / D with a sampling frequency and the number of quantization bits (bits) as shown in FIG. D-converted. FIG.
(1) Only 2 channels
(2) 2 + 6 channels,
(3) 6 channels only
In this case, the transmission rate and the storage time for the DVD are shown. Naturally, if the sampling frequency and the number of quantization bits are reduced, the accommodation time increases, and conversely, if the sampling frequency and the number of quantization bits are increased, the accommodation time decreases. In addition, since it is not desirable to record for a very long time, it is desirable to record 2 + 6 channels at fs = 48 kHz and the number of quantization bits = 20 or 24 bits.
[0055]
Returning to FIG. 19, the 2-channel and multi-channel digital audio signals A are sent to the DVD formatting unit 6 via the signal processing circuit 2 and the memory 3 and stored in the audio pack as shown in FIG. . Also, the menu screen and still picture video (V) data relating to the audio source are A / D converted by the A / D converter 4, and this data is sent to the DVD formatting unit 6 via the V encoder 5. It is accommodated in a video pack as shown in FIG. The DVD formatting unit 6 also generates a DVD format as shown in FIGS. The subsequent content encryption unit 7 scrambles the DVD format with a predetermined CSS (content scramble system), and the subsequent modulation circuit 8 modulates the output signal of the content encryption unit 7 by EFMplus.
[0056]
The data modulated by the modulation circuit 8 is supplied to a DVD cutting machine (player) (not shown) to produce a master DVD (master). Next, a metal thin film is formed on the master by sputtering and plating, and further thickened and peeled from the master to produce a stamper. Next, the base material on which the disc is based is formed by injection molding with this stamper and bonded to produce a DVD audio disc.
[0057]
The lead-in portion of the disk is provided with a variable length copyright management information (CMI) area of 16 bytes (128 bits) to 188 bytes (1504 bits). In this CMI area, as shown in FIG. 21, for example, 64-bit disk manufacturing date data, 52-bit factory code, 8-bit scrambling synchronization signal, 60-bit ISRC code (International Standard) Recording Code), 8-byte SID (Source ID) code, and 4-bit first CGMCAPS (Copy Generation Management Control Audio Protection System) or SCMS (Serial Copy Management System) code (hereinafter simply referred to as copy management data). As with CGMCAPS), a 4-bit second CGMCAPS code is recorded. This data is repeatedly recorded several times, for example, eight times, and the ISRC code and SID code are scrambled and recorded.
[0058]
The first and second CGMCAPS codes are recorded by manufacturing the control data area of the lead-in portion as a RAM area in advance. The first CGMCAPS code is a copy guard management code of data material of the 2-channel method, and the same data is recorded in the lower 4 bits. The second CGMCAPS code is a copy guard management code for multi-channel data material (content), and the same data is recorded in the lower 4 bits.
[0059]
As shown in FIG. 22, 2 bits or 3 bits of the 4-bit data are used as actual copy management information, and the remaining 1 or 2 bits are used as blanks. This data is used as reproduction permission / prohibition information for a reproduction-only device (and a recording / reproduction device that performs reproduction), and as copy permission / prohibition information for a recording / reproduction device that performs copying. The contents of the information shown in FIG. 22 will be described in detail when referring to the flowcharts shown in FIGS.
[0060]
When a plurality of songs are separately managed for copy management in the disc, a CGMCAPS code is provided for each. For example, it is recorded without being repeated as flag information in a music management area such as AMG or ATSI. Furthermore, a CGMCAPS code is provided for each of the tracks constituting the song. That is, as shown in FIG. 49, the user data (2034 bytes) in FIG. 13 is composed of a packet header, substream ID, audio frame information, audio data information (ADI), and audio data. It is recorded as flag information in a management area (ADI) where recording conditions are recorded. Furthermore, a CGMCAPS code is provided in the TOC information. Each of the first and second CGMCAPS codes may be recorded in a 1-byte area with 4 bits (actual data is 2 or 3 bits) instead of being repeatedly recorded in each 1-byte area. Also, instead of providing it in the CMI area on the inner periphery of the disc, an IC having a memory and a CPU storing a CGMCAPS code and the like is embedded in the disc, and a read-only device or recording / playback device sends a read control signal to this IC CGMCAPS code or the like may be read.
[0061]
Next, an audio data decoding apparatus according to the present invention will be described with reference to FIG. The stream signal reproduced from the DVD audio disk is EFMplus demodulated by the demodulation circuit 11, then descrambled by the scramble decoding unit 12, and then read-in area data, A-CONT pack, Separated into A-pack and V-pack. The A pack is sent to the signal processing circuit 14 and the memory 15 and restored to 2-channel or multi-channel audio data. The audio data of each channel is converted into an analog signal by the D / A converter 16 and output. The V pack is sent to the V decoder 17 where it is converted into a V signal for a menu screen or a still image and output. Furthermore, the lead-in area data and the A-CONT pack are sent to the control unit 18, and the control unit 18 executes the processes shown in FIGS. 24 and 25 based on the lead-in area data.
[0062]
FIG. 24 shows processing when only reproduction is performed. In FIG. 24, first, information in the lead-in area is read (step S30), and then it is determined whether the disk is a ROM disk or a RAM disk (steps S31 and S32). And in the case of a ROM disk, determine the CGMCAPS code
-When (1, 1), playback is prohibited (steps S33, S34)
-When (1, 0), playback is prohibited (steps S35 and S36),
-When (1, 0, 1), playback is prohibited (steps S37, S38),
-When (0, 0), playback is permitted (steps S39 and S40),
Reproduction is permitted when no CGMCAPS code is detected (steps S41 and S42).
[0063]
In the case of a RAM disk, the CGMCAPS code is also determined.
-When (1, 1), playback is prohibited (steps S43 and S44)
-When (1, 0), playback is prohibited (steps S45 and S46)
-When (1, 0, 1), playback is permitted (steps S47 and S48),
When (0, 0), playback is permitted (steps S49 and S50)
Reproduction is permitted when no CGMCAPS code is detected (steps S51 and S52).
[0064]
Next, processing at the time of copying will be described with reference to FIGS. First, read ROM / RAM type information and CGMCAPS code information in the lead-in area (step S60), and then determine the CGMCAPS code.
When (1, 1), copy is prohibited (steps S61 and S62),
When (1, 0), the CGMCAPS code of the copy source disk is rewritten to (1, 0, 1) to permit copying (steps S63 and S64),
-When (1, 0, 1), copy is prohibited (steps S65 and S66),
-When (0, 0), copy is permitted (steps S67, S68),
Copying is permitted when no CGMCAPS code is detected (steps S69 and S70). Therefore, the reproduction of the disc in which the CGMCAPS code is rewritten from (1, 0) to (1, 0, 1) is prohibited as shown in FIGS. Note that a disc with a CGMCAPS code of (1, 1) cannot be played back by a commercially available player, and is for a specific use that can be played back only by a specific player.
[0065]
Here, in the above embodiment, since the 2-channel and multi-channel audio signals related to the same audio source are recorded on the disc, a user having a 2-channel system amplifier and a speaker can reproduce the 2-channel, In addition, a user having the multi-channel system can reproduce the multi-channel. However, considering that the multi-channel method will become more popular in the future than two channels, it may be desirable to record more multi-channel data on the disc than two channels.
[0066]
In FIG. 26, in order to cope with such a market, for example, when a plurality of songs are recorded on one disc, some songs are recorded with 2 + 6 channels, and other songs are recorded with only 6 channels. Shows how to do. Therefore, according to such a recording method, it is convenient if there are more users having multi-channel amplifiers and speakers than users having two-channel systems. Further, the sampling frequency and the number of quantization bits of the music recorded with only 6 channels may be recorded with higher quality, for example, so as to be different from that of the 6 channels of music recorded with 2 + 6 channels.
[0067]
FIG. 27 shows a modification of the copy management data. The area of the disk is roughly composed of a PCA (post-cutting area) part, a lead-in part, a data part, and a lead-out part from the inner periphery to the outer periphery, and one sector is composed of 2048 bytes. Yes. The control area of the lead-in portion is composed of 16 sectors “1” to “16”, physical format information is recorded in sector “1”, disk manufacturing information is recorded in sector “2”, and sector “3”. And “4” records copyright information as shown in detail in FIG.
[0068]
4-bit first and second CGMCAPS codes are recorded in the first and second bytes of sectors “3” and “4”, respectively. The first CGMCAPS code is a copy guard management code for the data material of the 2-channel method, and the second CGMCAPS code is a copy guard management code for the data material (content) of the multi-channel method. The 3rd to 19th bytes are an ISRC (International Standard Recording Code) code indicating the music (program source) and an SID (Source ID) code indicating the disc manufacturer. In the 3rd byte, an 8-bit ISRC code and a scrambled synchronization signal for the SID code are recorded, and in the 4th to 11th bytes, a 60-bit ISRC code is scrambled and recorded. The SID code for 8 characters is scrambled and recorded.
[0069]
Similarly, an ISRC code and SID code for one title are recorded in 16 bytes, and a total of 99 titles are recorded. Note that instead of scrambling both the ISRC code and the SID code, only the SID code may be scrambled. In addition, “IFPI · L231-7” shown as an example of the SID code in FIG. 28 is “IFPI” is the International Federation of Phonogram Industries (current name is International Federation of Phonogram and Video Industries). “L231-7” indicates the IFPI mastering code of Victor Company of Japan. The ISRC code is composed of 12 characters, the first to fifth characters are composed of 6 bits, and the sixth to twelfth characters are composed of 4 bits (6 bits are blank).
[0070]
Here, in the above embodiment, it is described that it is desirable to record 2 + 6 channels at fs = 48 kHz and the number of quantization bits = 20 or 24 bits. However, in the current two channels, fs = 44.1 kHz of the CD standard, quantum The number of digitized bits = 16 bits is widespread. Therefore, in consideration of the convenience of the user having such a CD standard playback apparatus, as shown in FIG. 29, fs = 44.1 kHz, 88.2 kHz, and the number of quantization bits for the two channels so as to meet this standard. = 16, 20, 24 bits may be recorded. Similarly, in this case, for example, when recording a plurality of songs on one disc, some songs are recorded with 2 + 6 channels, and other songs are recorded with only 6 channels. May be. Further, as shown in FIG. 30, the sampling frequency and the number of quantization bits of the music recorded with only 6 channels are different from those of the music recorded with 2 + 6 channels, for example, higher quality recording is performed. It may be.
[0071]
Next, a second embodiment will be described. FIG. 31 shows the basic format of a DVD-Van (video + audio navigation) disc as the second embodiment, FIG. 32 shows the ACBU and VCBU of the embodiment of FIG. 31, and FIG. 33 shows the ACD of the second embodiment. FIG. 34 shows ASD (audio search data) of the second embodiment, FIG. 35 shows the CONT pack of FIG. 31 in detail, and FIG. 36 shows the PCI of FIG. FIG. 37 shows the PCI general information of FIG. 36 in detail, FIG. 38 shows the recording information of FIG. 36 in detail, FIG. 39 shows the DSI of FIG. 35 in detail, and FIG. 40 shows the DSI general information of FIG. FIG. 41 shows the seamless playback information of FIG. 39 in detail, and FIG. 42 shows the seamless reproduction by the seamless angle information of FIG. Angle shows the concept of change, FIG. 43 shows an example of the VOBU search information of FIG. 39, FIG. 44 shows in detail the VOBU search information of FIG. 39, FIG. 45 shows in detail the synchronization information in FIG. 39.
46 shows the configuration of the lead-in area of the disk of the first and second embodiments, FIG. 47 shows the control data block of FIG. 46 in detail, and FIG. 48 shows the physical format information of FIG. 47 in detail. Show.
[0072]
Here, in the first embodiment, the ASD (audio search data) in the A-CONT pack shown in detail in FIG. 14 is used for the audio player to control the playback of the A pack. At this time, the seamless playback is performed. Is based on the current number and the current time, and when performing jump playback, is based on search information for title set search, title search, track search, index search, and highlight search.
[0073]
On the other hand, the basic format of the DVD-Van disk of the second embodiment is roughly divided as shown in FIG. 31A so that it can be reproduced using various DVD players. (VMG) and audio manager (AMG), followed by a plurality of video title sets (VTS) and audio title sets (ATS). That is, the basic format of this DVD-Van disk includes both the DVD video disk shown in FIG. 1A and the DVD audio disk shown in FIGS. 1B and 31B. Since these AMG and ATS have the same functions as the AMG and ATS shown in FIGS. 1B and 31B, the description thereof is omitted.
[0074]
Each of the VTS and ATS includes a first VTS information (VTSI) and ATS information (ATSI), followed by one or more video content block sets (VCBS) and audio content block sets (ACBS), and a last VTSI. And ATSI. Each VCBS is composed of a plurality of VCBs, while each ACBS is composed of a plurality of ACBs. Each VCB corresponds to one video title, and each ACB corresponds to one audio title. Each VCB (one title) is composed of a plurality of chapters, while each ACB (one title) is composed of a plurality of tracks corresponding thereto. The chapter includes a part of title (PTT), and the track includes a part of title (PTT).
[0075]
Each chapter is composed of a plurality of cells, while each track is composed of a plurality of indexes correspondingly. Each cell is composed of a plurality of VCB units (VCBU), while each index is composed of a plurality of ACB units (ACBU) corresponding thereto. The VCB unit (VCBU) does not include an A-CONT pack as shown in detail in FIG. 32, and is composed of a leading CONT pack, a relatively large number of A packs, and a relatively small number of V packs. The ACBU is composed of an arbitrary number of packs for 0.4 to 1.0 seconds at the same interval as the VCBU with the first A pack after the V pack as the head. Here, VCBU is also called VOBU in the DVD video standard.
[0076]
Since ACBU does not include the A-CONT pack, the ACD packet and ASD packet included in the A-CONT pack in the first embodiment are the VMG (video manager) and VTS (shown in FIG. 31A). Video title set) or both.
[0077]
Here, since the ACD packet of the first embodiment is provided in an A-CONT pack provided for each ACB unit (every 0.5 to 1.0 seconds), data for a large number of screens is stored. In the second embodiment, DVD video discs and DVD audio discs such as VMG (video manager) and AMG (audio manager) and VTS (video title set) and ATS (audio title set) can be accommodated. Since both types of data are accommodated, the amount of accommodated data is limited, and therefore, the data is accommodated with a relatively small amount of data such as title names for each song or movement. In addition, the audio reproduction control information described in detail below may be accommodated in about one type.
[0078]
Further, the ACD area in the ACD packet is configured to have data of the character “1” in the first language and the character “2” in the second language as in the first embodiment (FIG. 15). Alternatively, as shown in FIG. 33, data relating to the character “2” is omitted, and a 48-byte general information area and a so-called “audio navigation” such as a song name as shown in FIG. 16 are displayed. For example, a 294-byte area and a 294-byte audio reproduction control information area related to the character “1” in one language. The area of the character “1” is composed of a 93-byte name space area, two 93-byte free space areas, and a 15-byte data pointer area, as in the first embodiment.
[0079]
The content of the audio reproduction control information area is arbitrary, and is composed of, for example, 10 types of audio reproduction control information areas (250 bytes) each having 25 bytes and a 44-byte reserved area. In one audio playback control information area, 20-byte graphic equalizer information, 3-byte level balance information, and 2-byte reverberation additional information are arranged, and this information is selected by the user to control the sound quality of the audio signal. Is done. These pieces of audio playback control information are used when the user plays back a song arranged in the A pack, for example, depending on the genre (classic, jazz, rock, BGM) of the song, This data is recommended by a so-called professional mixer so that the sound quality during reproduction is best according to the performance state, recording state, atmosphere, etc. of the music. In the reserved area, when the number of audio signal channels is 6, mixing coefficients are stored so that the number of channels can be reduced to 2 and stereo reproduction can be performed.
[0080]
Further, since the CONT pack is used when the A pack is played back seamlessly, the ASD omits the 8-byte current number information and the 16-byte current time information in the first embodiment (FIG. 17) as shown in FIG. This amount is used as a reserved area (76 bytes). For this reason, detailed display and playback control cannot be performed as in the first embodiment, but only a DVD audio disk dedicated player and a DVD video disk dedicated player cannot be played back as in the first embodiment. It is possible to realize an audio disc that is effective in the transition period up to.
[0081]
Next, the configuration of the CONT pack will be described in detail with reference to FIG. This CONT pack is called a navigation pack, commonly known as a navigation (NV) pack in the DVD video standard. It is a 14-byte pack header, a 24-byte system header, a PCI (Presentation Control Information) packet, and a DSI (DSI). Data search information) packet. PCI is called reproduction control information. This PCI packet is composed of a 6-byte packet header, a 1-byte substream ID, and 979-byte PCI data shown in detail in FIG. 36 (total 986 bytes). The DSI packet is composed of a 6-byte packet header, a 1-byte substream ID, and a 1017-byte DSI shown in detail in FIG. 39 (total of 1024 bytes).
[0082]
The PCI data is navigation data for controlling VOBU playback. As shown in detail in FIG. 36, the PCI general information (PCI GI) of 60 bytes, the non-seamless angle information (NSML AGLI) of 36 bytes, and 694 bytes. 4 highlight information (HLI) and 189-byte recording information (RECI).
[0083]
The PCI general information is shown in detail in FIG.
4 bytes of “NBN of NV pack (= CONT pack)” (NV PCK LBN),
-2-byte "VOBU category" (VOBU CAT),
-A 2-byte reserved area,
4 bytes of “VOBU user operation control information” (VOBU UOP CTL),
-4-byte "VOBU start PTM" (VOBU S PTM),
4 bytes of “VOBU end PTM” (VOBU E PTM),
-4 bytes "End of PTM within VOBU PTM" (VOBU SES PTM),
• 4 bytes of “Elapsed Time in Cell” (C ELTM),
• It consists of a 32-byte reserved area.
[0084]
In “NV pack LBN” (NV PCK LBN), the address of the NV pack including this PCI is described in RLBN from the first LB of the VOBS including this PCI, and “VOBU category” (VOBU) CAT) describes the state of the analog protection system (APS) of this VOBU.
[0085]
The non-seamless angle information (NSML AGLI) shown in FIG. 36 is information relating to the destination address at the time of angle change, and when the angle cell change is changed non-seamlessly, that is, the seamless angle change flag is “ Valid only when it is set to “non-seamless”. The highlight information (HLI) shown in FIG. 36 is information for highlighting one rectangular area in the sub-picture display area, and based on this information, the mixing ratio (contrast of video and sub-picture colors in the specific rectangular area is shown. ) Can be changed. Further, the reproduction period of the sub-picture unit (SPU) of each sub-picture stream is the same as the validity period of the highlight information (HLI).
[0086]
As shown in detail in FIG. 38, the recording information (RECI) shown in FIG.
10 bytes of “ISRC of video data in video stream” (ISRC V);
10 bytes of “ISRC of audio data in decoding audio stream # 0” (ISRC A0);
10 bytes of “ISRC of audio data in decoding audio stream # 1” (ISRC A1);
10 bytes of “ISRC of audio data in decoding audio stream # 2” (ISRC A2);
10 bytes of “ISRC of audio data in decoding audio stream # 3” (ISRC A3);
10 bytes of “ISRC of audio data in decoding audio stream # 4” (ISRC A4);
10 bytes of “ISRC of audio data in decoding audio stream # 5” (ISRC A5);
10 bytes of “ISRC of audio data in decoding audio stream # 6” (ISRC A6);
10 bytes of “ISRC of audio data in decoding audio stream # 7” (ISRC A7);
-10 bytes of "Decoding-ISRC of SP data # 0, # 8, # 16 or # 24 SP data" (ISRC SP0),
-10 bytes of "Decoding-ISRC of SP data # 1, # 9, # 17 or # 25 SP data" (ISRC SP1),
-10 bytes of "Decoding-ISRC of SP data # 2, # 10, # 18 or # 26 SP data" (ISRC SP2),
-10-byte "decoding-ISRC of SP data # 3, # 11, # 19 or # 27 SP data" (ISRC SP3),
-10 bytes of "Decoding-SPRC ISRC # 4, # 12, # 20 or # 28 SPRC ISRC" (ISRC SP4);
-10 bytes of "Decoding-SPRC ISRC # 5, # 13, # 21 or # 29 SPRC ISRC" (ISRC SP5);
-10 bytes of "Decoding-SPRC ISRC for SP stream # 6, # 14, # 22 or # 30" (ISRC SP6),
-10 bytes of "Decoding-ISRC of SP data # 7, # 15, # 23 or # 31 SP data" (ISRC SP7),
1 byte “Group of SP streams selected for ISRC” (ISRCCSP SEL);
-It consists of an 18-byte reserved area.
[0087]
The data search information (DSI) shown in FIG. 35 is navigation data for searching for data and executing VOBU seamless playback. As shown in detail in FIG.
-32-byte DSI general information (DSI GI);
148 bytes of seamless playback information (SML PBI),
54-byte seamless angle information (SML AGLI),
-168-byte VOBU search information (VOBU SRI);
144 bytes of synchronization information (SYNCI),
-It consists of a 471-byte reserved area.
[0088]
The DSI general information (DSI GI) is shown in detail in FIG.
4 bytes of “NV PCK SCR Base” (NV PCK SCR),
4 bytes of “NV PCK LBN” (NV PCK LBN),
4 bytes of “VOBU end address” (VOBU EA),
4-byte “end address of first reference picture of VOBU” (VOBU 1STREF EA);
4 bytes of “end address of the second reference picture of VOBU” (VOBU 2NDREF EA),
4 bytes of “end address of the third reference picture of VOBU” (VOBU 3RDREF EA),
-2 bytes "VOBU ID number of VOBU" (VOBU VOB IDN),
A 1-byte reserved area;
1-byte “VOBU cell ID number” (VOBU C IDN);
Consists of a 4-byte “cell elapsed time” (C ELTM).
[0089]
As shown in detail in FIG. 41, the seamless playback information (SML PBI) shown in FIG.
-2-byte "Seamless VOBU Category" (VOBU SML CAT),
4 bytes of “interleaved unit end address” (ILVU EA),
4 bytes of “Start Address of Next Interleaved Unit” (NXT ILVU SA);
2 bytes of “next interleaved unit size” (NXT ILVU SZ);
4 bytes of “Start PTM of video in VOB” (VOB V S PTM);
4 bytes of “End of video PTM in VOB” (VOB V E PTM),
8 bytes x 8 "End of audio PTM in VOB" (VOB A STPPTM),
-8 bytes x 8 "Audio gap length in VOB" (VOB A GAPLEN).
[0090]
The seamless angle information shown in FIG. 39 is information related to the destination address at the time of angle change as shown in FIG. 42, and when the angle change is executed seamlessly, that is, the seamless angle change flag is set to “seamless”. It is valid only if
[0091]
In the VOBU search information (VOBU SRI) shown in FIG. 39, as shown in FIG. 43, in this cell, the head of the VOBU reproduced at 0.5 × n seconds before and after the reproduction start time of the VOBU including this DSI. An address is described and is valid only within one cell. This information is detailed in FIG.
4 bytes of “next VOBU start address with video data” (FWDI Video),
4 bytes of “+240 VOBU start address and video presence flag” (FWDI 240),
4 bytes of “+120 VOBU start address and video presence flag” (FWDI120),
4 bytes of “+60 VOBU start address and video presence flag” (FWDI 60),
4 bytes of “+20 VOBU start address and video presence flag” (FWDI 20),
4 bytes of “+15 VOBU start address and video presence flag” (FWDI 15),
4 bytes of “+14 VOBU start address and video presence flag” (FWDI 14),
4 bytes of “+13 VOBU start address and video presence flag” (FWDI 13),
4 bytes of “+12 VOBU start address and video presence flag” (FWDI 12),
4 bytes of “+11 VOBU start address and video presence flag” (FWDI 11),
4 bytes of “+10 VOBU start address and video presence flag” (FWDI 10),
4 bytes of “+9 VOBU start address and video presence flag” (FWDI 9),
4 bytes of “+8 VOBU start address and video presence flag” (FWDI 8),
4 bytes of “+7 VOBU start address and video presence flag” (FWDI 7),
4 bytes of “+6 VOBU start address and video presence flag” (FWDI 6),
4 bytes of “+5 VOBU start address and video presence flag” (FWDI 5),
4 bytes of “+4 VOBU start address and video presence flag” (FWDI 4),
4 bytes of “+3 VOBU start address and video presence flag” (FWDI 3),
4 bytes of “+2 VOBU start address and video presence flag” (FWDI 2),
4 bytes of “+1 VOBU start address and video presence flag” (FWDI 1),
4 bytes of “next VOBU head address and video presence flag” (FWDI Next),
4 bytes of “Previous VOBU start address and video presence flag” (BWDI Prev),
4 bytes of “−1 VOBU start address and video presence flag” (BWDI 1),
4 bytes of “-2 VOBU start address and video presence flag” (BWDI 2),
4 bytes of “−3 VOBU start address and video presence flag” (BWDI 3),
4 bytes of “−4 VOBU start address and video presence flag” (BWDI 4),
4 bytes of “−5 VOBU start address and video presence flag” (BWDI 5),
4 bytes of “−6 VOBU start address and video presence flag” (BWDI 6),
4 bytes of “−7 VOBU start address and video presence flag” (BWDI 7),
4 bytes of “−8 VOBU start address and video presence flag” (BWDI 8),
4 bytes of “−9 VOBU start address and video presence flag” (BWDI 9),
4 bytes of “−10 VOBU start address and video presence flag” (BWDI 10),
4 bytes of “-11 VOBU start address and video presence flag” (BWDI 11),
4 bytes of “−12 VOBU start address and video presence flag” (BWDI 12),
4 bytes of “−13VOBU start address and video presence flag” (BWDI 13),
4 bytes of “-14 VOBU start address and video presence flag” (BWDI 14),
4 bytes of “−15 VOBU start address and video presence flag” (BWDI 15),
4 bytes of “−20 VOBU start address and video presence flag” (BWDI 20),
4 bytes of “−60 VOBU start address and video presence flag” (BWDI 60),
4 bytes of “−120VOBU start address and video presence flag” (BWDI120),
4 bytes of “−240 VOBU start address and video presence flag” (BWDI 240),
-Consists of 4-byte "VOBU head address before having video data" (BWDI Video).
[0092]
The synchronization information (SYNCI) shown in FIG. 39 is address information of audio data and sub-picture data reproduced in synchronization with VOBU video data including this DSI. As shown in detail in FIG.
-2 bytes x 8 "address of target audio pack (A PCK)" (A SYNCA 0 to 7),
4 bytes × 32 “VOBU head address for target sub-picture pack (SP PCK)” (SP SYNCA 0 to 31)
[0093]
Next, disc identifiers according to the first and second embodiments will be described. As shown in FIG. 46, the DVD recording area is roughly composed of a lead-in area and a data area. The lead-in area for DVDs
-All 00h blocks from the lead-in start to before the sector number “02F000h”,
A reference code block for two blocks from the sector number “02F000h” to the sector number “02F020h”;
All 30h blocks from the sector number “02F020h” to the sector number “02F200h” before the sector number “02F020h”;
A control data block of 192 blocks from sector number “02F200h” to sector number “02FE00h”;
It is composed of 32 blocks of all 00h blocks from the sector number “02FE00h” to the sector number “030000h”.
[0094]
In addition, ISO 9660 and micro UDF (Universal Disc Format) data are recorded from the head of the data area (sector number “030000h”), followed by audio title set (TS), video TS, computer TS, etc. The
[0095]
As shown in FIG. 47, the control data block in the lead-in area is composed of a sector of physical format information, a sector of disc manufacturing information, and a sector of copyright information. As shown in FIG. 48, the physical format information sector includes a book type and part version area, a disk size and minimum lead-out area, a disk structure area, a recording density area, and data. It consists of area allocation areas.
[0096]
And the book type and part version areas are assigned as disc identifiers, and their upper bits
・ "DVD-ROM disk" or
・ "DVD-RAM disk" or
・ "DVD-Write Once disk" is indicated, and in the case of "DVD-ROM disk", the lower bit indicates
・ "Computer program disk"
・ "Pure video disk"
"Video + audio navigation disk: Van disk" or "Audio disk"
An identifier indicating is described.
[0097]
Therefore, according to the book type and part version, the disc identifier indicating “DVD-ROM-audio disc” is described in the disc according to the first embodiment, and “DVD” is indicated in the disc according to the second embodiment. A disk identifier indicating "-ROM-Van disk" is described. In addition, “DVD-ROM-pure video disc” is not provided with TOC information such as cued information of songs and movements, but “DVD-ROM-audio disc” of the first embodiment and the second one. This TOC information is provided in the lead-in area of the “DVD-ROM-Van disk” of the embodiment. This TOC information is also called SAPP.
[0098]
Next, an embodiment in which the digital audio signal formatted as described above is transmitted via a communication line (network) will be described. FIG. 50 shows an encoding apparatus in which a recording unit 19 and a communication I / F (interface) 20 are added to the configuration shown in FIG. In FIG. 50, the data formatted by the DVD formatting unit 6 and encrypted by the content encryption unit 7 is modulated by the modulation circuit 8 with a modulation scheme corresponding to the recording medium, and the recording medium is converted based on the modulated data. It is manufactured, once recorded in the recording unit 19, or transmitted via the communication I / F 20 and a communication line. Further, data received via the communication line and the communication I / F 20 is once recorded in the recording unit 19 and supplied to the modulation circuit 8.
[0099]
When transmitting the digital audio signal formatted as described above via a communication line (network), as shown in FIG. 51, transmission data stored in a transmission buffer (not shown) in the communication I / F 20 is stored. The packet is divided into predetermined lengths to be packetized (step S71), and then a header including a destination address is added to the head of the packet (step S72), which is then output on the network (step S73).
[0100]
When the digital audio signal formatted as described above is received via a communication line (network), the header is removed from the packet received from the network as shown in FIG. 52 (step S81), and then the received data is received. Is restored (step S82), and is then transferred to the memory in the recording unit 19 (step S83). This received data can be decoded by the decoding device shown in FIG.
[0101]
Here, the audio signal quantization method may be 1-bit stream data instead of the PCM method. The 1-bit stream data is a signal represented by a 1-bit ΔΣ modulation signal, and is also called DSD data. 53A and 53B show examples of PCM quantization and inverse quantization methods, FIG. 53C shows examples of 16-bit ΔΣ modulation quantization and inverse quantization methods, and FIG. D) shows an example of quantization and inverse quantization using 1-bit ΔΣ modulation.
[0102]
One bit stream data can be compressed more efficiently than the PCM method. For example, FIG. 29 shows an example of PCM quantization.
2 channels: 88.2 kHz / 24 bits (4.234 Mbps)
6 channels: 44.1 kHz / 16 bits (4.234 Mbps)
Is described. So instead of quantizing with 1 bit stream method,
2 channels: 88.2 × 24 kHz / 1 bit (4.234 Mbps)
6 channels: 44.1 x 16 kHz / 1 bit (4.234 Mbps)
For example, if it is compressed to 1/2,
6 channels: 88.2 x 16 kHz x 1/2/1 bit (4.234 Mbps)
Can be quantized. Therefore, in this case, since the sampling frequency of a multi-channel signal having a large amount of data can be made the same as that of a 2-channel signal, recording can be performed with the same frequency band of 2 channels and 6 channels.
[0103]
【The invention's effect】
As described above, according to the first invention, copy management data is recorded on a disc when both 2-channel or narrowband audio data and multi-channel or broadband audio data are transmitted. Since at least the copy of the multi-channel audio source is managed, the problem of the copy protection can be solved.
According to the second aspect of the invention, when transmitting both 2-channel or narrowband audio data and multi-channel or broadband high-quality audio data, copy management data is recorded on the disk, and at least Since a copy of an audio source recorded by A / D conversion at a relatively high sampling frequency is managed, the problem of copy protection can be solved.
[Brief description of the drawings]
FIG. 1 is an explanatory diagram showing an embodiment of a DVD-video format and a DVD-audio format according to the present invention.
FIG. 2 is an explanatory diagram showing in detail the format of the audio manager (AMG) in FIG. 1;
FIG. 3 is an explanatory diagram showing in detail the format of the audio title set (ATS) of FIG. 1;
4 is an explanatory diagram showing in detail the format of audio manager information (AMGI) in FIG. 2; FIG.
FIG. 5 is an explanatory diagram showing in detail the format of the audio title set attribute table (ATS-ATRT) of FIG. 4;
6 is an explanatory diagram showing in detail the format of audio title set attribute data (ATS-ATR) in FIG. 5; FIG.
7 is an explanatory diagram showing in detail the format of audio title set information (ATSI) in FIG. 3; FIG.
8 is an explanatory diagram showing in detail the format of the audio title set information management table (ATSI-MAT) in FIG. 7; FIG.
9 is an explanatory diagram showing in detail the audio title set menu, audio stream, and attribute data (ATSM-AST-ATR) in FIG. 8. FIG.
10 is an explanatory diagram showing in detail the format of the audio title set / audio stream / attribute table (ATS-AST-ATRT) of FIG. 8; FIG.
FIG. 11 is an explanatory diagram showing in detail the attribute data (ATS-AST-ATR) of each audio stream in FIG. 10;
12 is an explanatory diagram showing an audio content block unit (ACBU) in FIG. 1; FIG.
13 is an explanatory diagram showing in detail the format of the audio pack and video pack of FIG. 12; FIG.
14 is an explanatory diagram showing in detail the format of the audio control (A-CONT) pack of FIG. 12; FIG.
15 is an explanatory diagram showing in detail the format of the audio character display (ACD) area of FIG. 14. FIG.
16 is an explanatory diagram showing an example displayed by the name space information of FIG.
FIG. 17 is an explanatory diagram showing in detail the format of the audio search data (ASD) area of FIG. 14;
18 is an explanatory diagram showing a modification of the audio content block unit in FIG. 1. FIG.
FIG. 19 is a block diagram showing an audio data encoding apparatus according to the present invention.
FIG. 20 is an explanatory diagram showing 2-channel and multi-channel sampling frequencies and the number of quantization bits recorded on the audio disc according to the present invention.
FIG. 21 is an explanatory diagram showing copy management data recorded on an audio disc according to the present invention.
22 is an explanatory diagram showing in detail the CGMCAPS code in FIG. 21;
FIG. 23 is a block diagram illustrating an audio data decoding device.
24 is a flowchart showing playback processing of the playback device of FIG. 23. FIG.
FIG. 25 is a flowchart showing copy processing according to the present invention.
FIG. 26 is an explanatory diagram showing 2-channel and multi-channel sampling frequencies and the number of quantization bits in a modification of the first embodiment.
FIG. 27 is an explanatory diagram showing a lead-in area in a modification of the first embodiment.
28 is an explanatory diagram showing in detail the copyright information area of FIG. 27. FIG.
FIG. 29 is an explanatory diagram showing 2-channel and multi-channel sampling frequencies and the number of quantization bits in another modification of the first embodiment;
FIG. 30 is an explanatory diagram showing 2-channel and multi-channel sampling frequencies and the number of quantization bits in still another modification of the first embodiment;
FIG. 31 is an explanatory diagram showing a basic format of a DVD-Van disk as a second embodiment.
32 is an explanatory diagram showing an ACBU and a VCBU according to the embodiment of FIG. 31;
FIG. 33 is an explanatory diagram illustrating another example of ACD (audio character display) information according to the second embodiment.
FIG. 34 is an explanatory diagram showing ASD (audio search data) according to the second embodiment;
FIG. 35 is an explanatory diagram showing the CONT pack of FIG. 31 in detail.
FIG. 36 is an explanatory diagram showing the PCI data of FIG. 34 in detail.
FIG. 37 is an explanatory diagram showing the PCI general information of FIG. 36 in detail.
38 is an explanatory diagram showing in detail the recording information of FIG. 36. FIG.
FIG. 39 is an explanatory diagram showing the DSI in FIG. 35 in detail.
40 is an explanatory diagram showing the DSI general information of FIG. 39 in detail.
41 is an explanatory diagram showing in detail the seamless playback information of FIG. 39. FIG.
42 is an explanatory diagram showing a concept of seamless angle change by the seamless angle information of FIG. 39. FIG.
43 is an explanatory diagram showing an example of the VOBU search information of FIG. 39. FIG.
44 is an explanatory diagram showing the VOBU search information of FIG. 39 in detail.
45 is an explanatory diagram showing the synchronization information of FIG. 39 in detail.
FIG. 46 is an explanatory diagram showing a configuration of a lead-in area according to the first and second embodiments.
47 is an explanatory diagram showing in detail the control data block of FIG. 46; FIG.
48 is an explanatory diagram showing in detail the physical format information of FIG. 47. FIG.
FIG. 49 is an explanatory diagram showing the format of an audio pack in the audio disc according to the invention.
FIG. 50 is a block diagram illustrating an encoding apparatus according to an embodiment that transmits an audio signal via a communication line.
FIG. 51 is a flowchart showing a process for transmitting an audio signal via a communication line.
FIG. 52 is a flowchart showing a process for receiving an audio signal via a communication line.
FIG. 53 is a block diagram for explaining a quantization method and an inverse quantization method of a PCM method and a 1-bit stream method.
[Explanation of symbols]
1, 4 A / D converter
2,14 Signal processing circuit
3, 15 memory
5 V encoder
6 DVD formatting part (formatting means)
7 Content encryption part
8 Modulation circuit
11 Demodulator circuit
12 Scramble decoding unit
13 DVD Formatting Department
16 D / A converter
17 V decoder
18 Control unit (copy management means)

Claims (2)

アナログ音声信号がマルチチャネルの前方のチャネルと後方用のチャネル毎に異なるサンプリング周波数でサンプリングされ、かつ前方のチャネルと後方用のチャネル毎に異なる量子化ビット数で量子化されたデジタル音声信号として記録され、更に、前記マルチチャネルと同一又は異なるサンプリング周波数及び量子化ビット数で量子化され、ステレオ用の2チャネルのデジタル音声信号として記録されるオーディオエリアと、
前記オーディオエリアに記録されているデジタル音声信号の前方のチャネルと後方用のチャネル毎のサンプリング周波数および量子化ビット数が記録される量子化制御情報エリアと、
前記オーディオエリアに記録されているマルチチャネルとステレオ用の2チャネルのデジタル音声信号のコピーを管理するコピー管理データが記録されるコピー管理データエリアと、
前記デジタル音声信号のタイトルをサーチするためのサーチ情報が記録されるタイトルサーチ情報エリアと、
前記デジタル音声信号のタイトルのメニューの管理情報が記録されるオーディオ・マネージャ・メニューのエリア(AMGM)とを、
所定のフォーマットによりフォーマット化するステップを、有するオーディオデータのエンコード方法。
An analog audio signal is recorded as a digital audio signal that is sampled at a different sampling frequency for each of the front channel and the rear channel of the multi-channel and quantized with a different number of quantization bits for each of the front channel and the rear channel. An audio area that is quantized with the same or different sampling frequency and number of quantization bits as the multi-channel, and recorded as a stereo 2-channel digital audio signal;
A quantization control information area in which the sampling frequency and the number of quantization bits for each of the front channel and the rear channel of the digital audio signal recorded in the audio area are recorded;
A copy management data area for recording copy management data for managing a copy of a digital audio signal of two channels for multi-channel and stereo recorded in the audio area;
A title search information area in which search information for searching for a title of the digital audio signal is recorded;
An audio manager menu area (AMGM) in which management information of the menu of the title of the digital audio signal is recorded;
An audio data encoding method comprising the step of formatting according to a predetermined format.
請求項1記載のオーディオデータのエンコード方法により記録されたオーディオ信号をデコードして、前記コピー管理データに基づいて前記オーディオエリアに記録されているマルチチャネルとステレオ用の2チャネルのデジタル音声信号のコピーを管理するステップを、有するオーディオデータのデコード方法。5. A multi-channel and stereo 2-channel digital audio signal recorded in the audio area based on the copy management data by decoding an audio signal recorded by the audio data encoding method according to claim 1. A method of decoding audio data, comprising the step of managing:
JP2003119932A 1998-03-24 2003-04-24 Audio data encoding method and decoding method Expired - Lifetime JP4055129B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003119932A JP4055129B2 (en) 1998-03-24 2003-04-24 Audio data encoding method and decoding method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP9550898 1998-03-24
JP10-95508 1998-03-24
JP2003119932A JP4055129B2 (en) 1998-03-24 2003-04-24 Audio data encoding method and decoding method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP32747098A Division JP3444212B2 (en) 1998-03-24 1998-11-02 Audio disc and decoding device

Related Child Applications (8)

Application Number Title Priority Date Filing Date
JP2003180925A Division JP4055144B2 (en) 1998-03-24 2003-06-25 Audio data recording method and audio data decoding method
JP2003180923A Division JP4055142B2 (en) 1998-03-24 2003-06-25 Audio data recording method and audio data decoding method
JP2003180922A Division JP4072767B2 (en) 1998-03-24 2003-06-25 Audio disc and audio data decoding method
JP2003180926A Division JP4055145B2 (en) 1998-03-24 2003-06-25 Audio disc and audio data decoding method
JP2003180929A Division JP4055148B2 (en) 1998-03-24 2003-06-25 Audio data recording method and audio data decoding method
JP2003180928A Division JP4055147B2 (en) 1998-03-24 2003-06-25 Audio disc and audio data decoding method
JP2003180927A Division JP4055146B2 (en) 1998-03-24 2003-06-25 Audio data recording method and audio data decoding method
JP2003180924A Division JP4055143B2 (en) 1998-03-24 2003-06-25 Audio disc and audio data decoding method

Publications (2)

Publication Number Publication Date
JP2003331512A JP2003331512A (en) 2003-11-21
JP4055129B2 true JP4055129B2 (en) 2008-03-05

Family

ID=29713536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003119932A Expired - Lifetime JP4055129B2 (en) 1998-03-24 2003-04-24 Audio data encoding method and decoding method

Country Status (1)

Country Link
JP (1) JP4055129B2 (en)

Also Published As

Publication number Publication date
JP2003331512A (en) 2003-11-21

Similar Documents

Publication Publication Date Title
JP3444212B2 (en) Audio disc and decoding device
JP4055144B2 (en) Audio data recording method and audio data decoding method
JP4055129B2 (en) Audio data encoding method and decoding method
JP4055137B2 (en) Audio data recording method and decoding method
JP4055138B2 (en) Audio data recording method and decoding method
JP4055130B2 (en) Audio data encoding method and decoding method
JP4055133B2 (en) Audio data encoding method and decoding method
JP4055140B2 (en) Audio data recording method and decoding method
JP4055134B2 (en) Audio data encoding method and decoding method
JP4055132B2 (en) Audio data encoding method and decoding method
JP4055135B2 (en) Audio data encoding method and decoding method
JP4055146B2 (en) Audio data recording method and audio data decoding method
JP4055136B2 (en) Audio data encoding method and decoding method
JP4055148B2 (en) Audio data recording method and audio data decoding method
JP4055131B2 (en) Audio data encoding method and decoding method
JP4055139B2 (en) Audio data recording method and decoding method
JP4055143B2 (en) Audio disc and audio data decoding method
JP4055145B2 (en) Audio disc and audio data decoding method
JP4055142B2 (en) Audio data recording method and audio data decoding method
JP4055147B2 (en) Audio disc and audio data decoding method
JP4072767B2 (en) Audio disc and audio data decoding method
JP3738936B2 (en) Audio disc and playback device therefor
JP3741130B2 (en) Audio disc and playback device therefor
JP3741123B2 (en) Audio disc and playback device therefor
JP3741125B2 (en) Audio disc and playback device therefor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071129

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131221

Year of fee payment: 6

EXPY Cancellation because of completion of term