JP3603868B2 - Audio signal encoding method, audio signal transmission / reception method, recording medium for computer program, and audio signal decoding method - Google Patents

Audio signal encoding method, audio signal transmission / reception method, recording medium for computer program, and audio signal decoding method Download PDF

Info

Publication number
JP3603868B2
JP3603868B2 JP2002022905A JP2002022905A JP3603868B2 JP 3603868 B2 JP3603868 B2 JP 3603868B2 JP 2002022905 A JP2002022905 A JP 2002022905A JP 2002022905 A JP2002022905 A JP 2002022905A JP 3603868 B2 JP3603868 B2 JP 3603868B2
Authority
JP
Japan
Prior art keywords
audio
data
ats
pack
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002022905A
Other languages
Japanese (ja)
Other versions
JP2002304850A (en
JP2002304850A5 (en
Inventor
美昭 田中
昭治 植野
徳彦 渕上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2002022905A priority Critical patent/JP3603868B2/en
Publication of JP2002304850A publication Critical patent/JP2002304850A/en
Application granted granted Critical
Publication of JP3603868B2 publication Critical patent/JP3603868B2/en
Publication of JP2002304850A5 publication Critical patent/JP2002304850A5/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、オーディオ信号のエンコード方法、オーディオ信号送信受信方法、コンピュータプログラムの記録媒体、及びオーディオ信号のデコード方法に関する。
【0002】
【従来の技術】
従来のオーディオ再生用光ディスクとしてはCD(コンパクトディスク)が知られている。また、CDより高密度な光ディスクとしてDVD(デジタルビデオディスク)が知られている。
【0003】
【発明が解決しようとする課題】
しかしながら、DVD(以下、DVD−ビデオ)ではビデオ信号が主、オーディオ信号が従として記録されるので、次のような問題点がある。
(1)オーディオ信号がビデオ信号と一体化されており、オーディオ信号の記録容量が少ない。
(2)オーディオ信号の時間を管理することができない。
(3)曲名などの簡単な文字情報を取り出すことができない。
【0004】
また、ビデオに比べて、オーディオのユーザは使い方の層が幅広いので、CDのようにTOC(テーブルオブコンテンツ)の領域を設けることにより簡易な再生方法が求められる。しかしながら、DVD−ビデオでは、ナビゲーションコントロールパック(CONTパック)と複数のビデオ(V)パック及びオーディオ(A)パックによりビデオコンテンツブロックユニットを構成してV、Aパックの再生などをCONTパックにより制御するので、オーディオ信号を主として記録しようとしてもユーザにとって簡易に再生することができず、使い勝手が悪いという問題点がある。
【0005】
また、DVD−ビデオでは、時間管理をビデオフレーム単位でのみ行うので、オーディオ信号を主として記録しようとしても、ビデオに比べてオーディオ信号は連続性が重要であるので実時間の管理が困難であるという問題点がある。
【0006】
そこで、本発明は、オーディオ信号を主として記録する場合にユーザにとって簡易に再生することができて使い勝手がよく、また、実時間の管理を簡単にすることができるオーディオ信号のエンコード方法、オーディオ信号送信受信方法、コンピュータプログラムの記録媒体、及びオーディオ信号のデコード方法を提供することを目的とする。
【0007】
【課題を解決するための手段】
本発明は上記目的を達成するために、以下の1)〜4)に記載の手段よりなる。
すなわち、
【0008】
1)マルチチャネルのアナログオーディオ信号の第1のグループのチャネルと第2のグループのチャネルとでそれぞれ同一または異なる第1及び第2のサンプリング周波数(fs1、fs2)によりグループ別にA/D変換してオーディオデータを生成するステップと、
複数のオーディオオブジェクト(AOB)を含むオーディオタイトルセット(ATS)と、スチルピクチャセット(SPS)とを有し、
前記オーディオオブジェクト(AOB)が、
実データとして前記オーディオデータを有する第1のパックのみにより構成された第1のタイプのオーディオ・セル(ATS−C)から構成される第1のオーディオオブジェクト(AOB)と、
前記第1のパック、及び実データとして前記オーディオデータに関するリアルタイムインフォメーションデータを有する第2のパックにより構成された第2のタイプのオーディオ・セル(ATS−C)から構成される第2のオーディオオブジェクト(AOB)の2種類で構成され、
さらに、前記スチルピクチャセット(SPS)が前記オーディオデータに関するスチルピクチャデータを含む第3のパックを有し、
前記オーディオタイトルセット(ATS)は前記オーディオ・セル(ATS−C)のタイプを識別するタイプ識別データ(ATS−C−TY)を含むと共に前記複数のオーディオオブジェクト(AOB)が所定の再生順に再生されるための制御情報であってオーディオ・セル単位で再生制御するためのオーディオ・セル・プレイバック・インフォメーション(ATS−C−PBI)を有する制御情報(ATS−PGCIT)を含むオーディオタイトルセット・インフォメーション(ATSI)が配置され、このオーディオタイトルセット・インフォメーション(ATSI)は、前記スチルピクチャセット(SPS)内のスチルピクチャデータをページ制御する制御情報であってシーケンシャル再生モード(シーケンシャル)とランダム再生モード(ランダム)とを識別するモードデータ(ディスプレイオーダーモード)を含むスチルピクチャ制御情報(SPCIT)を有しており、
さらに、前記第1のパック内には前記オーディオデータが記録されるパケットを有し、前記パケットにはさらに前記オーディオデータの第1及び第2のサンプリング周波数(fs1、fs2)が記録されるプライベートヘッダを有するように構成される、
データ構造にフォーマット化するステップと、
からなるオーディオ信号のエンコード方法
2)1)に記載のオーディオ信号のエンコード方法によりエンコードされて生成されたデータ構造のデータを送信または受信するオーディオ信号送信受信方法であって、
前記データを所定の通信フォーマットに変換して送信し、または前記所定の通信フォーマットに変換されたデータを受信して元のデータに復元するステップを有するオーディオ信号送信受信方法。
3)1)に記載のオーディオ信号のエンコード方法によりエンコードされて生成されたデータ構造が記録されたデータをデコードするコンピュータプログラムが記録されたコンピュータプログラムの記録媒体であって、
前記記録されたオーディオタイトルセット(ATS)に配置されるオーディオタイトルセット・インフォメーション(ATSI)からスチルピクチャのモードデータ(ディスプレイオーダーモード)を含むスチルピクチャ制御情報(SPCIT)をデコードしてモードデータ(ディスプレイオーダーモード)を取り出す第1のデコードのステップと、
前記記録されたオーディオタイトルセット(ATS)に配置される第1のパック、及び第2のパック、さらにスチルピクチャセット(SPS)に配置される第3のパックを識別する第2のデコードのステップと、
前記第2のデコードのステップから取り出されたそれぞれのパックからオーディオデータ、リアルタイムインフォメーションデータ、及びスチルピクチャデータをデコードする第3のデコードのステップと、
少なくとも前記第1のデコードのステップから取り出されたモードデータ(ディスプレイオーダーモード)に基づいて前記第2のデコードのステップで取り出されたスチルピクチャデータを、制御して単独で/または前記オーディオデータと共に出力するステップとを、有するコンピュータプログラムの記録媒体。
4)1)に記載のオーディオ信号のエンコード方法によりエンコードされて生成されたデータ構造が記録されたデータをデコードするオーディオ信号のデコード方法であって、
前記記録されたオーディオタイトルセット(ATS)に配置されるオーディオタイトルセット・インフォメーション(ATSI)からスチルピクチャのモードデータ(ディスプレイオーダーモード)を含むスチルピクチャ制御情報(SPCIT)をデコードしてモードデータ(ディスプレイオーダーモード)を取り出す第1のデコードのステップと、
前記記録されたオーディオタイトルセット(ATS)に配置される第1のパック、及び第2のパック、さらにスチルピクチャセット(SPS)に配置される第3のパックを識別する第2のデコードのステップと、
前記第2のデコードのステップから取り出されたそれぞれのパックからオーディオデータ、リアルタイムインフォメーションデータ、及びスチルピクチャデータをデコードする第3のデコードのステップと、
少なくとも前記第1のデコードのステップから取り出されたモードデータ(ディスプレイオーダーモード)に基づいて前記第2のデコードのステップで取り出されたスチルピクチャデータを、制御して単独で/または前記オーディオデータと共に出力するステップとを、有するオーディオ信号のデコード方法
【0009】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。図1はDVD−ビデオのフォーマットと、本発明に適用されるDVD−オーディオのフォーマットの一実施形態を示す説明図、図2は図1のオーディオマネージャ(AMG)のフォーマットを詳しく示す説明図、図3は図1のオーディオタイトルセット(ATS)のフォーマットを詳しく示す説明図、図4は図2のオーディオマネージャインフォメーション(AMGI)のフォーマットを詳しく示す説明図、図5は図4のオーディオタイトルセット・アトリビュートテーブル(ATS−ATRT)のフォーマットを詳しく示す説明図、図6は図5のオーディオタイトルセット・アトリビュートデータ(ATS−ATR)のフォーマットを詳しく示す説明図、図7は図3のオーディオタイトルセットインフォメーション(ATSI)のフォーマットを詳しく示す説明図、図8は図7のオーディオタイトルセットインフォメーション・マネージメントテーブル(ATSI−MAT)のフォーマットを詳しく示す説明図、図9は図8のオーディオタイトルセットメニュー・オーディオストリーム・アトリビュートデータ(ATSM−AST−ATR)を詳しく示す説明図、図10は図8のオーディオタイトルセット・オーディオストリーム・アトリビュートテーブル(ATS−AST−ATRT)のフォーマットを詳しく示す説明図、図11は図10の各オーディオストリームのアトリビュートデータ(ATS−AST−ATR)を詳しく示す説明図である。
【0010】
また、図12は図1のオーディオコンテンツブロックユニット(ACBU)を示す説明図、図13は図12のオーディオパックとビデオパックのフォーマットを詳しく示す説明図、図14は図12のオーディオコントロール(A−CONT)パックのフォーマットを詳しく示す説明図、図15は図14のオーディオキャラクタディスプレイ(ACD)エリアのフォーマットを詳しく示す説明図、図16は図15のネームスペース情報により表示される例を示す説明図、図17は図14のオーディオサーチデータ(ASD)エリアのフォーマットを詳しく示す説明図、図18は図1のオーディオコンテンツブロックユニットの変形例を示す説明図である。
【0011】
ここで、この説明のDVD−オーディオディスクには、CD世代からDVD−オーディオ世代に移行する際の過渡期に対応するように、オーディオ信号としてステレオ用2チャネルと5/6/8チャネルのマルチチャネルの両方の信号が記録される。また、この過渡期が経過したときには5/6/8チャネルのマルチチャネル信号のみが記録されるようになると考えられる。また、マルチチャネル信号のみが記録された場合であっても、再生時にはダウンミックスの係数によりマルチチャネル信号から2チャネル信号を生成することが可能である。この生成された2チャネル信号は簡易再生として位置づけられる。
【0012】
図1(a)、(b)はそれぞれDVD−ビデオ、DVD−オーディオの各フォーマットを示し、DVD−オーディオのフォーマットはエリアの名称が異なるがDVD−ビデオと互換性を有する。まず、大別してDVD−ビデオのフォーマットは先頭のビデオマネージャ(VMG)と、それに続く複数のビデオタイトルセット(VTS)の各エリアにより構成され、他方、DVD−オーディオのフォーマットはこれに対応して図2に詳しく示すオーディオマネージャ(AMG)と、図3に詳しく示すようにAMGに続く複数のオーディオタイトルセット(ATS)の各エリアにより構成されている。
【0013】
VTSの各々は先頭のVTSインフォメーション(VTSI)と、それに続く1以上のビデオコンテンツブロックセット(VCBS)と最後のVTSIにより構成され、他方、ATSの各々はこれに対応して先頭のATSインフォメーション(ATSI)と、それに続く1以上のオーディオコンテンツブロックセット(ACBS)と最後のATSIにより構成されている。ATSIには、ACBS内の各曲の演奏時間が実時間でセットされる。
本発明では、最初のACBSにはメニュー画面を表示するためのメニュー情報が記録される。これはDVDビデオと同様のものであり説明を省く。
【0014】
VCBSの各々は複数のVCBにより構成され、他方、ACBSの各々は複数のACBにより構成されている。VCBの各々はビデオの1タイトル(Title)分であり、ACBの各々はこれに対応してオーディオの1タイトル分である。VCBの各々(1タイトル)は複数のチャプタ(Chapter)により構成され、他方、ACBの各々(1タイトル)はこれに対応して複数のトラック(Track)により構成されている。チャプタはパートオブタイトル(PTT)を含み、トラックはパートオブタイトル(PTT)を含む。
【0015】
チャプタの各々は複数のセル(CELL)により構成され、他方、トラックの各々はこれに対応して複数のインデックス(Index)により構成されている。セルの各々は複数のVCBユニット(VCBU)により構成され、他方、インデックスの各々はこれに対応して複数のACBユニット(ACBU)により構成されている。VCBユニットとACBユニットの各々は、複数のパックにより構成され、1パックは2048バイトで構成されている。
【0016】
VCBユニットの各々は、先頭のコントロールパック(以下、CONTパック)と、それに続くオーディオ(A)パック、複数のビデオ(V)パック、及びサブピクチャ(SP)パックにより構成され、他方、ACBユニットの各々は、これに対応して先頭のオーディオコントロールパック(以下、A−CONTパック)と、それに続く複数のAパックとVパックにより構成されている。
【0017】
CONTパックには後続のVパックを制御する情報が配置され、A−CONTパックにはCDのTOC情報のように後続のAパックのオーディオ信号を管理するための情報が配置される。Aパックにはオーディオデータが配置され、Vパックにはビデオデータの他、オーディオデータ以外の例えばクローズドキャプション(CC)データが配置される。
【0018】
AMG(オーディオマネージャ)は図2に示すように、
・図4に詳しく示すオーディオマネージャインフォメーション(AMGI)と、
・AMGメニュー用のオーディオコンテンツブロックセット(AMGM−ACBS)と、
・バックアップ用のAMGI
を有する。AMGM−ACBSはコントロール情報として
・プレゼンテーションコントロールインフォメーション(PCI)と、
・データサーチインフォメーション(DSI)
を有する。
【0019】
ATS(オーディオタイトルセット)は図3に示すように、
・図7に詳しく示すオーディオタイトルセットインフォメーション(ATSI)と、
・ATSメニュー用のオーディオコンテンツブロックセット(ATSM−ACBS)と、
・ATSタイトル用のオーディオコンテンツブロックセット(ATSA−ACBS)と、
・バックアップ用のATSI
を有する。ATSM−ACBSとATSA−ACBSは共に、前述(図2)したPCIとDSIを有する。
【0020】
AMGI(オーディオマネージャインフォメーション)は図4に詳しく示すように、
・AMGIのマネージメントテーブル(AMGI−MAT)と、
・タイトルのサーチポインタテーブル(T−SRPT)と、
・オーディオマネージャメニューPGCIユニットテーブル(AMGM−PGCI−UT)と、
・ペアレンタルマネージメントインフォメーションテーブル(PTL−MAIT)と、
・図5に詳しくオーディオタイトルセット・アトリビュートテーブル(ATS−ATRT)と、
・テキストデータマネージャ(TXTDT−MG)と、
・オーディオマネージャメニューセル(インデックス)アドレステーブル(AMGM−C−ADT)と、
・オーディオマネージャメニュー・オーディオコンテンツブロックユニット・アドレスレスマップ(AMGM−ACBU−ADMAP)
を有する。
【0021】
ATS−ATRT(オーディオタイトルセット・アトリビュートテーブル)は図5に詳しく示すように、
・オーディオタイトルセットアトリビュートテーブルインフォメーション(ATS−ATRTI)と、
・複数(n)個のATSの各々のオーディオタイトルセットアトリビュートサーチポインタ(ATS−ATR−SRP#1〜#n)と、
・図6に詳しく示すような複数(n)個のATSの各々のオーディオタイトルセット・アトリビュートデータ(ATS−ATR−#1〜#n)
を有する。
【0022】
オーディオタイトルセット・アトリビュートデータ(ATS−ATR−#1〜#n)の各々は、図6に詳しく示すように
・ATS−ATR−EA(エンドアドレス)と、
・ATS−CAT(カテゴリ)と、
・ATS−ATRI(インフォメーション)
を有する。
【0023】
図3に示すATSI(ATSインフォメーション)は図7に詳しく示すように、
・図8に詳しく示すオーディオタイトルセットインフォメーション・マネージメントテーブル(ATSI−MAT)と、
・オーディオタイトルセット・パートオブタイトル・サーチポインタテーブル(ATS−PTT−SRPT)と、
・オーディオタイトルセット・プログラムチェーンインフォメーションテーブル(ATS−PGCIT)と、
・オーディオタイトルセットメニュー・PGCI・ユニットテーブル(ATSM−PGCI−UT)と、
・オーディオタイトルセット・タイムマップテーブル(ATS−TMAPT)と、
・オーディオタイトルセットメニュー・セル・アドレステーブル(ATSM−C−ADT)と、
・オーディオタイトルセットメニュー・オーディオコンテンツブロックユニット・アドレスマップ(ATSM−ACBU−ADMAP)と、
・オーディオタイトルセット・セル・アドレステーブル(ATS−C−ADT)と、
・オーディオタイトルセット・オーディオコンテンツブロックユニット・アドレスマップ(ATS−ACBU−ADMAP)
を有する。
【0024】
図7に示すATSI−MAT(オーディオタイトルセットインフォメーション・マネージメントテーブル)は図8に詳しく示すように、
・ATS−ID(識別子)と、
・ATS−EA(エンドアドレス)と、
・ATSI−EAと、
・VERN(DVDオーディオスペックのバージョン番号)と、
・ATS−CAT(カテゴリ)と、
・ATSI−MAT−EAと、
・ATSM−ACBS−SA(スタートアドレス)と、
・ATSA−ACBS−SAと、
・ATS−PTT−SRPT−SAと、
・ATS−PGCIT−SAと、
・ATSM−PGCI−UT−SAと、
・ATS−TMAP−SAと、
・ATSM−C−ADT−SAと、
・ATSM−ACBU−ADMAP−SAと、
・図9に詳しく示すようなATSM−AST−ATR(ATSMのオーディオストリーム・アトリビュート)と、
・ATS−AST−Ns(ATSのオーディオストリームの数)と、
・図10に詳しく示すようなATS−AST−ATRT(ATSのオーディオストリーム・アトリビュートテーブル)
を有する。
【0025】
ATSM−AST−ATRは図9に詳しく示すように8バイト(ビットb63〜b0)により構成され、このディスクに記録されている符号化オーディオ信号の属性として次のようなデータ(1)〜(4)が配置される(他のビットは保留)。
【0026】
(1)オーディオ符号化モード(3ビットb63〜b61)
000b:ドルビーAC−3
010b:MPEG−1又はMPEG−2(拡張ビットストリーム無し)
011b:MPEG−2(拡張ビットストリーム有り)
100b:リニヤPCMオーディオ
101b:リニヤPCMオーディオ(2ch+5ch、2ch+6ch、2ch+8chを含む。)
【0027】
(2)量子化/DRC(ダイナミックレンジコントロール)情報(2ビットb55、b54)
・オーディオ符号化モードが「000b」の場合には「11b」
・オーディオ符号化モードが「010b」又は「011b」の場合、
00b:MPEGオーディオストリーム内にダイナミックレンジコントロールデータが存在しない
01b:MPEGオーディオストリーム内にダイナミックレンジコントロールデータが存在する
10b,11b:保留
・オーディオ符号化モードが「100b」、「101b」の場合、ステレオ2chに対して
00b:16ビット
01b:20ビット
10b:24ビット
11b:保留
【0028】
(3)サンプリング周波数fs(2ビットb53、b52)
ステレオ2chに対して
00b:48kHz
01b:96kHz
10b:192kHz
(4)オーディオチャネル数(3ビットb50〜b48)
000b:1ch(モノラル)
001b:2ch(ステレオ)
010b:3ch
011b:4ch
100b:(ステレオ2ch+5ch)
101b:(ステレオ2ch+6ch)
110b:7ch
111b:(ステレオ2ch+8ch)
【0029】
図10に示すATS−AST−ATRT(ATSのオーディオストリーム・アトリビュートテーブル)は図11に詳しく示すように、オーディオストリーム#0〜#7毎のATS−AST−ATRを有し、ATS−AST−ATRの各々は8バイトで構成されている(合計64バイト)。
【0030】
1つのオーディオストリームのATS−AST−ATRは図11に示すように、図9に示すオーディオタイトルセットメニュー・オーディオストリーム・アトリビュートデータ(ATSM−AST−ATR)と同様な8バイト(ビットb63〜b0)で構成され、上記属性データ(1)〜(4)の他に、
(5)マルチチャネル・イクステンション(1ビットb60)と、
(6)オーディオタイプ(2ビットb59、b58)と、
(7)オーディオアプリケーションモード(2ビットb57、b56)と、
(8)そのストリーム(AST)の間引き情報(2ビットb47、b46)と、
(9)LFE(Low Frequency Effect)1chのみの間引き情報(2ビットb45、b44)
の各データを有する。そして、このDVDオーディオディスクの(7)オーディオアプリケーションモードには、
11b:2ch+サラウンドモード
が記録され、また、(8)そのストリームの間引き情報と、(9)LFE1chのみの間引き情報には共に、帯域情報として
00b:フル(1/1)
01b:ハーフ(1/2)
10b:クオータ(1/4)
が記録される。
【0031】
ただし、このATSM−AST−ATRにおける(4)オーディオチャネル数は、オーディオストリーム#0では必ず2chとなり、また、オーディオストリーム#1はフロントの3chを含む。すなわち、例えば1つのタイトルのオーディオ信号を2+6chで記録する場合、2chのステレオ信号をオーディオストリーム#0に割り当て、6chの内、3chのフロント信号をオーディオストリーム#1に割り当て、2chのリヤ信号とLFE1ch信号をオーディオストリーム#2に割り当てる。そして、図4に示すオーディオマネージャインフォメーション・マネージメントテーブル(AMGI−MAT)と図8に示すオーディオタイトルセットインフォメーション・マネージメントテーブル(ATSI−MAT)には共に、ストリーム#0〜#2の利用データとして「3」が記録される。
【0032】
また、この2+6chのアナログオーディオ信号を例えば次のようなサンプリング周波数fsでサンプリングし、次のような量子化ビット数で量子化して記録する場合、
ステレオ2ch :48kHz、20ビット
フロント3ch :96kHz、16ビット
リヤ2ch、LFE1ch:48kHz、16ビット(間引きなし)
図9に示すオーディオタイトルセットメニュー・オーディオストリーム・アトリビュートデータ(ATSM−AST−ATR)にはステレオ2chの属性として
(1)オーディオ符号化モード
101b:リニヤPCMオーディオ(2ch+5ch、2ch+6ch、2ch+8chを含む。)
(2)量子化/DRC
01b:20ビット
(3)サンプリング周波数fs
00b:48kHz
(4)オーディオチャネル数
101b:(ステレオ2ch+6ch)
が記録される。
【0033】
また、オーディオストリーム#0のATS−AST−ATRには
(1)オーディオ符号化モード
101b:リニヤPCMオーディオ(2ch+5ch、2ch+6ch、2ch+8chを含む。)
(2)量子化/DRC
01b:20ビット
(3)サンプリング周波数fs
00b:48kHz
(4)オーディオチャネル数
001b:2ch(ステレオ)
(7)オーディオアプリケーションモード
11b:2ch+サラウンドモード
(8)そのストリームの間引き情報
00b:フル(1/1)
(9)LFE1chのみ間引き情報
00b:フル(1/1)
が記録される。
【0034】
また、オーディオストリーム#1のATS−AST−ATRには
(1)オーディオ符号化モード
101b:リニヤPCMオーディオ(2ch+5ch、2ch+6ch、2ch+8chを含む。)
(2)量子化/DRC
00b:16ビット
(3)サンプリング周波数fs
01b:96kHz
(4)オーディオチャネル数
010b:3ch
(7)オーディオアプリケーションモード
11b:2ch+サラウンドモード
(8)そのストリームの間引き情報
00b:フル(1/1)
(9)LFE1chのみ間引き情報
00b:フル(1/1)
が記録される。
【0035】
また、オーディオストリーム#2のATS−AST−ATRには
(1)オーディオ符号化モード
101b:リニヤPCMオーディオ(2ch+5ch、2ch+6ch、2ch+8chを含む。)
(2)量子化/DRC
00b:16ビット
(3)サンプリング周波数fs
00b:48kHz
(4)オーディオチャネル数
010b:3ch
(7)オーディオアプリケーションモード
11b:2ch+サラウンドモード
(8)そのストリームの間引き情報
00b:フル(1/1)
(9)LFE1chのみ間引き情報
00b:フル(1/1)
が記録される。
【0036】
次に、オーディオストリームが記録されるAパックとその制御パックについて説明する。図12に示すようにVCBユニットは0.4〜1.0秒分の任意の数のパックにより構成され、ACBユニットは0.5〜1.0秒分の任意の数のパックにより構成されている。また、DVD−オーディオのACBユニットにおけるA−CONTパックは、DVD−ビデオのVCBユニットにおける第3パックに配置される。
【0037】
A−CONTパックは基本的にオーディオ時間の0.5秒単位に配置され、インデックスの切れ目では0.5〜1.0秒の範囲で完結するように配置される。また、オーディオの時間(GOF:Group of Audio Frame単位)はA−CONTパックにより示され、そのデータ位置はオーディオフレームナンバと、ファーストアクセスユニットポインタとフレームヘッダの数により決まる。また、A−CONTパック直前のAパックは、オーディオ時間の0.5秒単位でパディングすることを強制しない。
【0038】
隣接するAパックは、オーディオ信号がお互いに関連するように配置され、例えばステレオの場合にはLチャネルパックとRチャネルパックが隣接して配置され、また、5/6/8チャネルのマルチチャネルの場合にも同様に隣接して配置される。Vパックはオーディオ信号の再生時に映像を表示する場合にそのAパックに隣接して配置される。AパックとVパックは、図13に示すように2034バイトのユーザデータ(Aデータ、Vデータ)に対して4バイトのパックスタート情報と、6バイトのSCR(System Clock Reference:システム時刻基準参照値)情報と、3バイトのMux レート(rate)情報と1バイトのスタッフィングの合計14バイトのパックヘッダが付加されて構成されている(1パック=合計2048バイト)。この場合、タイムスタンプであるSCR情報を、ACBユニット内の先頭パックでは「1」として同一タイトル内で連続とすることにより同一タイトル内のAパックの時間を管理することができる。
【0039】
これに対し、A−CONTパックは図14に示すように、14バイトのパックヘッダと、24バイトのシステムヘッダと、1003バイトのACD(オーディオキャラクタディスプレイ)パケットと、1007バイトのASD(オーディオサーチデータ)パケットにより構成されている。また、ACDパケットは6バイトのパケットヘッダと、1バイトのサブストリームIDと、図15に詳しく示すような636バイトのACD(オーディオキャラクタディスプレイ)情報と、360バイトの保留エリアにより構成されている。ASDパケットは同じく6バイトのパケットヘッダ及び1バイトのサブストリームIDと、図17に詳しく示すような1000バイトのASD(オーディオサーチデータ)により構成されている。
【0040】
636バイトのACD情報エリアは、図15に詳しく示すように48バイトのジェネラル情報エリアと、第1の言語の文字「1」及び第2の言語の文字「2」毎に294バイトのエリアを有し、この各エリアは93バイトのネームスペースエリア、各々93バイトの2つのフリースペースエリアと15バイトのデータポインタエリアにより構成されている。第1の言語の文字「1」と第2の言語の文字「2」の一方のネームスペースエリアには例えば図16に示すように楽曲名を日本語で表示するためのデータが配置され、他方のネームスペースエリアには英語で表示するためのデータが配置される。なお、この表示言語はディスク発行元が決定してよい。
【0041】
48バイトのジェネラル情報は、例えば16バイトのサービスレベル情報と、12バイトの言語コード情報と、6バイトの文字セットコード情報と、6バイトの表示アイテム情報と、2バイトの「前のACD情報との相違」情報と、6バイトの保留情報により構成される。16バイトのサービスレベル情報は、表示サイズ、表示の種類、オーディオ/ビデオ/SPの区別、ストリームなどを示し、また、文字はマンダトリー(必須)、ビットマップはオプション(随意)である。12バイトの言語コード情報はビデオファイルと同様に文字「1」「2」の言語をそれぞれ2バイトで示し、1ファイル中最大8言語分を示す。英語はマンダトリーである。
【0042】
6バイトの文字セットコード情報は、言語コードに対応した文字コードを最大15個持つことが可能であり、文字「1」「2」の言語の有無と種類を1バイトで示す。コード例を以下に示す。
1.ISO646
2.ISO8859−1
3.MS−JIS
6バイトの表示アイテム情報は、図15に示すフリースペース「1」「2」、データポインタの有無、IDを示す。ネームスペースはマンダトリーであり、タイトルネーム、ミュージックネーム、アーティストネームは必ず記述する。
【0043】
1000バイトのASD(オーディオサーチデータ)は、図17に詳しく示すように16バイトのジェネラル情報と、8バイトの現在の番号(No.)情報と、16バイトの現在時刻情報と、8バイトのタイトルセットサーチ情報と、8バイトのタイトルサーチ情報と、404バイトのトラックサーチ情報と、408バイトのインデックスサーチ情報と、80バイトのハイライトサーチ情報と、52バイトの保留エリアにより構成されている。
【0044】
8バイトの現在の番号情報は、タイトルセットの現在のタイトル番号(2バイト:BCD)と、タイトルセットの現在のトラック番号(2バイト:BCD)と、トラックの現在のインデックス番号(2バイト:BCD)と保留領域(2バイト)により構成されている。16バイトの現在時刻情報は、トラックのプレイバック時間(4バイト:BCD)と、トラックの残りのプレイバック時間(4バイト:BCD)と、タイトルの絶対時間(4バイト:BCD)とタイトルの残りの絶対時間(4バイト:BCD)により構成されている。
【0045】
8バイトのタイトルセットサーチ情報は、タイトルセットの最初のセクタ番号(4バイト)と、タイトルセットの最後のセクタ番号(4バイト)により構成されている。8バイトのタイトルサーチ情報は、タイトルの最初のセクタ番号(4バイト)と、タイトルの最後のセクタ番号(4バイト)により構成されている。404バイトのトラックサーチ情報は、タイトルのトラック及びセクタ番号(4バイト×99)と、タイトルの最初のトラック番号(4バイト)とタイトルの最後のトラック番号(4バイト)により構成されている。
【0046】
408バイトのインデックスサーチ情報は、トラックのインデックス及びセクタ番号(4バイト×100)と、トラックの最初のインデックス番号(4バイト)とトラックの最後のインデックス番号(4バイト)により構成されている。80バイトのハイライトサーチ情報は、トラックのインセクタ番号(4バイト×10)とトラックのアウトセクタ番号(4バイト×10)により構成されている。
【0047】
このようなフォーマットによれば、複数のAパックの先頭に、CDのTOC情報のように後続のAパックのオーディオ信号を管理するためのA−CONTパックが配置されるので、オーディオデータはビデオデータなどとは一体化されず、記録容量を多くすることができる。また、A−CONTパックによりオーディオ時間を管理することができ、また、A−CONTパックによりオーディオデータに関する曲名などの簡単な文字情報を取り出すことができる。
【0048】
また、A−CONTパック内にタイトル、スタートアドレス、演奏時間などのTOC情報を配置するので、オーディオ再生中であってもユーザの操作に応じた情報をA−CONTパックから取り出して再生を開始することができる。また、オーディオマネージャインフォメーション(AMGI)とオーディオタイトルセットインフォメーション(ATSI)内にTOC情報を配置することにより、必要なTOC情報を再生装置内のメモリに記憶させて、ユーザの操作に応じた情報をメモリから即座に読み出して再生を開始することができる。また、DVD−ビデオにおけるプログラムチェーンインフォメーション(PGCI)のような大きな容量の情報を記憶する必要がないので、ディスクを効率的に管理することができる。
【0049】
さらに、
1.コンテンツ内に画像(V)データがない場合、
(1)タイトル、曲、インデックスの3階層に対するサーチ、ランダムアクセスが可能になる。
(2)GOF(オーディオフレーム)単位の頭出し、タイムサーチ、ランダムアクセスが可能になる。
(3)タイトル、曲、インデックスの時間を実時間で管理することができる。
【0050】
また、
2.コンテンツ内に画像(V)データがある場合、
オーディオデータに関しては、
上記(1)〜(3)の他に、
(4)タイトル、曲中の現在時間、残り時間を実時間で表示、管理することができる。
【0051】
ビデオデータに関しては、
(1)タイトル、PTT、セルの3階層に対するサーチ、ランダムアクセスが可能になる。
(2)ビデオフレーム単位の頭出し、タイムサーチ、ランダムアクセスが可能になる。
(3)タイトル、PTT、セルの時間を実時間で管理することができる。
(4)PTT又はタイトル中の現在時間、残り時間をビデオフレーム単位時間で表示、管理することができる。
【0052】
なお、図1(b)のACBUは、A−CONTパックとCONTパックを含んでいるが、図18に示すようにVパックとCONTパックは含まないように構成してもよい。この場合にはビデオ信号は記録されないが、オーディオ信号の記録容量が割り増しになる特徴があり、ディスクサイズを小型化することができ、また、再生機能を簡略化することができるのでポータブル用の再生装置に適するものを提供することができる。
【0053】
図19は第2の実施形態におけるオーディオマネージャインフォメーション(AMGI)のフォーマットを詳しく示す説明図、図20は図19のTOC情報を詳しく示す説明図、図21は第3の実施形態におけるオーディオタイトルセットインフォメーション(ATSI)のフォーマットを詳しく示す説明図である。
次に、TOC(Table Of Contents)情報を用いた第2の実施形態について説明する。図19に示すように、AMGI(オーディオマネージャインフォメーション)の空きエリアに対して、図20に詳しく示すようなTOCを追加して記録し、再生装置はこのTOC情報にアクセスして曲の頭出しを行う。図20は一例として、CDのリードインエリアに記録されている一般的なTOC情報を示し、同じ情報が3回繰り返して記録されている。なお、本発明のDVDオーディオディスク1に記録する場合にはこのように繰り返してもよく、また、繰り返さなくてもよい。
【0054】
ここで、CDにおいて用いられているTOC情報では、ポイント=00〜99のときにその数字で示される各楽章が始まる絶対時間が分(PMIN)、秒(PSEC)及びフレーム(PFRAME)で表される。また、ポイント=A0のときにPMINが最初の楽章を示し、PSEC=PFRAME=0となる。ポイント=A1のときにはPMINが最後の楽章を示し、PSEC=PFRAME=0となる。ポイント=A2のときにはリードアウトエリアが始まる絶対時間が分(PMIN)、秒(PSEC)及びフレーム(PFRAME)で表される。したがって、図20に示すTOC情報はDVDオーディオディスク1に対して6曲(又は6楽章)分が記録されていることを示している(ポイント=01〜06)。なお、このTOC情報はAMGIの代わりに、図21に示すようにATSI(オーディオタイトルセットインフォメーション)の空きエリアに記録するようにしてもよく、また、図14に示すA−CONTパックのACDパケット内の保留エリア(360バイト分)に記録するようにしてもよい。
【0055】
次に、第4の実施形態について説明する。図22は本発明に適用されるDVDオーディオディスクの第4の実施形態のフォーマットを示し、図24ないし図26に示すようなVTSは含まず、ATSのみにより構成されている。そして、このATS(ディレクトリ)は、SAMG(Structure of Simple Audio Manager)と、図1(b)に示すオーディオマネージャ(AMG)と、ビデオ及びオーディオのオーディオマネージャメニュー(AMGM)と、AMG内のAMGIにより管理されるATS<1>及びATS<2>により構成され、また、ATS<1>及びATS<2>は図23に示すように、A−CONTパックを含まず、AパックとRTIパックにより構成されている。また、このRTIパックはAパックに対して多く配置されず、0.5秒毎に1パック程度が配置される。また、静止画パックが所定の位置に配置される。SAMGはATS<1>及びATS<2>の頭出しのためのSAPPテーブル(TOC)が繰り返し8回記述される領域である。この領域は1つの独立したファイルとして定義できる。
【0056】
ここで、参考までに、図24はDVD−Van(ビデオ+オーディオナビゲーション)ディスクのフォーマットを示し、このフォーマットは概略的にはDVD−ビデオデータとしてビデオタイトルセット(VTS)と、オーディオナビ(ナビゲーション)データとしてANVタイトルセット(ANV−TS)により構成されている。また、詳しくは、VTSは図1(a)及び後述する図25に示すDVDビデオディスクと同じ構成であり、他方、ANV−TSは図1(b)に示すオーディオマネージャ(AMG)と、VTS側のVTS<1>及びVTS<2>とそれぞれ対を成してAMG内のAMGIにより管理されるATS<1>及びATS<2>により構成されている。
また、DVDビデオディスクのフォーマットは図25及び図1(a)に示すようにATSやANV−TSを含まず、VTSのみにより構成されている。
【0057】
また、図26はDVD−Avd(オーディオ+AVデータ)ディスクのフォーマットを示し、このフォーマットは概略的にDVD−ビデオデータとしてビデオタイトルセット(VTS)と、DVD−オーディオデータとしてオーディオタイトルセット(ATS)により構成されている。また、詳しくは、VTSは図1(a)に示すビデオマネージャ(VMG)と、ビデオ及びオーディオのビデオマネージャメニュー(VMGM)と、VMG内のVMGIにより管理されるVTS<1>により構成されている。
【0058】
他方、ATSはSAMGと、図1(b)に示すオーディオマネージャ(AMG)と、ビデオ及びオーディオのオーディオマネージャメニュー(AMGM)と、VTS側のVTS<1>内のオーディオデータと対を成し、かつAMG内のAMGIにより管理されるATS<1>と、VTS側とは対をなさず、同じくAMG内のAMGIにより管理されるATS<2>により構成されている。また、このATS<2>は図23に示すように、A−CONTパックを含まず、AパックとRTIパックにより構成されている。
【0059】
図27は第4の実施形態のディスクのオーディオデータの内容を示す属性データとしてディスクに記録されるオーディオ・オンリ・タイトル・オーディオ・オブジェクト・アトリビュート(AOTT−AOB−ATR)を示している。この属性データは8バイト(64ビットb63〜b0)により構成され、MSB側から順に詳しく説明すると
・4ビット(b63〜b60)のオーディオ符号化モードと、
・1ビット(b59)のダウンミックス(D−M)モードと、
・3ビット(b58〜b56)のマルチチャネル構造と、
・4ビット(b55〜b52)のチャネルグループ1の量子化ビット数Q1と、
・4ビット(b51〜b48)のチャネルグループ2の量子化ビット数Q2と、
・4ビット(b47〜b44)のチャネルグループ1のサンプリング周波数fs1と、
・4ビット(b43〜b40)のチャネルグループ2のサンプリング周波数fs2と、
・3ビット(b39〜b37)の保留領域と、
・5ビット(b36〜b32)のチャネル割り当てと、
・残り32ビット(b31〜b0)の保留領域により構成されている。なお、残りの32ビット(b31〜b0)は各チャネルの属性データ用として用いられる。
【0060】
上記データを以下に更に詳しく説明する。
(1)オーディオ符号化モード(b63〜b60)
0000b:リニアPCMモード
0001b:圧縮オーディオ(ドルビーデジタル)用に保留
0010b:圧縮オーディオ(MPEG2拡張無し)用に保留
0011b:圧縮オーディオ(MPEG2拡張有り)用に保留
0100b:圧縮オーディオ(DTS)用に保留
0101b:圧縮オーディオ(SDDS)用に保留
その他 :その他の符号化モード用に保留
(2)ダウンミックスモード(b59)
0b:ダウンミックスステレオ出力許可
1b:ダウンミックスステレオ出力禁止
(3)マルチチャネル構造のタイプ(b58〜b56)
000b:タイプ1
その他 :保留
【0061】
(4)チャネルグループ1の量子化ビット数Q(b55〜b52)
0000b:16ビット
0001b:20ビット
0010b:24ビット
その他 :保留
(5)チャネルグループ2の量子化ビット数Q(b51〜b48)
・チャネルグループ1の量子化ビット数Qが「0000b」の場合には「0000b」
・チャネルグループ1の量子化ビット数Qが「0001b」の場合には「0000b」又は「0001b」
・チャネルグループ1の量子化ビット数Qが「0010b」の場合には「0000b」、「0001b」又は「0010b」
ただし、0000b:16ビット
0001b:20ビット
0010b:24ビット
その他 :保留
【0062】
(6)チャネルグループ1のサンプリング周波数fs1(b47〜b44)
0000b:48kHz
0001b:96kHz
0010b:192kHz
1000b:44.1kHz
1001b:88.2kHz
1010b:176.4kHz
その他 :保留
【0063】
(7)チャネルグループ2のサンプリング周波数fs2(b43〜b40)
・チャネルグループ1のサンプリング周波数fs1が「0000b」の場合には「0000b」
・チャネルグループ1のサンプリング周波数fs1が「0001b」の場合には「0000b」又は「0001b」
・チャネルグループ1のサンプリング周波数fs1が「0010b」の場合には「0000b」、「0001b」又は「0010b」
・チャネルグループ1のサンプリング周波数fs1が「1000b」の場合には「1000b」
・チャネルグループ1のサンプリング周波数fs1が「1001b」の場合には「1000b」又は「1001b」
・チャネルグループ1のサンプリング周波数fs1が「1010b」の場合には「1000b」、「1001b」又は「1010b」
【0064】
この第4の実施形態のディスクではリニアPCMモードが使用される。リニアPCMのプライベートヘッダは、図28に示すように
・8ビットのサブストリームIDと、
・4ビットの保留領域と、
・4ビットのISRC番号と、
・8ビットのISRCデータと、
・8ビットのプライベートヘッダ長と、
・16ビットの第1アクセスユニットポインタと、
・1ビットのオーディオ・エンファシス・フラグF1と、
・1ビットのオーディオ・エンファシス・フラグF2などにより構成されている。
【0065】
図29、図30はエンコード装置を示す。図29は本発明に適用されるオーディオ信号のエンコード装置の一実施形態を示すブロック図、図30は図29の信号処理回路を詳細に示すブロック図である。
【0066】
図29においてアナログオーディオ信号AはA/Dコンバータ31により十分高いサンプリング周波数(サンプリング周期Δt)、例えば192kHzでサンプリングされて、例えば24ビットの高分解能のPCM信号に変換され、高分解能の曲線αに対応するデータ列
xb1,x1 ,xa1,x2,xb2,x3,xa2,・・・,xbi,x2i−1,xai,x2i,・・・
に変換される。このデータ列(xbi,x2i−1,xai,x2i)は図30に詳しく示す信号処理回路32及びメモリ33によりエンコードされ、次いでDVDオーディオフォーマット化部34に印加される。
【0067】
図30を参照して信号処理回路32の構成を詳しく説明する。まず、1/2の帯域を通過させるローパスフィルタ36、例えばFIRフィルタにより、高分解能の曲線αに対応するデータ列(xbi,x2i−1,xai,x2i)から、帯域制限された低分解能の曲線βに対応するデータ列
xc1,*,*,*,xc2,*,*,*,xc3,*,*,*,・・・,xci,*,*,*,・・・
を得、次にこのデータ列の内、データ「*」を間引き回路37により間引くことによりデータ列
xc1,xc2,xc3,・・・,xci,・・・
を生成する。ここで、データ列xciはA/Dコンバータ31によりA/D変換されたデジタルデータを帯域制限してサンプリング周波数を1/4に低減したデータ列となっている。
【0068】
また、データ列(xbi,x2i−1,xai,x2i)の内、データxi を間引き回路38により間引くことによりデータ列
xb1,xa1,xb2,xa2,・・・,xbi,xai,・・・
を生成する。
【0069】
そして、これらのデータ列xci、xbi、xaiに基づいて、差分計算器として作用する加算器39により差分
xbi−xci=Δ1i
xai−xci=Δ2i
を演算する。ここで、差分データΔ1i、Δ2iは、例えば24ビット又はそれ以下であり、また、ビット数は固定でも可変でもよい。
【0070】
アロケーション回路40はデータ列xci及び差分データΔ1i、Δ2iをユーザデータ(図13参照)にパッキングし(1パケット=2034バイト)、そのユーザデータをDVDフォーマット化部34に出力する。
【0071】
また、ビデオ信号VはA/D変換器31Vによりデジタル信号に変換され、次いでこのデジタルビデオ信号がVエンコーダ32VによりMPEGフォーマットにエンコードされ、次いで図13に示すユーザデータにパッキングされてDVDフォーマット化部34に印加される。そしてDVDフォーマット化部34は、例えば図1〜図18に示すようなフォーマットにパッキングする。このDVDフォーマット化部34によりフォーマット化されたデータは、変調回路35によりディスクに応じた変調方式で変調され、この変調データに基づいてディスクが製造される。
【0072】
次に図31〜図90を参照して第5の実施形態のDVD−オーディオディスクについて説明する。まず、図31(A)に示すようにこの第5の実施形態のデータ構造は、概略的にSAMGと、AMG(オーディオマネージャ)と、SPS(スチルピクチャセット)と複数のATS(オーディオ・タイトルセット)を有する。なお、SPS(スチルピクチャセット)は、サブピクチャ(SP)との混同を避けるために、以下の説明ではASVS(オーディオ・スチル・ビデオ・セット)とも言う。
【0073】
ATSは、先頭から順に
・ATSI(ATSインフォメーション)と、
・図32〜図37に詳しく示すオーディオ・オンリ・タイトル用のオーディオ・オブジェクト・セット(AOTT−AOBS)と
・バックアップ用のATSIにより構成されている。ATSIは先頭から順に
・図39〜図44に詳しく示すATSI−MAT(ATSIマネージメント・テーブル)と
・図45〜図57に詳しく示すATS−PGCIT(ATSプログラム・チェーン・インフォメーション・テーブル)により構成されている。
【0074】
AOTT−AOBSは図32に詳しく示すように、複数のオーディオ・オンリ・タイトル用のオーディオ・オブジェクト(AOTT−AOB)により構成されている。AOTT−AOBの各々は複数のプログラム(PG)により構成され、プログラムの各々は複数のセル(ATS−C)により構成されている。
【0075】
AOTT−AOBは、図32(1)に詳しく示すようにオーディオデータのみを含むものと、図32(2)に詳しく示すようにオーディオデータ及びリアル・タイム・インフォメーション・データ(RTIデータ)を含むものの2種類のAOTT−AOBにより構成されている。そして、1枚のディスク中や1曲中に1種類以上のAOTT−AOBが配置される。
【0076】
オーディオデータのみを含む第1のAOTT−AOBの各プログラムは複数のオーディオセル(ATS−C)により構成され、このオーディオセルは複数のオーディオパックのみにより構成されている。オーディオデータ及びRTIデータを含む第2のAOTT−AOBの各プログラムは複数のオーディオセル(ATS−C)により構成され、このオーディオセルは2番目のパック位置に配置されたRTIパックと、他のパック位置に配置されたオーディオパックにより構成されている。
【0077】
リニアPCMのAパックは2048バイト以下で構成され、その内訳は図33に示すように14バイトのパックヘッダとAパケットにより構成されている。Aパケットは17、9又は14バイトのパケットヘッダと、図34に詳しく示すプライベートヘッダと、1ないし2011バイトのオーディオPCMデータにより構成されている。
【0078】
プライベートヘッダは、図34に示すように
・8ビットのサブストリームIDと、
・3ビットの保留領域と、
・5ビットのUPC/EAN−ISRC(ユニバーサル・プロダクト・コード:Universal Product Code/ヨーロピアン・アーティクル・ナンバー・インターナショナル・スタンダード・レコーディング・コード:European Article Number−International Standard Recording Code)番号と、
・8ビットのUPC/EAN−ISRCデータと、
・8ビットのプライベートヘッダ長と、
・16ビットの第1アクセスユニットポインタと、
・8バイトのオーディオデータインフォメーション(ADI)と
・0〜8バイトのスタッフィングバイト
により構成されている。
【0079】
ADIは
・1ビットのオーディオ・エンファシス・フラグと、
・1ビットの保留領域と、
・1ビットのダウンミックスモードと、
・1ビットのダウンミックスコード有効性と、
・4ビットのダウンミックスコードと、
・4ビットのグループ「1」の量子化ワード長「1」と、
・4ビットのグループ「2」の量子化ワード長「2」と、
・4ビットのグループ「1」のオーディオ・サンプリング周波数fs1と、
・4ビットのグループ「2」のオーディオ・サンプリング周波数fs2と、
・4ビットの保留領域と、
・4ビットのマルチチャネルタイプと、
・3ビットのチャネルグループ「2」のビットシフトデータ(図36参照)と
・5ビットのチャネル割り当て情報(図42参照)と、
・8ビットのダイナミックレンジ制御情報
・8×2ビットの保留領域
により構成されている。
【0080】
8ビット(b7〜b0)のUPC/EAN−ISRCデータエリアには、図35に示すようにUPC/EAN−ISRC番号に応じて異なるデータが配置される。すなわち、
(1)UPC/EAN−ISRC番号=1の場合
上位2ビットb7、b6:保留
下位6ビットb5〜b0:カントリコード(ISRC#1)
(2)UPC/EAN−ISRC番号=2の場合
上位2ビットb7、b6:保留
下位6ビットb5〜b0:カントリコード(ISRC#2)
(3)UPC/EAN−ISRC番号=3の場合
上位2ビットb7、b6:保留
下位6ビットb5〜b0:コピーライトホルダコード(ISRC#3)
(4)UPC/EAN−ISRC番号=4の場合
上位2ビットb7、b6:保留
下位6ビットb5〜b0:コピーライトホルダコード(ISRC#4)
(5)UPC/EAN−ISRC番号=5の場合
上位2ビットb7、b6:保留
下位6ビットb5〜b0:コピーライトホルダコード(ISRC#5)
(6)UPC/EAN−ISRC番号=6の場合
上位4ビットb7〜b4:保留
下位4ビットb3〜b0:レコーディングイヤー(ISRC#6)
(7)UPC/EAN−ISRC番号=7の場合
上位4ビットb7〜b4:保留
下位4ビットb3〜b0:レコーディングイヤー(ISRC#7)
【0081】
Aパック内の実データであるリニヤPCMデータのエリアには、S/N比の向上とビット削減のためにグループ「2」の各チャネルのデータのビットが削減されて配置される。図36(a)は一例として6チャネル(グループ「1」=Ch1〜Ch3、グループ「2」=Ch4〜Ch6)のPCMデータを示し、レベル範囲がMAX=0dB〜MIN=−144dB(24ビット)であって、各チャネルChの値が以下の通りである。
Lmax2>Lmax1=Lmax3>Lmax4>Lmax5>Lmax6
そして、グループ「1」のCh1〜Ch3のワード長はそのままにして、この例ではCh2の値が最も大きいので、グループ「2」のCh4〜Ch6の各レベルを(0−Lmax2)dBだけアップシフトしてLSB側0〜4ビットを削減する。なお、図36に示す例ではCh4〜Ch6の各レベルが最大ビット数=4だけアップシフトされて20ビットに削減されたことを示している。
【0082】
次に図37を参照してRTIパックの構成を詳しく説明する。このパックは14バイトのパックヘッダとRTIパケットにより構成され、RTIパケットは17又は14バイトのパケットヘッダと、プライベートヘッダと、1ないし2015バイトのRTIデータにより構成されている。RTIデータはオーディオデータに関する文字情報や再生制御情報である。
【0083】
RTIパケットのプライベートヘッダは、
・1バイトのサブストリームIDと、
・2バイトのUPC/EAN−ISRC番号及びデータ(図ではこれらを単にISRCと表記)と、
・1バイトのプライベートヘッダ長と、
・1バイトのRTI情報IDと、
・0〜7バイトのスタッフィングバイト
により構成されている。
上記UPC/EAN−ISRC番号及びデータは、SPCTパックに収められるスチルピクチャの著作権に関するUPC/EAN−ISRC番号及びデータである。
【0084】
ちなみに、図31に示すスチルピクチャセット(オーディオ・スチル・ビデオ・セット)にはSPCTパックが配置され、このSPCTパックは図38に詳しく示すように、14バイトのパックヘッダとSPCTパケットにより構成され、SPCTパケットは22又は19又は9バイトのパケットヘッダと2025バイト以下のSPCTデータにより構成されている。ここで、1枚の静止画はMPEG1又はMPEG2方式で圧縮されてIピクチャとイントラ・コーデッド・ピクチャにより構成され、1つのピクチャセル内で分割されてSPCTパックのSPCTデータとして配置される。なお、SPCTパックのパケットヘッダ内にも同様に、RTIパックで説明したようにスチルピクチャの著作権に関するUPC/EAN−ISRC番号及びデータを含めてもよい。
【0085】
図31(A)に示したATSI−MATは、図39に詳しく示すように2048バイト(リラティブ・バイト・ポジションRBP0〜2047)で構成され、先頭から順に
・12バイト(RBP0〜11)のATS識別子(ATS−ID)と、
・4バイト(RBP12〜15)のATSのエンドアドレス(ATS−EA)と、
・12バイト(RBP16〜27)の保留領域と、
・4バイト(RBP28〜31)のATSIのエンドアドレス(ATSI−EA)と、
・2バイト(RBP32〜33)のバージョン番号(VERN)と、
・94バイト(RBP34〜127)の保留領域と、
・4バイト(RBP128〜131)のATSI−MATのエンドアドレスと、
・60バイト(RBP132〜191)の保留領域と、
・4バイト(RBP192〜195)のAOTT用のVTSのスタートアドレスと、
・4バイト(RBP196〜199)のAOTT用のAOBSのスタートアドレス又はAOTT用のVOBSのスタートアドレスと、
・4バイト(RBP200〜203)の保留領域と、
・4バイト(RBP204〜207)のATS−PGCITのスタートアドレスと、
・48バイト(RBP208〜255)の保留領域と、
・128(16×8)バイト(RBP256〜383)のAOTT用のAOBのアトリビュート(AOTT−AOB−ATR)又はAOTT用のVOBのオーディオストリームのアトリビュート(AOTT−VOB−AST−ATR)と、
・288(18×8)バイト(RBP384〜661)の、マルチチャネルオーディオデータを2チャネルにダウンミックスするための係数(ATS−DM−COEFT#0〜#15)と、
・32バイト(RBP672〜703)の保留領域と、
・2バイト(RBP704〜705)の、AOTT用のAOBSにおけるスチルピクチャデータのアトリビュート(ATS−SPCT−ATR)と、
・1342バイト(RBP706〜2047)の保留領域により構成されている。
【0086】
128(16×8)バイト(RBP256〜383)のエリアには、このATSがAOTT用のAOBSを有する場合には、図40に詳しく示すAOTT−AOB−ATRが記述される。このAOTT−AOB−ATR(b127〜b0)は、MSB側から順に
・8ビット(b127〜b120)のオーディオ符号化モードと、
・8ビット(b119〜b112)の保留領域と、
・4ビット(b111〜b108)のチャネルグループ「1」の量子化ビット数Q1と、
・4ビット(b107〜b104)のチャネルグループ「2」の量子化ビット数Q2と、
・4ビット(b103〜b100)のチャネルグループ「1」のサンプリング周波数fs1と、
・4ビット(b99〜b96)のチャネルグループ「2」のサンプリング周波数fs2と、
・3ビット(b95〜b93)のマルチチャネル構造のタイプと、
・5ビット(b92〜b88)のチャネル割り当てと、
・8ビット×11(b87〜b0)の保留領域により構成されている。
【0087】
これに対し、このATSがAOTT用のAOBSを有しない場合には、図41に示すAOTT−VOB−AST−ATRが記述される。このAOTT−VOB−AST−ATR(b127〜b0)は、MSB側から順に
・8ビット(b127〜b120)のオーディオ符号化モードと、
・8ビット(b119〜b112)の保留領域と、
・4ビット(b111〜b108)の量子化ビット数Qと、
・4ビット(b107〜b104)の保留領域と、
・4ビット(b103〜b100)のサンプリング周波数fsと、
・4ビット(b99〜b96)の保留領域と、
・3ビット(b95〜b93)のマルチチャネル構造のタイプと、
・5ビット(b92〜b88)のチャネル割り当てと、
・3ビット(b87〜b85)のデコーディング・オーディオ・ストリーム数と、
・5ビット(b84〜b80)の保留領域と、
・2ビット(b79、b78)のMPEGオーディオ用DRCと、
・2ビット(b77、b76)の保留領域と、
・4ビット(b75〜b72)の圧縮オーディオチャネル数と、
・8ビット×9(b71〜b0)の保留領域により構成されている。
【0088】
上記データを以下に詳しく示す。ただし、量子化ビット数、サンプリング周波数、マルチチャネルタイプは図27と同じであるので説明を省略する。
(1)オーディオ符号化モード(b127〜b120)
00000000b:リニアPCMモード
00000001b:圧縮オーディオ(ドルビーデジタル)用に保留
00000010b:圧縮オーディオ(MPEG2拡張無し)用に保留
00000011b:圧縮オーディオ(MPEG2拡張有り)用に保留
00000100b:圧縮オーディオ(DTS)用に保留
00000101b:圧縮オーディオ(SDDS)用に保留
その他 :その他の符号化モード用に保留
【0089】
(8)チャネル割り当て(b92〜b88)
図42は1チャネル(モノラル)から6チャネルまでのグループ「1」、「2」のチャネル割当情報を示している。ちなみに、図に示す記号を以下に説明する。
C(mono):モノラル
L,R :2チャネルステレオ
Lf :マルチチャネルのレフトフロント
Rf :マルチチャネルのライトフロント
C :マルチチャネルのセンター
LFE :マルチチャネルのLow Frequency Effect
S :マルチチャネルのサラウンド
Ls :マルチチャネルのレフトサラウンド
Rs :マルチチャネルのライトサラウンド
【0090】
(9)デコーディング・オーディオ・ストリーム数(b87〜b85)の「0」又は「1」
(10)MPEGオーディオ用DRC(b79、b78)
00b:MPEGオーディオストリーム内にDRCデータが存在しない。
01b:MPEGオーディオストリーム内にDRCデータが存在する。
【0091】
(11)圧縮オーディオチャネル数(b75〜b72)
オーディオ符号化モードがリニヤPCMオーディオの場合には「1111b」
0000b:1ch(モノ)
0001b:2ch(ステレオ)
0010b:3ch
0011b:4ch
0100b:5ch
0101b:6ch
0110b:7ch
0111b:8ch
その他 :保留
【0092】
図39に示した288(18×16)バイトのエリア(RBP384〜671)には、マルチチャネルオーディオデータを2チャネルにダウンミックスするために図43に示すようにテーブル番号「0」〜「15」の各ダウンミックス係数(ATS−DM−COEFT#0〜#15)が18ビットで記述される。
【0093】
図39に示した2バイト(RBP704、705)のエリアは、AOTT用のAOBSにおけるスチルピクチャデータのアトリビュート(ATS−SPCT−ATR)を記述するために、図44に詳しく示すようにMSB側から順に
・2ビット(b15、b14)のビデオ圧縮モードと、
・2ビット(b13、b12)のTVシステムと、
・2ビット(b11、b10)のアスペクト比と、
・2ビット(b9、b8)のディスプレイモードと、
・2ビット(b7、b6)の保留領域と、
・3ビット(b5〜b3)のソースピクチャの解像度と、
・3ビット(b2〜b0)の保留領域により構成されている。
【0094】
上記ATS−SPCT−ATRの内容を以下に詳しく示す。
(1)ビデオ圧縮モード(b15、b14)
00b:MPEG1対応
01b:MPEG2対応
その他:保留
(2)TVシステム(b13、b12)
00b:525/60
01b:625/60
その他:保留
(3)アスペクト比(b11、b10)
00b:4:3
11b:16:9
その他:保留
(4)ディスプレイモード(b9、b8)
00b:保留
01b:保留
10b:レターボックスのみ許可
11b:記述しない。
(5)ソースピクチャの解像度(b5〜b3)

Figure 0003603868
その他:保留
【0095】
図31(A)に示したATS−PGCIT(ATSプログラム・チェーン・インフォメーション・テーブル)は、図45に詳しく示すように先頭から順に
・図46に詳しく示すオーディオ・タイトルセットPGCIテーブル・インフォメーション(ATS−PGCITI)と、
・図47、図48に詳しく示すn個のオーディオ・タイトルセットPGCIサーチポインタ(ATS−PGCI−SRP#1〜#n)と
・図49に詳しく示す複数のオーディオ・タイトルセットPGCIにより構成されている。
【0096】
ATS−PGCITIは図46に詳しく示すように8バイトで構成され、先頭から順に
・2バイトのATS−PGCI−SRP#1〜#nの数と、
・2バイトの保留領域と、
・4バイトのATS−PGCITのエンドアドレスにより構成されている。ATS−PGCI−SRP#1〜#nの各々は、図47に詳しく示すように8バイトで構成され、先頭から順に
・図48に詳しく示す4バイトのATS−PGCのカテゴリ(ATS−PGC−CAT)と
・4バイトのATS−PGCIのエンドアドレスにより構成されている。
【0097】
上記の4バイト(b31〜b0)のATS−PGCのカテゴリは、図48に詳しく示すように先頭から順に
・1ビット(b31)のエントリータイプと、
・7ビット(b30〜b24)のATSオーディオタイトル数(ATS−TTN)と、
・2ビット(b23、b22)のブロックモードと、
・2ビット(b21、b20)のブロックタイプと、
・4ビット(b19〜b16)のオーディオチャネル数と、
・8ビット(b15〜b8)のオーディオ符号化モードと、
・8ビット(b7〜b0)の保留領域により構成されている。
【0098】
上記カテゴリ(ATS−PGC−CAT)の内容を以下に詳しく示す。
(1)エントリータイプ(b31)
0b:エントリーPGCでない
1b:エントリーPGC
(2)ATSオーディオタイトル数(b30〜b24)
このATSのオーディオタイトル数を「1」〜「99」の範囲で記述する。
(3)ブロックモード(b23、b22)
00b:ATS−PGCブロックのATS−PGCでない
01b:ATS−PGCブロックの最初のATS−PGC
10b:保留
11b:ATS−PGCブロックの最後のATS−PGC
(4)ブロックタイプ(b21、b20)
00b:このブロックの一部でない
01b:オーディオコーディングモードのみの差分のブロック
10b:オーディオチャネルのみの差分のブロック
11b:オーディオコーディングモードとオーディオチャネルの両方の差分のブロック
(5)オーディオチャネル数(b19〜b16)
0000b:2チャネル以下
0001b:2チャネルを超える
【0099】
図45に示したオーディオ・タイトルセットPGCI(ATS−PGCI)の各々は、図49に詳しく示すように先頭から順に
・図50、図51に詳しく示すATS−PGCジェネラル・インフォメーション(ATS−PGC−GI)と、
・図52〜図56に詳しく示すATSプログラム・インフォメーション・テーブル(ATS−PGIT)と
・図55〜図57に詳しく示すATSセル・プレイバック・インフォメーション・テーブル(ATS−C−PBIT)により構成されている。
【0100】
ATS−PGC−GIは図50に詳しく示すように16バイト(RBP0〜15)で構成され、先頭から順に
・図51に詳しく示す4バイト(RBP0〜3)のATS−PGCコンテンツ(ATS−PGC−CNT)と、
・4バイト(RBP4〜7)のATS−PGCプレイバック・タイム(ATS−PGC−PB−TM)と、
・2バイト(RBP8、9)の保留領域と、
・2バイト(RBP10、11)のATS−PGITのスタートアドレスと、
・2バイト(RBP12、13)のATS−C−PBITのスタートアドレスと、
・2バイト(RBP14、15)の保留領域により構成されている。
【0101】
上記の4バイト(b31〜b0)のATS−PGCコンテンツは図51に詳しく示すように先頭から順に
・17ビット(b31〜b15)の保留領域と、
・7ビット(b14〜b8)のプログラム数と
・8ビット(b7〜b0)のセル数により構成されている。プログラム数は「1」〜「99」の範囲であり、セル数は「1」〜「255」の範囲である。
【0102】
図49に示したATSプログラム・インフォメーション・テーブル(ATS−PGIT)は、図52に詳しく示すようにn個のATSプログラム・インフォメーション(ATS−PGI)#1〜#nにより構成されている。ATS−PGI#1〜#nの各々は図53に詳しく示すように20バイト(RBP0〜19)で構成され、先頭から順に
・図54に詳しく示す4バイト(RBP0〜3)のATS−PGコンテンツ(ATS−PG−CNT)と、
・1バイト(RBP4)のATS−PGのエントリセル番号と、
・1バイト(RBP5)の保留領域と、
・4バイト(RBP6〜9)のATS−PGの最初のオーディオセルのスタート・プレゼンテーション・タイム(FAC−S−PTM)と、
・4バイト(RBP10〜13)のATS−PGプレイバック・タイムと、
・4バイト(RBP14〜17)のATS−PGポーズ・タイムと、
・1バイト(RBP18)の保留領域(著作権管理データCMI用)と、
・1バイト(RBP19)の保留領域
により構成されている。
【0103】
上記2バイト(b31〜0)のATS−PGコンテンツは、図54に詳しく示すように先頭から順に
・1ビット(b31)の、前回と今回のPGの関係(R/A)と、
・1ビット(b30)のSTC不連続性フラグ(STC−F)と、
・3ビット(b29〜b27)のアトリビュート数(ATRN)と、
・3ビット(b26〜b24)のチャネルグループ(ChGr)「2」のビットシフトデータと、
・2ビット(b23、b22)の保留領域と、
・1ビット(b21)のダウンミックスモード(D−M)と、
・1ビット(b20)のダウンミックス係数の有効性(図示※)と、
・4ビット(b19〜b16)のダウンミックス係数テーブル番号(DM−COEFTN)と、
・各々が1ビット、合計16ビット(b15〜b0)のRTIフラグF15〜F0により構成されている。
【0104】
図49に示したATSセル・プレイバック・インフォメーション・テーブル(ATS−C−PBIT)は、図55に詳しく示すようにn個のATSセル・プレイバック・インフォメーション(ATS−C−PBI)#1〜#nにより構成されている。ATS−C−PBI#1〜#nの各々は、図56に詳しく示すように12バイト(RBP0〜11)により構成され、先頭から順に
・1バイト(RBP0)のATS−Cのインデックス番号と、
・図57に詳しく示す1バイト(RBP1)のATS−Cタイプ(ATS−C−TY)と、
・2バイト(RBP2、3)の保留領域と、
・4バイト(RBP4〜7)のATS−Cのスタートアドレスと、
・4バイト(RBP8〜11)のATS−Cのエンドアドレスにより構成されている。
【0105】
1バイト(b7〜b0)のATS−Cタイプは、図57に詳しく示すように先頭から順に
・2ビット(b7、b6)のATSセル要素(ATS−C−COMP)と、
・2ビット(b5、b4)の保留領域と
・4ビット(b3〜b0)のATSセル用途(ATS−C−Usage)により構成されている。
【0106】
上記データの内容を以下に詳しく示す。
(1)ATSセル要素(b7、b6)
00b:オーディオデータのみから成るオーディオセル
01b:オーディオデータとリアルタイムインフォメーションから成るオーディオセル
10b:サイレンス用のオーディオデータのみから成るサイレンスセル
11b:スチルピクチャのみから成るピクチャセル
(2)ATSセル用途(b3〜b0)
0000b:記述無し
0001b:スポットライトパート
その他 :保留
【0107】
次の第5の実施形態のエンコード装置について説明する。図58、図59はそれぞれエンコード装置の構成と処理を示している。アナログオーディオ信号AはA/Dコンバータ31により十分高いサンプリング周波数(サンプリング周期Δt)、例えば192kHzでサンプリングされて、例えば24ビットの高分解能のPCM信号に変換される。続くビットシフト/信号処理回路32では、圧縮を行わない場合には、A/Dコンバータ31により変換されたPCMデータがそのままDVDフォーマット化部34に印加される。これに対し、圧縮を行う場合には、A/Dコンバータ31により変換されたPCMデータがその符号化モードに応じてビットシフト/信号処理回路32により圧縮され、次いでDVDフォーマット化部34に印加される(ステップS5、S6)。ビットシフト/信号処理回路32ではまた、グループ「2」の各チャネルがビットシフトされる。
【0108】
また、ビデオ信号VはA/D変換器31Vによりデジタル信号に変換され、次いでこのデジタルビデオ信号がVエンコーダ32VによりMPEGフォーマットにエンコードされ、DVDフォーマット化部34に印加される(ステップS1、S2)。また、静止画信号SPはA/D変換器31SPによりデジタル信号に変換され、次いでこのデジタル静止画信号SPが圧縮エンコーダ32SPによりMPEGフォーマットにエンコードされ、DVDフォーマット化部34に印加される(ステップS3、S4)。また、著作権情報とリアルタイムテキスト情報(RTI)がインタフェース(I/F)40を介して(ステップS7、S8)、また、文字情報とディスク識別子EXがDVDフォーマット化部34に印加される(ステップS9、S10)。
【0109】
そしてDVDフォーマット化部34は、前述したようなフォーマットにパッキングする(ステップS11)。このDVDフォーマット化部34によりフォーマット化されたデータは、変調回路35によりディスクに応じた変調方式で変調されてこの変調データに基づいてディスクが製造されたり、記録部38にいったん記録されたり、通信I/F39を介して伝送される(ステップS12)。
【0110】
図60は第5の実施形態のデコード装置の具体的構成を示し、図61は図60の構成を機能的に示している。また、図62はその処理を示している。図60、図61において、まず、操作部18やリモコン装置19により曲目選択、再生、早送り、停止操作が行われると、制御部23はその操作に応じてドライブ装置2と再生装置17を制御し、再生時にはDVDオーディオディスク1に記録されたピットデータがドライブ装置2により読み取られた後、EFM復調される。
【0111】
再生装置17では、この信号が静止画及びVパック検出部3とA及びRTIパック検出部9に送られる。静止画パック、Vパックがディスク1に記録されている場合には、静止画及びVパック検出部3はこの再生データ中の静止画パック、Vパックを検出して制御パラメータをパラメータ部8に設定するとともに静止画パック、Vパックを静止画及びVパックバッファ4に順次書き込む。静止画及びVパックバッファ4に書き込まれた静止画パック、Vパック内のユーザデータ(ビデオ信号、静止画情報)は、バッファ取り出し部5により静止画パック、Vパック内のSCR(図13参照)に基づいてパック順に、また、出力時刻順に取り出され、次いで伸長及び画像変換部6、D/A変換部7、ビデオ出力端子15、15’を介してアナログビデオ信号として出力される。
【0112】
また、A及びRTIパック検出部9は再生データ中のAパックとRTIパックを検出して制御パラメータをパラメータ部14に設定するとともに、AパックとRTIパックをA及びRTIパックバッファ10に順次書き込む。A及びRTIパックバッファ10に書き込まれたAパック、RTIパック内のユーザデータ(オーディオ信号、リアルタイム・インフォメーション)は、バッファ取り出し部11によりパック順に、また、出力時刻順に取り出される。そして、オーディオ信号はPCM変換及びビットシフト/信号処理部12、D/A変換部13、オーディオ出力端子16を介してアナログオーディオ信号として出力される。また、リアルタイム・インフォメーションは表示信号生成部20に送られて表示信号が生成され、この表示信号は表示信号出力端子22を介して出力されたり、内蔵の文字表示部21に出力される。
【0113】
図62を参照してこのデコード装置の処理を説明する。まず、ディスク1にアクセスして記録データを読み出し(ステップS20)、次いで各分離ステップS21〜S29においてビデオ信号と、静止画信号と、オーディオ信号と、著作権情報及びリアルタイム情報(RTI)と、文字情報及びディスク識別子(EX)が分離される。次いで各デコードステップS22〜S30においてそれぞれ各分離データがデコードされ、次いで同期再生される(ステップS31、S32)。
【0114】
ここで、静止画SPを再生する処理には次の3通りがある。
1)静止画SPが得られると、オーディオ信号Aの再生を中断してミュートする。
2)静止画SPが得られると、時間制御信号に基づいてオーディオ信号Aと共に再生する。これをスライドショーと呼ぶ。
3)静止画SPが得られると、ユーザに指示されたページめくりコマンドに基づいてページめくり再生する。このときオーディオ信号Aはそのまま再生する。これをブラウザブルと呼ぶ。
【0115】
静止画を音声に同期させる必要がある場合は、リアルタイムの同期のための時間制御信号は、図31(B)のATSIに追加して設けるスチルピクチャ・コントロール・インフォメーション・テーブル(SPCIT)の下のタイム・コントロール・データ・インフォメーション(SPCIT−TCDI)に置くようにする。
【0116】
また、さらにページめくりコマンドを収めたスチルピクチャ・ページ制御コマンド・インフォメーション(SPPI)をSPCITの下に置くようにする。このようにSPCITは、一般情報のSPCITジェネラル・インフォメーション(SPCIT−GI)と、タイム・コントロール・データ・インフォメーション(SPCIT−TCDI)と、スチルピクチャ・ページ制御コマンド・インフォメーション(SPPI)とから構成される。
【0117】
また、ここで、図38のSPCTパックのスチル・ピクチャ・データの中に、スチルピクチャのページ制御するためのサイド情報を含むようにすることができる。このサイド情報により規定されたページ制御データをSPPIを参照しながら解釈して行うようにする。なお、スチル・ピクチャ・データに収めるには容量に余裕がない場合は、RTIパックのRTIデータの中に、上記したスチルピクチャのページ制御するためのサイド情報を含むようにすることも許容できる。
【0118】
次に、上記のようにフォーマット化されたデジタルオーディオ信号を通信回線を介して伝送する実施例について説明する。まず、図63〜図67を参照して送信側であるパッキング装置について説明する。パッキング装置は図63に示すようにパッキング処理部30と、バッファメモリ30Bと、コントロール回路29と、操作部27とディスプレイ28を有する。そして、図64〜図67において、まず、ビデオ信号Vと、静止画信号SPと、オーディオ信号Aとリアルタイム情報RTIとディスク識別子(EX)が入力すると、ステップS100では図65に詳しく示すようにオーディオパックを生成し(ステップS101)、次いでビデオパックを生成し(ステップS102)、次いで静止画パックを生成し(ステップS103)、次いでリアルタイムテキストを生成する(ステップS104)。
【0119】
次いでセル(ATS−C)を管理し(ステップS200)、次いでPTT(パートオブタイトル)を管理し(ステップS300)、次いでタイトル(AOTT−AOB)を管理し(ステップS400)、次いでタイトルセット(AOTT−AOBSを管理する(ステップS500)。続くステップS600ではATSを生成するために、図66に詳しく示すようにタイトルセットを生成し(ステップS601)、次いでメニューを生成する(ステップS602)。次いでATS−PGCIのカテゴリを記載し(ステップS603)、次いでビットシフトを含むPGコンテンツから成るPGITを生成してPGCIを生成することによりATS−PGCITを生成する(ステップS604)。次いで属性、係数のMATを生成することによりATSIを生成する(ステップS605)。次いでAMGを生成し(ステップS700)、最後にTOCを生成する(ステップS800)。
【0120】
次に、上記のようにフォーマット化されたデジタルオーディオ信号を通信回線を介して伝送する場合には、図67に示すように、送信バッファに蓄えられている送信データを所定長に分割してパケット化し(ステップS41)、次いでパケットの先頭には宛て先アドレスを含むヘッダを付与し(ステップS42)、次いでこれをネットワーク上に出力する(ステップS43)。
【0121】
次に図68〜図72を参照してデータ受信側について説明する。図68に示すようにデータ受信側のアンパッキング装置は、アンパッキング処理部60と、バッファメモリ60Bと、パラメータメモリ56と、コントロール回路59と、操作部57とディスプレイ58を有する。まず、図69に示すように、ネットワークから受信したパケットからヘッダを除去し(ステップS51)、次いで受信データを復元し(ステップS52)、次いでこれをメモリに転送する(ステップS53)。
【0122】
次に図70〜図72に示すように、まず、AMGをデコードしてATSを検出し(ステップS1100)、続くステップS1200では目的のATSのATSIをデコードするために、図71に詳しく示すようにATS−PGCIのカテゴリをデコードし(ステップS1201)、次いでビットシフトを含むPGコンテンツから成るPGITをデコードし(ステップS1202)、次いでMATの属性、係数をデコードし(ステップS1203)、次いでこれらのデコードした各パラメータをパラメータメモリ56に設定する(ステップS1204)。
【0123】
次いで再生が開始されると、パックを識別し(ステップS1300)、続くステップS1400ではパックをデコードするために、図72に詳しく示すようにオーディオパックをデコードし(ステップS1401)、次いでビデオパックをデコードし(ステップS1402)、次いで静止画パックをデコードし(ステップS1403)、次いでリアルタイムテキストをデコードする(ステップS1404)。そしてこれらの各パックからデコードしたオーディオ信号と、ビデオ信号と、静止画信号とリアルタイムテキスト信号を出力し(ステップS1500)、再生中にはステップS1300〜ステップS1500の処理を繰り返す。
【0124】
次に図31に示したSPS(スチルピクチャセット)すなわちASVS(オーディオ・スチル・ビデオ・セット)について図73〜図80を参照して詳しく説明する。ここで、以下に示すスチル・ピクチャ・オブジェクト・セット(SPOBS)についても、サブピクチャ(SP)との混同を避けるためにオーディオ・スチル・ビデオ・オブジェクト・セット(ASVOBS)とも言う。図73に示すようにASVS(オーディオ・スチル・ビデオ・セット)は、図74、図75に詳しく示すASVSインフォメーション(ASVSI)と、図76に詳しく示すオーディオ・スチル・ビデオ・オブジェクト・セット(ASVOBS)とバックアップASVSIにより構成されている。
【0125】
ASVSインフォメーション(ASVSI)は、図74に詳しく示すオーディオ・スチル・ビデオ・ユニット・インフォメーション(ASVUI)と、図75に詳しく示すASVアドレスマップ(ASV−ADMAP)とスタッフィングエリア(00h)により構成されている。
【0126】
ASVUI(合計888バイト)は図74に示すように
・12バイトのASVS−IDと、
・2バイトのASVUの数と、
・2バイトの保留エリアと、
・4バイトのASVOBSスタートアドレスと、
・4バイトのASVOBSエンドアドレスと、
・2バイト×4のASVUアトリビュート#0〜#3と、
・4バイト×16のASVOBSサブピクチャパレット#0〜#15と、
・8バイト×99のASVU#1〜#99一般情報
により構成されている。
【0127】
図73に示したASVアドレスマップ(ASV−ADMAP)は、図75に詳しく示すようにm(≦99)個のASVU#1〜#mにより構成され、ASVU#1〜#mの各々はASVU#1〜#99のスタートアドレスにより構成されている。
【0128】
次に図73に示したオーディオ・スチル・ビデオ・オブジェクト・セット(ASVOBS)について説明する。オーディオ・スチル・ビデオ・オブジェクト(ASVOB)は1つのオーディオ・スチル・ビデオ(ASV)のプレゼンテーションデータであって、ボタン用のハイライト(HLT)インフォメーションデータと、同じくボタン用のサブピクチャ(SP)データとスチルピクチャ(SPCT)データを含む。ただし、
・1つのASVOB内には1つのスチルピクチャ(SPCT)データのみが含まれる。
・1つのASVOB内には1つのハイライト(HLT)インフォメーションデータのみを含むことができる。ハイライトインフォメーションはスチルピクチャのボタンを操作するために用いられる。
・1つのASVOB内にはスチルピクチャモードに応じて1ないし3のサブピクチャ(SP)データを含むことができる。SPデータはスチルピクチャのボタンを表示するために用いられる。
【0129】
図73に示したオーディオ・スチル・ビデオ・オブジェクト・セット(ASVOBS)は図76に示すように上記のASVOBの集合体である。ASVOBは図76(a)に示すように、ハイライト(HLT)パックを先頭に配置するもののハイライト情報を含まない空のパックとしてHLTパックとして機能させないために、実質的にスチルピクチャ(SPCT)パックのみを含むものと、図76(b)に示すようにハイライト(HLT)パックと、サブピクチャ(SP)パックとスチルピクチャ(SPCT)パックを含むものの2種類がある。
【0130】
ハイライト(HLT)パックは図77(a)に示すように、14バイトのパックヘッダと、システムヘッダと2013バイトのハイライト情報パケットにより構成されている。ハイライト情報パケットは6バイトのパケットヘッダと、1バイトのサブストリームIDと694バイトのハイライト情報(ASV−HLI)により構成されている。システムヘッダは4バイトのシステムスタートコードと、2バイトのヘッダ長と、3バイトのレートバウンドと、2バイトのオーディオバウンドと、1バイトの制限フラグと、9バイトのストリームIDの各エリアにより構成されている。
【0131】
ハイライト情報(ASV−HLI)は図78に示すように、ASVハイライト一般情報(22バイト)と、ASVボタンカラー情報テーブル(8バイト×3)と、ASVボタン情報テーブル(18バイト×36)から構成される。ASVボタン情報テーブルはASVボタン情報#1〜#nから成り、各ASVボタン情報#iはピクチャ制御コマンドであるASVボタンコマンドを含む。このASVボタンコマンドには図81に示すボタンが操作されたときのナビコマンドが記述される。
【0132】
これに対し、SPCTパックとSPパックは図77(b)に示すように、14バイトのパックヘッダと2025バイトのスチルピクチャパケット又はサブピクチャパケットにより構成され、パックヘッダは4バイトのパックスタートコードと、6バイトのSCRと、3バイトのプログラムmuxレートと、9又は22バイトのスタッフィング長により構成されている。
【0133】
スチルピクチャ(SPCT)パケットは図79に詳しく示すようにSPCTパケットヘッダとスチルピクチャ用のビデオデータを含む。このSPCTパケットヘッダは、先頭において必ず設けられる9バイトのSPCTパケット情報と、静止画の最初のSPCTパケットの場合にのみ設けられる5+5バイトのSPCTパケット情報と、ASVOBの最初のSPCTパケットの場合にのみ設けられる3バイトのSPCTパケット情報を含む。
【0134】
サブピクチャ(SP)パケットは図80に詳しく示すようにSPパケットヘッダとサブピクチャデータを含む。このSPパケットヘッダは、先頭において必ず設けられる9バイトのSPパケット情報と、SPユニットの最初のSPパケットの場合にのみ設けられる5バイトのSPパケット情報と、ASVOBの最初のSPパケットの場合にのみ設けられる3バイトのSPパケット情報を含む。そして、このようなデータ構造に基づいてデコーダ側では、図81に示すようにメインピクチャと、サブピクチャとハイライト情報が合成されて表示される。
【0135】
次に図82以下を参照して第5の実施形態の変形例のデータ構造について説明する。ここで、図31(B)に示したデータ構造では、スチルピクチャ・コントロール・インフォメーション・テーブル(SPCIT)がATS内においてATSI−MAT及びATS−PGCITとは独立して設けられているが、この変形例では図82に示すようにATS−PGCIT内に設けられている。なお、以下の説明ではサブピクチャ(SP)との混同を避けるために、SPCITをATS−ASV−PBIT(ATSオーディオスチルビデオ・プレイバックインフォメーションテーブル)と言う。
【0136】
このATS−ASV−PBITは図83に詳しく示すように、図49に示したATS−PBITにおいて追加して設けられ、図84、図85に詳しく示すm個のプログラム#1〜#mの各ATS−ASV−プレイバックインフォメーション・サーチポインタ(ATS−PG−ASV−PBI−SRP#1〜#m)と、図86〜図90に詳しく示すn個のATS−ASV−PBI#1〜#nを有する(n≦m≦99)。このSRP#1〜#mの各々は、図84に示すように
・1バイトのASVU番号と、
・1バイトのASVディスプレイモード(ASV−DMOD)と、
・2バイトのATS−ASV−PBIスタートアドレスと、
・2バイトのATS−ASV−PBIエンドアドレスと
により構成されている。
【0137】
ASVU番号は「1」から「99」の範囲の値である。ASVディスプレイモードは、図85に詳しく示すように
・4ビット(b7〜b4)の保留エリアと、
・2ビット(b3、b2)のディスプレイタイミングモードと、
・2ビット(b1、b0)のディスプレイオーダモードと
により構成されている。上記データを以下に詳しく示す。
(1)ディスプレイタイミングモード
00b:スライドショー
01b:ブラウザブル
その他:保留
(2)ディスプレイオーダモード
00b:シーケンシャル
01b:ランダム
11b:シャッフル
その他:保留
【0138】
ATS−ASV−PBI#1〜#nの各々は、図86に示すように10バイト×k個(k≦99)のASVディスプレイリストを含む。図87はディスプレイタイミングモード(b3、b2)がスライドショー(00b)であって、ディスプレイオーダモード(b1、b0)がシーケンシャル(00b)の場合のASVディスプレイリストを示し、このリストは
・8ビット(b79〜b72)のASV番号と、
・8ビット(b71〜b64)の保留領域と、
・8ビット(b63〜b56)の、ASVのスタート時に強制的に選択されるボタン番号(FOSL−BTNN)と、
・8ビット(b55〜b48)の、ASVのスタート時にプレーバックされるプログラム番号と、
・8ビット×4(b47〜b16)のディスプレイスタートタイミング(31〜0)と、
・4ビット(b15〜b12)のスタートエフェクトモードと、
・4ビット(b11〜b8)のスタートエフェクト期間と、
・4ビット(b7〜b4)のエンドエフェクトモードと、
・4ビット(b3〜b0)のエンドエフェクト期間と
により構成されている。
【0139】
上記データの内容を以下に詳しく示す。
(1)ディスプレイスタートタイミング(31〜0)は、スタートPTSからのディスプレイのスタートタイミングを示し、31〜0/90000(秒)を表す。
(2)スタートエフェクトモード(b15〜b12)
0000b:カットイン
0001b:フェードイン
0010b:ディゾルブ
0011b:ワイプ・フロム・トップ
0100b:ワイプ・フロム・ボトム
0101b:ワイプ・フロム・レフト
0110b:ワイプ・フロム・ライト
0111b:ワイプ・ダイアゴナル・レフト
1000b:ワイプ・ダイアゴナル・ライト
その他 :保留
(3)エンドエフェクトモード(b7〜b4)
0000b:カットアウト
0001b:フェードアウト
その他 :(2)スタートエフェクトモード(b15〜b12)と同じ
【0140】
図88は図85のディスプレイモードにおいてディスプレイタイミングモード(b3、b2)がスライドショー(00b)であって、ディスプレイオーダモード(b1、b0)がランダム(01b)の場合のASVディスプレイリストを示し、このリストでは8ビット(b79〜b72)が保留となる他は図87に示すリストと同一となる。図89は図85のディスプレイモードにおいてディスプレイタイミングモード(b3、b2)がブラウザブル(01b)であって、ディスプレイオーダモード(b1、b0)がシーケンシャル(00b)の場合のASVディスプレイリストを示し、このリストでは8ビット(b55〜b48)が保留となる他は図97に示すリストと同一となる。図90は図85のディスプレイモードにおいてディスプレイタイミングモード(b3、b2)がブラウザブル(01b)であって、ディスプレイオーダモード(b1、b0)がランダム(01b)の場合のASVディスプレイリストを示し、このリストでは8ビット(b79〜b72)と8ビット(b55〜b48)が保留となる他は図87に示すリストと同一となる。
【0141】
上記エンコード装置及びデコード装置は、上記エンコード方法及びデコード方法をコンピュータプログラムとしてROMなどのICチップに記憶しておき、このプログラムによりコンピュータのCPU(中央演算処理装置)を作動させることによっても実現できる。本発明はまた、DVDなどの記録媒体を介して伝送するのみならず、インターネットやカラオケ通信回線などの通信回線を介して伝送して再生側ではハードウエアやPC上のアプリケーションにより処理する場合にも適用することができる。
【0142】
【発明の効果】
以上説明したように本発明によれば、オーディオ信号を主として記録する場合にユーザにとって簡易に再生することができて使い勝手がよく、また、実時間の管理を簡単にすることができる。
【図面の簡単な説明】
【図1】DVD−ビデオのフォーマットと、本発明に適用されるDVD−オーディオのフォーマットの第1実施形態を示す説明図である。
【図2】図1のオーディオマネージャ(AMG)のフォーマットを詳しく示す説明図である。
【図3】図1のオーディオタイトルセット(ATS)のフォーマットを詳しく示す説明図である。
【図4】図2のオーディオマネージャインフォメーション(AMGI)のフォーマットを詳しく示す説明図である。
【図5】図4のオーディオタイトルセット・アトリビュートテーブル(ATS−ATRT)のフォーマットを詳しく示す説明図である。
【図6】図5のオーディオタイトルセット・アトリビュートデータ(ATS−ATR)のフォーマットを詳しく示す説明図である。
【図7】図3のオーディオタイトルセットインフォメーション(ATSI)のフォーマットを詳しく示す説明図である。
【図8】図7のオーディオタイトルセットインフォメーション・マネージメントテーブル(ATSI−MAT)のフォーマットを詳しく示す説明図である。
【図9】図8のオーディオタイトルセットメニュー・オーディオストリーム・アトリビュートデータ(ATSM−AST−ATR)を詳しく示す説明図である。
【図10】図8のオーディオタイトルセット・オーディオストリーム・アトリビュートテーブル(ATS−AST−ATRT)のフォーマットを詳しく示す説明図である。
【図11】図10の各オーディオストリームのアトリビュートデータ(ATS−AST−ATR)を詳しく示す説明図である。
【図12】図1のオーディオコンテンツブロックユニット(ACBU)を示す説明図である。
【図13】図12のオーディオパックとビデオパックのフォーマットを詳しく示す説明図である。
【図14】図12のオーディオコントロール(A−CONT)パックのフォーマットを詳しく示す説明図である。
【図15】図14のオーディオキャラクタディスプレイ(ACD)エリアのフォーマットを詳しく示す説明図である。
【図16】図15のネームスペース情報により表示される例を示す説明図である。
【図17】図14のオーディオサーチデータ(ASD)エリアのフォーマットを詳しく示す説明図である。
【図18】図1のオーディオコンテンツブロックユニットの変形例を示す説明図である。
【図19】第2の実施形態におけるオーディオマネージャインフォメーション(AMGI)のフォーマットを詳しく示す説明図である。
【図20】図19のTOC情報を詳しく示す説明図である。
【図21】第3の実施形態のオーディオタイトルセットインフォメーション(ATSI)のフォーマットを詳しく示す説明図である。
【図22】第4の実施形態のDVD−オーディオディスクの基本フォーマットを示す説明図である。
【図23】図22のDVD−オーディオディスクのオーディオデータ構造を示す説明図である。
【図24】DVD−Vanディスクの基本フォーマットを示す説明図である。
【図25】DVDビデオディスクの基本フォーマットを示す説明図である。
【図26】DVD−Avdディスクの基本フォーマットを示す説明図である。
【図27】第4の実施形態のDVD−オーディオディスクにおけるAOTT−AOB−ATRを示す説明図である。
【図28】第4の実施形態のDVD−AvdディスクにおけるリニアPCMのプライベートヘッダを示す説明図である。
【図29】本発明に適用されるオーディオ信号のエンコード装置の一実施形態を示すブロック図である。
【図30】図29の信号処理回路を詳細に示すブロック図である。
【図31】第5の実施形態のデータ構造を示す説明図である。
【図32】図31のオーディオ・オンリ・タイトル用オーディオ・オブジェクト・セット(AOTT−AOBS)を詳しく示す説明図である。
【図33】図32のオーディオパックの一例を詳しく示す説明図である。
【図34】図33のプライベートヘッダを詳しく示す説明図である。
【図35】図34のUPC/EAN−ISRCデータを詳しく示す説明図である。
【図36】図33のオーディオデータのビットシフトを示す説明図である。
【図37】図32のリアルタイム・インフォメーション(RTI)パックを詳しく示す説明図である。
【図38】スチルピクチャ(SPCT)パックを詳しく示す説明図である。
【図39】図31のオーディオ・タイトルセット・インフォメーション・マネージメント・テーブル(ATSI−MAT))を詳しく示す説明図である。
【図40】図39のオーディオ・オンリ・タイトル用オーディオ・オブジェクト・アトリビュート(AOTT−AOB−ATR)を詳しく示す説明図である。
【図41】図39のオーディオ・オンリ・タイトル用ビデオ・オブジェクト・オーディオストリーム・アトリビュート(AOTT−VOB−AST−ATR)を詳しく示す説明図である。
【図42】図40及び図41のチャネル割当情報を詳しく示す説明図である。
【図43】図39のダウンミックス係数(ATS−DM−COEFT)を詳しく示す説明図である。
【図44】図39のスチルピクチャ・データ・アトリビュート(ATS−SPCT−ATR)を詳しく示す説明図である。
【図45】図31のオーディオ・タイトルセット・プログラム・チェーン・インフォメーション・テーブル(ATS−PGCIT)を詳しく示す説明図である。
【図46】図45のATS−PGCITインフォメーション(ATS−PGCITI)を詳しく示す説明図である。
【図47】図45のATS−PGCIサーチポインタ(ATS−PGCI−SRP)を詳しく示す説明図である。
【図48】図47のATS−PGCカテゴリ(ATS−PGCI−CAT)を詳しく示す説明図である。
【図49】図45のオーディオ・タイトルセット・プログラム・チェーン・インフォメーション(ATS−PGCI)を詳しく示す説明図である。
【図50】図49のATS−PGCジェネラル・インフォメーション(ATS−PGC−GI)を詳しく示す説明図である。
【図51】図50のATS−PGCコンテンツ(ATS−PGC−CNT)を詳しく示す説明図である。
【図52】図49のATSプログラム・インフォメーション・テーブル(ATS−PGIT)を詳しく示す説明図である。
【図53】図52のATSプログラム・インフォメーション(ATS−PGI)を詳しく示す説明図である。
【図54】図53のATS−PGコンテンツ(ATS−PG−CNT)を詳しく示す説明図である。
【図55】図52のATSセル・プレイバック・インフォメーション・テーブル(ATS−C−PBIT)を詳しく示す説明図である。
【図56】図55のATSセル・プレイバック・インフォメーション(ATS−C−PBI)を詳しく示す説明図である。
【図57】図56のATS−Cタイプ(ATS−C−TY)を詳しく示す説明図である。
【図58】第5の実施形態のエンコード装置を示すブロック図である。
【図59】図58のエンコード装置の処理を示すフローチャートである。
【図60】第5の実施形態のデコード装置を示すブロック図である。
【図61】図60のデコード装置を機能的に示すブロック図である。
【図62】図60、図61のデコード装置の処理を示すフローチャートである。
【図63】第5の実施形態のオーディオ信号を伝送する場合のパッキング装置を示すブロック図である。
【図64】図63のパッキング装置のパッキング処理を示すフローチャートである。
【図65】図64のパック生成処理を詳しく示すフローチャートである。
【図66】図64のATS生成処理を詳しく示すフローチャートである。
【図67】図63のパッキング装置の送信処理を示すフローチャートである。
【図68】第5の実施形態のオーディオ信号を伝送する場合のアンパッキング装置を示すブロック図である。
【図69】図68のアンパッキング装置の受信処理を示すフローチャートである。
【図70】図68のアンパッキング装置のアンパッキング処理を示すフローチャートである。
【図71】図70のATSIデコード処理を詳しく示すフローチャートである。
【図72】図70のパックデコード処理を詳しく示すフローチャートである。
【図73】図31のSPS(スチルピクチャセット)すなわちASVS(オーディオ・スチル・ビデオ・セット)を詳しく示す説明図である。
【図74】図73のASVUI(オーディオ・スチル・ビデオ・ユニット・インフォメーション)を詳しく示す説明図である。
【図75】図73のASV−ADMAP(オーディオ・スチル・ビデオ・アドレスマップ)を詳しく示す説明図である。
【図76】図73のASVOBS(オーディオ・スチル・ビデオ・オブジェクト・セット)を詳しく示す説明図である。
【図77】図76のハイライト情報パック、スチルピクチャパック及びサブピクチャパックを詳しく示す説明図である。
【図78】図77のハイライト情報を詳しく示す説明図である。
【図79】図77のスチルピクチャパケットを詳しく示す説明図である。
【図80】図77のサブピクチャパケットを詳しく示す説明図である。
【図81】図78のハイライト情報パック、スチルピクチャパック及びサブピクチャパックによる表示画面を示す説明図である。
【図82】図31のデータ構造の変形例を示す説明図である。
【図83】図82のスチルピクチャ・コントロール・インフォメーション・テーブル(SPCIT)すなわちATS−ASV−PBIT(ATSオーディオスチルビデオ・プレイバックインフォメーションテーブル)を詳しく示す説明図である。
【図84】図83のATS−ASV−プレイバックインフォメーション・サーチポインタ(ATS−PG−ASV−PBIT−SRP#1〜#m)を詳しく示す説明図である。
【図85】図84のASVディスプレイモードを詳しく示す説明図である。
【図86】図83のATS−ASV−PBI(ATSオーディオスチルビデオ・プレイバックインフォメーション)を詳しく示す説明図である。
【図87】図86のASVディスプレイリストを詳しく示す説明図である。
【図88】図86の他のASVディスプレイリストを詳しく示す説明図である。
【図89】図86の他のASVディスプレイリストを詳しく示す説明図である。
【図90】図86の他のASVディスプレイリストを詳しく示す説明図である。
【符号の説明】
Aパック 第1のパック
AOB オーディオオブジェクト
AOBS オーディオオブジェクトセット
ATSI オーディオタイトルセット・インフォメーション
ATSI−MAT オーディオタイトルセット・インフォメーション・マネージメント・テーブル
RTIパック 第2のパック
SPS スチルピクチャセット
ASVS オーディオ・スチル・ビデオ・セット
SPCTパック 第3のパック[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to encoding an audio signal.Method, Audio signal transmission / reception method, and computer program recording medium, And decoding method of audio signalAbout.
[0002]
[Prior art]
A CD (compact disc) is known as a conventional optical disc for audio reproduction. A DVD (digital video disk) is known as an optical disk having a higher density than a CD.
[0003]
[Problems to be solved by the invention]
However, in a DVD (hereinafter, DVD-video), a video signal is recorded as a main signal, and an audio signal is recorded as a sub signal.
(1) The audio signal is integrated with the video signal, and the recording capacity of the audio signal is small.
(2) The time of the audio signal cannot be managed.
(3) Simple character information such as a song title cannot be extracted.
[0004]
Also, since audio users have a wider range of usage layers than video, a simple reproduction method is required by providing a TOC (table of contents) area like a CD. However, in the case of DVD-video, a navigation control pack (CONT pack), a plurality of video (V) packs and an audio (A) pack constitute a video content block unit, and playback of the V and A packs is controlled by the CONT pack. Therefore, there is a problem in that even if an audio signal is mainly recorded, it cannot be easily reproduced for the user, and the usability is poor.
[0005]
Further, in DVD-Video, time management is performed only in video frame units. Therefore, even if an audio signal is mainly recorded, continuity of the audio signal is more important than video, so that real-time management is difficult. There is a problem.
[0006]
Accordingly, the present invention provides an audio signal encoding that can be easily reproduced and convenient for a user when mainly recording an audio signal, and can simplify real-time management.Method, Audio signal transmission and reception method, and computer program recording medium, And decoding method of audio signalThe purpose is to provide.
[0007]
[Means for Solving the Problems]
The present invention comprises the following means 1) to 4) to achieve the above object.
That is,
[0008]
1)Multi-channelAnalog audio signalAnd the first and second sampling frequencies (fs1, fs2) which are the same or different for the first group of channels and the second group of channels, respectively.A / D conversion to generate audio dataStepsWhen,
An audio title set (ATS) including a plurality of audio objects (AOB) and a still picture set (SPS);
SaidAudio object (AOB)But,
As actual dataSaidConstituted only by the first pack having audio dataConsists of a first type of audio cell (ATS-C)FirstAudio object (AOB)When,
The first pack and a second pack having real-time information data on the audio data as actual data.Consists of a second type of audio cell (ATS-C)SecondAudio object (AOB)It consists of two types,
In addition,Still picture set (SPS)Has a third pack containing still picture data for said audio data,
SaidThe audio title set (ATS) includes type identification data (ATS-C-TY) for identifying the type of the audio cell (ATS-C), and the plurality of audio objects (AOB) are reproduced in a predetermined reproduction order. Information (ATS-PGCIT) having audio cell playback information (ATS-C-PBI) for controlling reproduction in units of audio cells.Audio title set information (ATSI) is placed,The audio title set information (ATSI) is control information for page-controlling still picture data in the still picture set (SPS), and is a mode for identifying a sequential playback mode (sequential) and a random playback mode (random). Has still picture control information (SPCIT) including data (display order mode),
The first pack further includes a packet in which the audio data is recorded, and the packet further includes a private header in which first and second sampling frequencies (fs1, fs2) of the audio data are recorded. Is configured to have
Format to data structureStepsWhen,
Encoding of audio signals consisting ofMethod.
2)1)Encoding of audio signal described inGenerated by encodingAn audio signal transmission / reception method for transmitting or receiving data having a data structure,
Converting the data into a predetermined communication format and transmitting the data, or receiving the data converted into the predetermined communication format and restoring the original dataHavingAudio signal transmission and reception method.
3)1)Encoding of audio signal described inGenerated by encodingA recording medium of a computer program in which a computer program for decoding data in which the data structure is recorded is recorded,
A still picture is obtained from audio title set information (ATSI) arranged in the recorded audio title set (ATS).Picture control including mode data (display order mode)Decoding information (SPCIT)Mode data (display order mode)A first decoding step of extracting
Said recordedAudio title set (ATS), A second pack, and a third pack arranged in a still picture set (SPS).A second decoding step of identifying
A third decoding step of decoding audio data, real-time information data, and still picture data from each of the packs extracted from the second decoding step;
At least taken from the first decoding stepBased on mode data (display order mode)The still picture data extracted in the second decoding step isControlled alone and / or with the audio dataOutputting a computer program.
4)1)Encoding of audio signal described inGenerated by encodingThe recorded data to decode the recorded dataAudio signal decoding methodAnd
A still picture is obtained from audio title set information (ATSI) arranged in the recorded audio title set (ATS).Picture control including mode data (display order mode)Decode information (SPCIT)To retrieve mode data (display order mode)A first decoding step;
Said recordedAudio title set (ATS), A second pack, and a third pack arranged in a still picture set (SPS).IdentifyA second decoding step;
A third decoding step of decoding audio data, real-time information data, and still picture data from each of the packs extracted from the second decoding step;
At least taken from the first decoding stepBased on mode data (display order mode)Controlling the still picture data extracted in the second decoding step,Alone / or as aboveOutputting together with the audio data.Audio signal decoding method.
[0009]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is an explanatory diagram showing an embodiment of a DVD-video format and a DVD-audio format applied to the present invention. FIG. 2 is an explanatory diagram showing the format of an audio manager (AMG) in FIG. 1 in detail. 3 is an explanatory diagram showing the format of the audio title set (ATS) of FIG. 1 in detail, FIG. 4 is an explanatory diagram showing the format of the audio manager information (AMGI) of FIG. 2 in detail, and FIG. 5 is an audio title set attribute of FIG. FIG. 6 is an explanatory diagram showing the format of the table (ATS-ATRT) in detail, FIG. 6 is an explanatory diagram showing the format of the audio title set attribute data (ATS-ATR) of FIG. 5 in detail, and FIG. 7 is the audio title set information (ATS-ATR) of FIG. ATSI) Former FIG. 8 is an explanatory diagram showing the format of the audio title set information management table (ATSI-MAT) shown in FIG. 7 in detail, and FIG. 9 is an audio title set menu audio stream attribute data (ATSM) shown in FIG. FIG. 10 is an explanatory diagram showing the format of the audio title set audio stream attribute table (ATS-AST-ATRT) of FIG. 8 in detail. FIG. 11 is an explanatory diagram showing each audio stream of FIG. FIG. 4 is an explanatory diagram showing in detail attribute data (ATS-AST-ATR).
[0010]
FIG. 12 is an explanatory diagram showing the audio content block unit (ACBU) of FIG. 1, FIG. 13 is an explanatory diagram showing the format of the audio pack and video pack of FIG. 12 in detail, and FIG. FIG. 15 is an explanatory diagram showing the format of the audio character display (ACD) area in FIG. 14 in detail, and FIG. 16 is an explanatory diagram showing an example displayed by the namespace information in FIG. FIG. 17 is an explanatory diagram showing the format of the audio search data (ASD) area in FIG. 14 in detail, and FIG. 18 is an explanatory diagram showing a modification of the audio content block unit in FIG.
[0011]
Here, the DVD-audio disc described in this description has a stereo 2-channel and a 5/6 / 8-channel multi-channel as an audio signal so as to correspond to a transition period when shifting from the CD generation to the DVD-audio generation. Are recorded. When the transition period has elapsed, it is considered that only the multi-channel signal of 5/6/8 channel is recorded. Even when only a multi-channel signal is recorded, a two-channel signal can be generated from the multi-channel signal by a downmix coefficient during reproduction. The generated two-channel signal is positioned as simple reproduction.
[0012]
FIGS. 1A and 1B show DVD-video and DVD-audio formats, respectively. The DVD-audio format has different area names but is compatible with DVD-video. First, the DVD-video format is roughly composed of a video manager (VMG) at the head and each area of a plurality of video title sets (VTS) following the format. On the other hand, the DVD-audio format corresponds to the figure. 2 and an audio title set (ATS) following the AMG, as shown in detail in FIG.
[0013]
Each of the VTSs is composed of the first VTS information (VTSI), followed by one or more video content block sets (VCBS) and the last VTSI, while each of the ATSs corresponds to the first ATS information (ATSI). ), Followed by one or more audio content block sets (ACBS) and the last ATSI. In ATSI, the playing time of each song in the ACBS is set in real time.
In the present invention, menu information for displaying a menu screen is recorded in the first ACBS. This is the same as a DVD video, and the description is omitted.
[0014]
Each of the VCBSs is made up of a plurality of VCBs, while each of the ACBSs is made up of a plurality of ACBs. Each of the VCBs corresponds to one title of the video, and each of the ACBs corresponds to one title of the audio. Each VCB (one title) is constituted by a plurality of chapters (Chapter), while each ACB (one title) is correspondingly constituted by a plurality of tracks (Track). A chapter contains a part of title (PTT) and a track contains a part of title (PTT).
[0015]
Each of the chapters is constituted by a plurality of cells (CELL), while each of the tracks is correspondingly constituted by a plurality of indexes (Index). Each of the cells is composed of a plurality of VCBU units (VCBU), while each of the indexes is correspondingly composed of a plurality of ACB units (ACBU). Each of the VCB unit and the ACB unit is composed of a plurality of packs, and one pack is composed of 2048 bytes.
[0016]
Each VCB unit is composed of a head control pack (hereinafter referred to as a CONT pack), followed by an audio (A) pack, a plurality of video (V) packs, and sub-picture (SP) packs. Each of them is constituted by a head audio control pack (hereinafter, A-CONT pack) corresponding thereto, followed by a plurality of A packs and V packs.
[0017]
In the CONT pack, information for controlling the subsequent V pack is arranged. In the A-CONT pack, information for managing the audio signal of the subsequent A pack, such as the TOC information of the CD, is arranged. Audio data is arranged in the A pack, and closed caption (CC) data other than audio data, for example, is arranged in the V pack in addition to video data.
[0018]
AMG (Audio Manager), as shown in FIG.
Audio manager information (AMGI) shown in detail in FIG.
An audio content block set (AMGM-ACBS) for the AMG menu;
・ AMGI for backup
Having. AMGM-ACBS is used as control information.
・ Presentation control information (PCI)
・ Data search information (DSI)
Having.
[0019]
ATS (Audio Title Set) is as shown in FIG.
Audio title set information (ATSI) shown in detail in FIG.
An audio content block set (ATSM-ACBS) for the ATS menu;
An audio content block set (ATSA-ACBS) for ATS titles;
・ ATSI for backup
Having. Both ATSM-ACBS and ATSA-ACBS have the PCI and DSI described above (FIG. 2).
[0020]
AMGI (Audio Manager Information), as shown in detail in FIG.
・ AMGI management table (AMGI-MAT)
A title search pointer table (T-SRPT);
An audio manager menu PGCI unit table (AMGM-PGCI-UT);
-Parental management information table (PTL-MAIT)
An audio title set attribute table (ATS-ATRT);
A text data manager (TXTDT-MG);
An audio manager menu cell (index) address table (AMGM-C-ADT);
-Audio manager menu-Audio content block unit-Addressless map (AMGM-ACBU-ADMAP)
Having.
[0021]
The ATS-ATRT (audio title set attribute table), as shown in detail in FIG.
Audio title set attribute table information (ATS-ATRTI);
An audio title set attribute search pointer (ATS-ATR-SRP # 1 to #n) of each of a plurality (n) of ATSs;
-Audio title set attribute data (ATS-ATR- # 1- # n) of each of a plurality (n) of ATSs as shown in detail in FIG.
Having.
[0022]
Each of the audio title set attribute data (ATS-ATR- # 1 to #n) is, as shown in detail in FIG.
ATS-ATR-EA (end address)
-ATS-CAT (category),
・ ATS-ATRI (information)
Having.
[0023]
The ATSI (ATS information) shown in FIG. 3 is, as shown in detail in FIG.
An audio title set information management table (ATSI-MAT) shown in detail in FIG.
An audio title set, a part of title, a search pointer table (ATS-PTT-SRPT),
-Audio title set-Program chain information table (ATS-PGCIT)
・ Audio title set menu ・ PGCI ・ Unit table (ATSM-PGCI-UT)
Audio title set time map table (ATS-TMAPT)
・ Audio title set menu ・ Cell address table (ATSM-C-ADT)
-Audio title set menu-Audio content block unit-Address map (ATSM-ACBU-ADMAP)
An audio title set cell address table (ATS-C-ADT);
-Audio title set-Audio content block unit-Address map (ATS-ACBU-ADMAP)
Having.
[0024]
The ATSI-MAT (Audio Title Set Information Management Table) shown in FIG.
ATS-ID (identifier);
ATS-EA (end address),
・ ATSI-EA,
・ VERN (DVD audio specification version number)
-ATS-CAT (category),
・ ATSI-MAT-EA,
ATSM-ACBS-SA (start address)
ATSA-ACBS-SA,
ATS-PTT-SRPT-SA,
ATS-PGCIT-SA,
ATSM-PGCI-UT-SA,
ATS-TMAP-SA,
ATSM-C-ADT-SA,
ATSM-ACBU-ADMAP-SA;
ATSM-AST-ATR (ATSM audio stream attribute) as shown in detail in FIG.
ATS-AST-Ns (the number of ATS audio streams);
ATS-AST-ATRT (ATS audio stream attribute table) as shown in detail in FIG.
Having.
[0025]
The ATSM-AST-ATR is composed of 8 bytes (bits b63 to b0) as shown in detail in FIG. 9, and the following data (1) to (4) as attributes of the encoded audio signal recorded on this disc. ) Is placed (other bits are reserved).
[0026]
(1) Audio encoding mode (3 bits b63 to b61)
000b: Dolby AC-3
010b: MPEG-1 or MPEG-2 (no extended bit stream)
011b: MPEG-2 (with extended bit stream)
100b: Linear PCM audio
101b: Linear PCM audio (including 2ch + 5ch, 2ch + 6ch, 2ch + 8ch)
[0027]
(2) Quantization / DRC (Dynamic Range Control) information (2 bits b55, b54)
"11b" when the audio encoding mode is "000b"
When the audio encoding mode is “010b” or “011b”,
00b: Dynamic range control data does not exist in MPEG audio stream
01b: Dynamic range control data exists in the MPEG audio stream
10b, 11b: pending
When the audio encoding mode is “100b” or “101b”, for stereo 2ch
00b: 16 bits
01b: 20 bits
10b: 24 bits
11b: pending
[0028]
(3) Sampling frequency fs (2 bits b53, b52)
For stereo 2ch
00b: 48 kHz
01b: 96 kHz
10b: 192 kHz
(4) Number of audio channels (3 bits b50 to b48)
000b: 1ch (monaural)
001b: 2ch (stereo)
010b: 3ch
011b: 4ch
100b: (stereo 2ch + 5ch)
101b: (stereo 2ch + 6ch)
110b: 7ch
111b: (stereo 2ch + 8ch)
[0029]
As shown in detail in FIG. 11, the ATS-AST-ATRT (ATS audio stream attribute table) shown in FIG. 10 has ATS-AST-ATR for each of audio streams # 0 to # 7, and ATS-AST-ATR. Are composed of 8 bytes (total of 64 bytes).
[0030]
As shown in FIG. 11, the ATS-AST-ATR of one audio stream is 8 bytes (bits b63 to b0) similar to the audio title set menu audio stream attribute data (ATSM-AST-ATR) shown in FIG. And in addition to the attribute data (1) to (4),
(5) Multi-channel extension (1 bit b60)
(6) audio type (2-bit b59, b58);
(7) Audio application mode (2-bit b57, b56)
(8) thinning information (2 bits b47, b46) of the stream (AST);
(9) Thinning-out information for only 1 channel of LFE (Low Frequency Effect) (2 bits b45, b44)
Of each data. And, in (7) audio application mode of this DVD audio disc,
11b: 2ch + surround mode
Are recorded as band information in both (8) thinning information of the stream and (9) thinning information of only LFE1ch.
00b: full (1/1)
01b: Half (1/2)
10b: Quota (1/4)
Is recorded.
[0031]
However, (4) the number of audio channels in the ATSM-AST-ATR is always 2ch in the audio stream # 0, and the audio stream # 1 includes the front 3ch. That is, for example, when an audio signal of one title is recorded in 2 + 6 channels, a stereo signal of 2 channels is allocated to the audio stream # 0, and a front signal of 3 channels is allocated to the audio stream # 1 among the 6 channels, and a rear signal of 2 channels and LFE1ch are allocated. Assign the signal to audio stream # 2. The audio manager information management table (AMGI-MAT) shown in FIG. 4 and the audio title set information management table (ATSI-MAT) shown in FIG. Is recorded.
[0032]
When the 2 + 6 ch analog audio signal is sampled at, for example, the following sampling frequency fs and quantized with the following quantization bit number and recorded,
Stereo 2ch: 48 kHz, 20 bits
Front 3ch: 96kHz, 16 bit
Rear 2ch, LFE1ch: 48kHz, 16 bits (no thinning)
The audio title set menu, audio stream, and attribute data (ATSM-AST-ATR) shown in FIG.
(1) Audio encoding mode
101b: Linear PCM audio (including 2ch + 5ch, 2ch + 6ch, 2ch + 8ch)
(2) Quantization / DRC
01b: 20 bits
(3) Sampling frequency fs
00b: 48 kHz
(4) Number of audio channels
101b: (stereo 2ch + 6ch)
Is recorded.
[0033]
Also, ATS-AST-ATR of audio stream # 0 has
(1) Audio encoding mode
101b: Linear PCM audio (including 2ch + 5ch, 2ch + 6ch, 2ch + 8ch)
(2) Quantization / DRC
01b: 20 bits
(3) Sampling frequency fs
00b: 48 kHz
(4) Number of audio channels
001b: 2ch (stereo)
(7) Audio application mode
11b: 2ch + surround mode
(8) Thinning information of the stream
00b: full (1/1)
(9) LFE1ch only thinning information
00b: full (1/1)
Is recorded.
[0034]
Also, ATS-AST-ATR of audio stream # 1 has
(1) Audio encoding mode
101b: Linear PCM audio (including 2ch + 5ch, 2ch + 6ch, 2ch + 8ch)
(2) Quantization / DRC
00b: 16 bits
(3) Sampling frequency fs
01b: 96 kHz
(4) Number of audio channels
010b: 3ch
(7) Audio application mode
11b: 2ch + surround mode
(8) Thinning information of the stream
00b: full (1/1)
(9) LFE1ch only thinning information
00b: full (1/1)
Is recorded.
[0035]
Also, ATS-AST-ATR of audio stream # 2 has
(1) Audio encoding mode
101b: Linear PCM audio (including 2ch + 5ch, 2ch + 6ch, 2ch + 8ch)
(2) Quantization / DRC
00b: 16 bits
(3) Sampling frequency fs
00b: 48 kHz
(4) Number of audio channels
010b: 3ch
(7) Audio application mode
11b: 2ch + surround mode
(8) Thinning information of the stream
00b: full (1/1)
(9) LFE1ch only thinning information
00b: full (1/1)
Is recorded.
[0036]
Next, the A pack in which an audio stream is recorded and its control pack will be described. As shown in FIG. 12, the VCB unit is constituted by an arbitrary number of packs for 0.4 to 1.0 seconds, and the ACB unit is constituted by an arbitrary number of packs for 0.5 to 1.0 seconds. I have. The A-CONT pack in the DVD-Audio ACB unit is arranged in the third pack in the DVD-Video VCB unit.
[0037]
The A-CONT pack is basically arranged in units of 0.5 second of the audio time, and is arranged so as to be completed within the range of 0.5 to 1.0 second at the break of the index. The audio time (GOF: Group of Audio Frame unit) is indicated by the A-CONT pack, and its data position is determined by the audio frame number, the number of the first access unit pointer, and the number of frame headers. The A-pack immediately before the A-CONT pack does not force padding in units of 0.5 seconds of the audio time.
[0038]
Adjacent A-packs are arranged so that audio signals are related to each other. For example, in the case of stereo, an L-channel pack and an R-channel pack are arranged adjacently, and a multi-channel of 5/6/8 channel is used. In such a case, they are similarly arranged adjacently. The V pack is arranged adjacent to the A pack when displaying an image during reproduction of an audio signal. As shown in FIG. 13, the A-pack and the V-pack have 4-byte pack start information and 6-byte SCR (System Clock Reference: system time reference value) for 2034 bytes of user data (A data and V data). ) Information, 3-byte mux rate information, and 1-byte stuffing, and a pack header of a total of 14 bytes is added (1 pack = 2048 bytes in total). In this case, the time of the A pack in the same title can be managed by setting the SCR information as the time stamp to be “1” in the first pack in the ACB unit so as to be continuous in the same title.
[0039]
On the other hand, as shown in FIG. 14, the A-CONT pack has a 14-byte pack header, a 24-byte system header, a 1003 byte ACD (Audio Character Display) packet, and a 1007 byte ASD (Audio Search Data). ) It is composed of packets. The ACD packet includes a 6-byte packet header, a 1-byte substream ID, 636-byte ACD (audio character display) information as shown in detail in FIG. 15, and a 360-byte reserved area. The ASD packet includes a 6-byte packet header, a 1-byte substream ID, and a 1000-byte ASD (audio search data) as shown in detail in FIG.
[0040]
The 636-byte ACD information area has a 48-byte general information area and a 294-byte area for each of the first language character "1" and the second language character "2" as shown in detail in FIG. Each of these areas is composed of a 93-byte name space area, two 93-byte free space areas, and a 15-byte data pointer area. For example, as shown in FIG. 16, data for displaying a song name in Japanese is arranged in one namespace area of the character “1” of the first language and the character “2” of the second language, and In the name space area, data to be displayed in English is arranged. This display language may be determined by the disc publisher.
[0041]
The 48-byte general information includes, for example, 16-byte service level information, 12-byte language code information, 6-byte character set code information, 6-byte display item information, and 2-byte “previous ACD information. Difference information and 6-byte hold information. The 16-byte service level information indicates display size, display type, audio / video / SP distinction, stream, and the like. Characters are mandatory (mandatory), and bitmaps are optional (optional). The 12-byte language code information indicates the language of the characters "1" and "2" in 2 bytes each as in the case of the video file, and indicates up to 8 languages in one file. English is mandatory.
[0042]
The 6-byte character set code information can have a maximum of 15 character codes corresponding to the language code, and indicates the presence / absence and type of the language of the characters "1" and "2" in 1 byte. A code example is shown below.
1. ISO646
2. ISO8859-1
3. MS-JIS
The 6-byte display item information indicates the free spaces “1” and “2”, the presence / absence of a data pointer, and the ID shown in FIG. The namespace is mandatory, and the title name, music name, and artist name must be described.
[0043]
As shown in detail in FIG. 17, the 1000-byte ASD (audio search data) has 16-byte general information, 8-byte current number (No.) information, 16-byte current time information, and 8-byte title. It is composed of set search information, 8-byte title search information, 404-byte track search information, 408-byte index search information, 80-byte highlight search information, and a 52-byte reserved area.
[0044]
The 8-byte current number information includes the current title number of the title set (2 bytes: BCD), the current track number of the title set (2 bytes: BCD), and the current index number of the track (2 bytes: BCD). ) And a reserved area (2 bytes). The 16-byte current time information includes the playback time of the track (4 bytes: BCD), the remaining playback time of the track (4 bytes: BCD), the absolute time of the title (4 bytes: BCD), and the rest of the title. (4 bytes: BCD).
[0045]
The 8-byte title set search information includes the first sector number (4 bytes) of the title set and the last sector number (4 bytes) of the title set. The 8-byte title search information includes a first sector number (4 bytes) of the title and a last sector number (4 bytes) of the title. The 404-byte track search information includes a track and sector number of the title (4 bytes × 99), a first track number of the title (4 bytes), and a last track number of the title (4 bytes).
[0046]
The 408-byte index search information includes a track index and a sector number (4 bytes × 100), a first index number of the track (4 bytes), and a last index number of the track (4 bytes). The 80-byte highlight search information includes a track in-sector number (4 bytes × 10) and a track out-sector number (4 bytes × 10).
[0047]
According to such a format, the A-CONT pack for managing the audio signal of the succeeding A pack, such as the TOC information of the CD, is arranged at the head of the plurality of A packs. However, the recording capacity can be increased. The A-CONT pack can manage audio time, and the A-CONT pack can extract simple character information such as a song title related to audio data.
[0048]
Also, since TOC information such as a title, a start address, and a playing time is arranged in the A-CONT pack, even during audio reproduction, information according to a user operation is taken out from the A-CONT pack and reproduction is started. be able to. Further, by arranging the TOC information in the audio manager information (AMGI) and the audio title set information (ATSI), the necessary TOC information is stored in the memory in the playback device, and the information according to the user operation is stored in the memory. And can immediately start playback. Also, since there is no need to store a large amount of information such as program chain information (PGCI) in DVD-Video, it is possible to efficiently manage the disk.
[0049]
further,
1. If there is no image (V) data in the content,
(1) Search and random access to three levels of title, music, and index become possible.
(2) Cueing, time search, and random access in GOF (audio frame) units can be performed.
(3) The time of title, music, and index can be managed in real time.
[0050]
Also,
2. If there is image (V) data in the content,
For audio data,
In addition to the above (1) to (3),
(4) The title, the current time in the music, and the remaining time can be displayed and managed in real time.
[0051]
For video data,
(1) Search and random access to the three layers of title, PTT, and cell become possible.
(2) Cueing, time search, and random access in video frame units become possible.
(3) Title, PTT, and cell time can be managed in real time.
(4) The current time and the remaining time in the PTT or the title can be displayed and managed in video frame unit time.
[0052]
The ACBU in FIG. 1B includes the A-CONT pack and the CONT pack, but may be configured so as not to include the V pack and the CONT pack as shown in FIG. In this case, the video signal is not recorded, but the recording capacity of the audio signal is increased, the disc size can be reduced, and the reproduction function can be simplified, so that the portable reproduction is possible. Anything suitable for the device can be provided.
[0053]
19 is an explanatory diagram showing the format of the audio manager information (AMGI) in the second embodiment in detail, FIG. 20 is an explanatory diagram showing the TOC information in FIG. 19 in detail, and FIG. 21 is an audio title set information in the third embodiment. FIG. 3 is an explanatory diagram showing the format of (ATSI) in detail.
Next, a second embodiment using TOC (Table Of Contents) information will be described. As shown in FIG. 19, a TOC such as that shown in detail in FIG. 20 is additionally recorded in a free area of AMGI (Audio Manager Information), and the playback device accesses the TOC information to find the beginning of the music. Do. FIG. 20 shows, as an example, general TOC information recorded in a lead-in area of a CD, and the same information is repeatedly recorded three times. When recording on the DVD audio disk 1 of the present invention, the above-described operation may be repeated, or may not be repeated.
[0054]
Here, in the TOC information used in the CD, when point = 00 to 99, the absolute time at which each movement indicated by the numeral starts is represented by minutes (PMIN), seconds (PSEC) and frames (PFRAME). You. When point = A0, PMIN indicates the first movement, and PSEC = PFRAME = 0. When point = A1, PMIN indicates the last movement, and PSEC = PFRAME = 0. When point = A2, the absolute time at which the lead-out area starts is expressed in minutes (PMIN), seconds (PSEC) and frames (PFRAME). Therefore, the TOC information shown in FIG. 20 indicates that six songs (or six movements) are recorded on the DVD audio disc 1 (points = 01 to 06). This TOC information may be recorded in an empty area of ATSI (audio title set information) as shown in FIG. 21 instead of AMGI, and may be recorded in the ACD packet of the A-CONT pack shown in FIG. May be recorded in the reserved area (360 bytes).
[0055]
Next, a fourth embodiment will be described. FIG. 22 shows a format of a fourth embodiment of a DVD audio disk applied to the present invention, which does not include a VTS as shown in FIGS. 24 to 26, and is constituted only by an ATS. The ATS (directory) is composed of a SAMG (Structure of Simple Audio Manager), an audio manager (AMG) shown in FIG. 1B, a video and audio audio manager menu (AMGM), and an AMGI in the AMG. ATS <1> and ATS <2> are managed, and ATS <1> and ATS <2> do not include an A-CONT pack, but are configured by an A pack and an RTI pack, as shown in FIG. Have been. Also, this RTI pack is not arranged more frequently than the A pack, and about one pack is arranged every 0.5 seconds. Further, the still image pack is arranged at a predetermined position. SAMG is an area in which a SAPP table (TOC) for locating ATS <1> and ATS <2> is repeatedly described eight times. This area can be defined as one independent file.
[0056]
Here, for reference, FIG. 24 shows the format of a DVD-Van (video + audio navigation) disc. This format is roughly a DVD-video data including a video title set (VTS) and an audio navigation (navigation). The data is composed of an ANV title set (ANV-TS). More specifically, the VTS has the same configuration as the DVD video disk shown in FIG. 1A and FIG. 25 described later, while the ANV-TS has an audio manager (AMG) shown in FIG. And ATS <1> and ATS <2> managed by AMGI in AMG in a pair with VTS <1> and VTS <2>.
As shown in FIG. 25 and FIG. 1A, the format of the DVD video disc does not include the ATS or the ANV-TS, and is composed of only the VTS.
[0057]
FIG. 26 shows the format of a DVD-Avd (audio + AV data) disc. This format is based on a video title set (VTS) as DVD-video data and an audio title set (ATS) as DVD-audio data. It is configured. More specifically, the VTS includes a video manager (VMG) shown in FIG. 1A, a video and audio video manager menu (VMGM), and VTS <1> managed by a VMGI in the VMG. .
[0058]
On the other hand, the ATS pairs with the SAMG, the audio manager (AMG) shown in FIG. 1B, the audio manager menu (AMGM) for video and audio, and the audio data in the VTS <1> on the VTS side. ATS <1> managed by AMGI in AMG and ATS <2> managed by AMGI in AMG without forming a pair with the VTS side. As shown in FIG. 23, this ATS <2> does not include the A-CONT pack, but is composed of the A pack and the RTI pack.
[0059]
FIG. 27 shows audio-only title audio object attributes (AOTT-AOB-ATR) recorded on the disc as attribute data indicating the contents of audio data of the disc of the fourth embodiment. This attribute data is composed of 8 bytes (64 bits b63 to b0).
A 4-bit (b63 to b60) audio encoding mode;
1-bit (b59) downmix (DM) mode;
A multi-channel structure of 3 bits (b58 to b56);
A 4-bit (b55 to b52) quantization bit number Q1 of the channel group 1;
A 4-bit (b51 to b48) channel group 2 quantization bit number Q2;
A 4-bit (b47 to b44) sampling frequency fs1 of channel group 1;
A sampling frequency fs2 of channel group 2 of 4 bits (b43 to b40);
A 3-bit (b39 to b37) reserved area;
A 5-bit (b36 to b32) channel assignment;
-Consists of a reserved area of the remaining 32 bits (b31 to b0). The remaining 32 bits (b31 to b0) are used for attribute data of each channel.
[0060]
The above data is described in more detail below.
(1) Audio encoding mode (b63 to b60)
0000b: Linear PCM mode
0001b: Reserved for compressed audio (Dolby Digital)
0010b: Reserved for compressed audio (no MPEG2 extension)
0011b: Reserved for compressed audio (with MPEG2 extension)
0100b: Reserved for compressed audio (DTS)
0101b: Reserved for compressed audio (SDDS)
Other: reserved for other encoding modes
(2) Downmix mode (b59)
0b: Downmix stereo output enabled
1b: Downmix stereo output prohibited
(3) Multi-channel structure type (b58 to b56)
000b: Type 1
Others: Hold
[0061]
(4) Number of quantization bits Q of channel group 1 (b55 to b52)
0000b: 16 bits
0001b: 20 bits
0010b: 24 bits
Others: Hold
(5) Number of quantization bits Q of channel group 2 (b51 to b48)
"0000b" when the quantization bit number Q of the channel group 1 is "0000b"
"0000b" or "0001b" when the quantization bit number Q of the channel group 1 is "0001b"
"0000b", "0001b" or "0010b" when the quantization bit number Q of the channel group 1 is "0010b"
However, 0000b: 16 bits
0001b: 20 bits
0010b: 24 bits
Others: Hold
[0062]
(6) Sampling frequency fs1 of channel group 1 (b47 to b44)
0000b: 48 kHz
0001b: 96 kHz
0010b: 192 kHz
1000b: 44.1 kHz
1001b: 88.2 kHz
1010b: 176.4 kHz
Others: Hold
[0063]
(7) Sampling frequency fs2 of channel group 2 (b43 to b40)
"0000b" when the sampling frequency fs1 of the channel group 1 is "0000b"
"0000b" or "0001b" when the sampling frequency fs1 of the channel group 1 is "0001b"
"0000b", "0001b" or "0010b" when the sampling frequency fs1 of the channel group 1 is "0010b"
"1000b" when the sampling frequency fs1 of the channel group 1 is "1000b"
"1000b" or "1001b" when the sampling frequency fs1 of the channel group 1 is "1001b"
When the sampling frequency fs1 of the channel group 1 is “1010b”, “1000b”, “1001b”, or “1010b”
[0064]
The disk of the fourth embodiment uses the linear PCM mode. The private header of the linear PCM is as shown in FIG.
An 8-bit substream ID;
A 4-bit reserved area;
A 4-bit ISRC number;
-8-bit ISRC data;
An 8-bit private header length,
A first access unit pointer of 16 bits;
A 1-bit audio emphasis flag F1,
-It is composed of a 1-bit audio emphasis flag F2 and the like.
[0065]
29 and 30 show an encoding device. FIG. 29 is a block diagram showing an embodiment of an audio signal encoding apparatus applied to the present invention, and FIG. 30 is a block diagram showing a signal processing circuit of FIG. 29 in detail.
[0066]
In FIG. 29, the analog audio signal A is sampled by the A / D converter 31 at a sufficiently high sampling frequency (sampling period Δt), for example, 192 kHz, and is converted into a 24-bit high-resolution PCM signal, for example, to obtain a high-resolution curve α. Corresponding data column
xb1, x1, xa1, x2, xb2, x3, xa2,..., xbi, x2i-1, xai, x2i,.
Is converted to This data string (xbi, x2i-1, xai, x2i) is encoded by the signal processing circuit 32 and the memory 33 shown in detail in FIG. 30 and then applied to the DVD audio formatting unit 34.
[0067]
The configuration of the signal processing circuit 32 will be described in detail with reference to FIG. First, a band-limited low-resolution curve is converted from a data string (xbi, x2i-1, xai, x2i) corresponding to the high-resolution curve α by a low-pass filter 36 that passes a half band, for example, an FIR filter. Data string corresponding to β
xc1, *, *, *, xc2, *, *, *, xc3, *, *, *, ..., xci, *, *, *, ...
And then thinning out the data “*” from the data string by the thinning circuit 37 to obtain the data string
xc1, xc2, xc3, ..., xci, ...
Generate Here, the data sequence xci is a data sequence in which the digital data subjected to A / D conversion by the A / D converter 31 is band-limited and the sampling frequency is reduced to 1/4.
[0068]
The data string (xbi, x2i-1, xai, x2i) is thinned out by the thinning circuit 38 in the data string (xbi, x2i-1, xai, x2i).
xb1, xa1, xb2, xa2,..., xbi, xai,.
Generate
[0069]
Then, based on these data strings xci, xbi, xai, the adder 39 acting as a difference calculator calculates the difference.
xbi-xci = Δ1i
xai−xci = Δ2i
Is calculated. Here, the difference data Δ1i and Δ2i are, for example, 24 bits or less, and the number of bits may be fixed or variable.
[0070]
The allocation circuit 40 packs the data string xci and the difference data Δ1i and Δ2i into user data (see FIG. 13) (1 packet = 2034 bytes), and outputs the user data to the DVD formatting unit 34.
[0071]
The video signal V is converted into a digital signal by an A / D converter 31V, and then this digital video signal is encoded into an MPEG format by a V encoder 32V, and then packed into user data shown in FIG. 34. Then, the DVD formatter 34 packs the data into a format as shown in FIGS. The data formatted by the DVD formatter 34 is modulated by a modulation circuit 35 in a modulation method according to the disk, and a disk is manufactured based on the modulated data.
[0072]
Next, a DVD-Audio disc according to a fifth embodiment will be described with reference to FIGS. First, as shown in FIG. 31A, the data structure of the fifth embodiment roughly includes a SAMG, an AMG (audio manager), an SPS (still picture set), and a plurality of ATSs (audio title sets). ). The SPS (still picture set) is also referred to as an ASVS (audio still video set) in the following description in order to avoid confusion with the sub-picture (SP).
[0073]
ATS is
・ ATSI (ATS information)
Audio object set (AOTT-AOBS) for audio-only titles shown in detail in FIGS.
-It is composed of ATSI for backup. ATSI starts from the top
ATSI-MAT (ATSI management table) shown in detail in FIGS.
It is composed of ATS-PGCIT (ATS program chain information table) shown in detail in FIGS.
[0074]
The AOTT-AOBS is composed of a plurality of audio-only title audio objects (AOTT-AOB), as shown in detail in FIG. Each of the AOTT-AOBs is constituted by a plurality of programs (PG), and each of the programs is constituted by a plurality of cells (ATS-C).
[0075]
The AOTT-AOB includes audio data only as shown in detail in FIG. 32 (1) and audio data and real time information data (RTI data) as shown in detail in FIG. 32 (2). It is composed of two types of AOTT-AOB. Then, one or more types of AOTT-AOB are arranged in one disc or one song.
[0076]
Each program of the first AOTT-AOB including only audio data is composed of a plurality of audio cells (ATS-C), and these audio cells are composed of only a plurality of audio packs. Each program of the second AOTT-AOB including audio data and RTI data is composed of a plurality of audio cells (ATS-C), and this audio cell is composed of an RTI pack arranged at a second pack position and another pack. It is composed of audio packs arranged at positions.
[0077]
The A pack of the linear PCM is composed of 2048 bytes or less, and is composed of a 14 byte pack header and an A packet as shown in FIG. The A packet is composed of a packet header of 17, 9, or 14 bytes, a private header shown in detail in FIG. 34, and audio PCM data of 1 to 2011 bytes.
[0078]
The private header is as shown in FIG.
An 8-bit substream ID;
A 3-bit reserved area;
5-bit UPC / EAN-ISRC (Universal Product Code / European Article Number International Standard Recording Code: European Article Number-International Standard Recording Code)
-8-bit UPC / EAN-ISRC data;
An 8-bit private header length,
A first access unit pointer of 16 bits;
・ 8 bytes of audio data information (ADI)
・ Stuffing byte of 0 to 8 bytes
It consists of.
[0079]
ADI
A 1-bit audio emphasis flag,
A 1-bit reserved area;
1-bit downmix mode,
1-bit downmix code validity,
・ 4 bit downmix code,
A quantization word length “1” of a 4-bit group “1”;
A quantization word length “2” of a 4-bit group “2”;
An audio sampling frequency fs1 of a 4-bit group "1";
An audio sampling frequency fs2 of a 4-bit group "2";
A 4-bit reserved area;
・ 4-bit multi-channel type,
• Bit shift data of channel group “2” of 3 bits (see FIG. 36)
-5-bit channel assignment information (see Fig. 42);
• 8-bit dynamic range control information
.8 × 2 bit reserved area
It consists of.
[0080]
In the 8-bit (b7 to b0) UPC / EAN-ISRC data area, different data is arranged according to the UPC / EAN-ISRC number as shown in FIG. That is,
(1) When UPC / EAN-ISRC number = 1
Upper 2 bits b7, b6: reserved
Lower 6 bits b5 to b0: Country code (ISRC # 1)
(2) When UPC / EAN-ISRC number = 2
Upper 2 bits b7, b6: reserved
Lower 6 bits b5 to b0: Country code (ISRC # 2)
(3) When UPC / EAN-ISRC number = 3
Upper 2 bits b7, b6: reserved
Lower 6 bits b5 to b0: copyright holder code (ISRC # 3)
(4) When UPC / EAN-ISRC number = 4
Upper 2 bits b7, b6: reserved
Lower 6 bits b5 to b0: copyright holder code (ISRC # 4)
(5) When UPC / EAN-ISRC number = 5
Upper 2 bits b7, b6: reserved
Lower 6 bits b5 to b0: copyright holder code (ISRC # 5)
(6) When UPC / EAN-ISRC number = 6
Upper 4 bits b7 to b4: reserved
Lower 4 bits b3 to b0: recording ear (ISRC # 6)
(7) When UPC / EAN-ISRC number = 7
Upper 4 bits b7 to b4: reserved
Lower 4 bits b3 to b0: recording ear (ISRC # 7)
[0081]
In the area of the linear PCM data which is the actual data in the A-pack, the bits of the data of each channel of the group “2” are reduced and arranged in order to improve the S / N ratio and reduce bits. FIG. 36A shows PCM data of six channels (group “1” = Ch1 to Ch3, group “2” = Ch4 to Ch6) as an example, and the level range is MAX = 0 dB to MIN = −144 dB (24 bits). And the value of each channel Ch is as follows.
Lmax2> Lmax1 = Lmax3> Lmax4> Lmax5> Lmax6
Then, while the word length of Ch1 to Ch3 of the group "1" is kept as it is, and the value of Ch2 is the largest in this example, each level of Ch4 to Ch6 of the group "2" is up-shifted by (0-Lmax2) dB. Then, the LSB side 0 to 4 bits are reduced. Note that the example shown in FIG. 36 shows that each level of Ch4 to Ch6 is up-shifted by the maximum number of bits = 4 and reduced to 20 bits.
[0082]
Next, the configuration of the RTI pack will be described in detail with reference to FIG. This pack is composed of a 14-byte pack header and an RTI packet, and the RTI packet is composed of a 17- or 14-byte packet header, a private header, and 1 to 2015 bytes of RTI data. The RTI data is character information and reproduction control information relating to audio data.
[0083]
The private header of the RTI packet is
A 1-byte substream ID,
A 2-byte UPC / EAN-ISRC number and data (these are simply referred to as ISRC in the figure);
A 1-byte private header length,
1-byte RTI information ID;
・ 0-7 byte stuffing byte
It consists of.
The UPC / EAN-ISRC number and data are the UPC / EAN-ISRC number and data relating to the copyright of the still picture contained in the SPCT pack.
[0084]
Incidentally, an SPCT pack is arranged in the still picture set (audio still video set) shown in FIG. 31, and as shown in detail in FIG. 38, the SPCT pack is composed of a 14-byte pack header and SPCT packet. The SPCT packet is composed of a packet header of 22 or 19 or 9 bytes and SPCT data of 2025 bytes or less. Here, one still image is compressed according to the MPEG1 or MPEG2 system, is composed of I pictures and intra-coded pictures, is divided in one picture cell, and is arranged as SPCT data of an SPCT pack. Similarly, the packet header of the SPCT pack may include the UPC / EAN-ISRC number and data relating to the copyright of the still picture as described in the RTI pack.
[0085]
The ATSI-MAT shown in FIG. 31A is composed of 2048 bytes (relative byte positions RBP0 to 2047) as shown in detail in FIG.
An ATS identifier (ATS-ID) of 12 bytes (RBP0 to 11);
ATS end address (ATS-EA) of 4 bytes (RBP12 to 15);
A reserved area of 12 bytes (RBP 16 to 27);
An ATSI end address (ATSI-EA) of 4 bytes (RBP 28 to 31);
A version number (VERN) of 2 bytes (RBP32 to 33);
A reserved area of 94 bytes (RBP34 to 127);
4 bytes (RBP128 to 131) of ATSI-MAT end address;
A reserved area of 60 bytes (RBP132 to 191);
A 4-byte (RBP 192 to 195) AOTT VTS start address;
4 bytes (RBP196 to 199) of the start address of AOBS for AOTT or the start address of VOBS for AOTT;
A 4-byte (RBP 200 to 203) reserved area;
A 4-byte (RBP 204 to 207) ATS-PGCIT start address;
A reserved area of 48 bytes (RBP 208 to 255);
128 bytes (16 × 8) bytes (RBP 256 to 383) of AOB attributes for AOTT (AOTT-AOB-ATR) or attributes of AOTT VOB audio stream (AOTT-VOB-AST-ATR);
A coefficient (ATS-DM-COEFT # 0 to # 15) of 288 (18 × 8) bytes (RBP384 to 661) for downmixing multi-channel audio data into two channels;
A reserved area of 32 bytes (RBP672 to 703);
2 bytes (RBP 704 to 705) of still picture data attribute (ATS-SPCT-ATR) in AOBS for AOTT;
It is composed of a 1342 byte (RBP 706-2047) reserved area.
[0086]
In the area of 128 (16 × 8) bytes (RBP 256 to 383), when the ATS has AOBS for AOTT, AOTT-AOB-ATR shown in detail in FIG. 40 is described. This AOTT-AOB-ATR (b127 to b0) is sequentially from the MSB side
An audio encoding mode of 8 bits (b127 to b120);
An 8-bit (b119 to b112) reserved area;
A 4-bit (b111 to b108) channel group “1” quantization bit number Q1;
A 4-bit (b107 to b104) quantization bit number Q2 of the channel group “2”;
A sampling frequency fs1 of a 4-bit (b103 to b100) channel group "1";
A sampling frequency fs2 of a 4-bit (b99 to b96) channel group “2”;
A 3-bit (b95 to b93) multi-channel structure type;
Channel assignment of 5 bits (b92 to b88);
-Consists of a reserved area of 8 bits x 11 (b87 to b0).
[0087]
On the other hand, if the ATS does not have an AOTT AOBS, the AOTT-VOB-AST-ATR shown in FIG. 41 is described. This AOTT-VOB-AST-ATR (b127 to b0) is sequentially from the MSB side.
An audio encoding mode of 8 bits (b127 to b120);
An 8-bit (b119 to b112) reserved area;
A quantization bit number Q of 4 bits (b111 to b108);
A 4-bit (b107 to b104) reserved area;
A sampling frequency fs of 4 bits (b103 to b100);
A 4-bit (b99 to b96) reserved area;
A 3-bit (b95 to b93) multi-channel structure type;
Channel assignment of 5 bits (b92 to b88);
A 3-bit (b87-b85) decoding audio stream number;
A 5-bit (b84 to b80) reserved area;
A 2-bit (b79, b78) MPEG audio DRC;
A 2-bit (b77, b76) reserved area;
The number of 4-bit (b75 to b72) compressed audio channels;
-Consists of a reserved area of 8 bits x 9 (b71 to b0).
[0088]
The above data is shown in detail below. However, the number of quantization bits, the sampling frequency, and the multi-channel type are the same as those in FIG.
(1) Audio encoding mode (b127 to b120)
00000000b: Linear PCM mode
00000001b: Reserved for compressed audio (Dolby Digital)
00000010b: Reserved for compressed audio (without MPEG2 extension)
00000011b: Reserved for compressed audio (with MPEG2 extension)
00000100b: Reserved for compressed audio (DTS)
00000101b: Reserved for compressed audio (SDDS)
Other: reserved for other encoding modes
[0089]
(8) Channel assignment (b92 to b88)
FIG. 42 shows channel assignment information of groups “1” and “2” from 1 channel (monaural) to 6 channels. Incidentally, the symbols shown in the figure will be described below.
C (mono): monaural
L, R: 2 channel stereo
Lf: Multi-channel left front
Rf: Multi-channel light front
C: Multi-channel center
LFE: Multi-channel Low Frequency Effect
S: Multi-channel surround
Ls: Multi-channel left surround
Rs: Multi-channel light surround
[0090]
(9) “0” or “1” of the number of decoding audio streams (b87 to b85)
(10) DRC for MPEG audio (b79, b78)
00b: DRC data does not exist in the MPEG audio stream.
01b: DRC data exists in the MPEG audio stream.
[0091]
(11) Number of compressed audio channels (b75 to b72)
"1111b" when the audio encoding mode is linear PCM audio
0000b: 1ch (mono)
0001b: 2ch (stereo)
0010b: 3ch
0011b: 4ch
0100b: 5ch
0101b: 6ch
0110b: 7ch
0111b: 8ch
Others: Hold
[0092]
In the 288 (18 × 16) byte area (RBP 384 to 671) shown in FIG. 39, table numbers “0” to “15” as shown in FIG. 43 for downmixing multi-channel audio data into two channels. Are described in 18 bits (ATS-DM-COEFT # 0 to # 15).
[0093]
The 2-byte (RBP 704, 705) area shown in FIG. 39 is used to describe the still picture data attribute (ATS-SPCT-ATR) in the AOBS for AOTT.
A 2-bit (b15, b14) video compression mode;
A 2-bit (b13, b12) TV system;
An aspect ratio of 2 bits (b11, b10);
A display mode of 2 bits (b9, b8);
A 2-bit (b7, b6) reserved area;
A 3-bit (b5 to b3) source picture resolution;
-It is composed of a 3-bit (b2 to b0) reserved area.
[0094]
The contents of the ATS-SPCT-ATR will be described in detail below.
(1) Video compression mode (b15, b14)
00b: MPEG1 compatible
01b: MPEG2 compatible
Other: pending
(2) TV system (b13, b12)
00b: 525/60
01b: 625/60
Other: pending
(3) Aspect ratio (b11, b10)
00b: 4: 3
11b: 16: 9
Other: pending
(4) Display mode (b9, b8)
00b: pending
01b: Hold
10b: Only letterbox allowed
11b: Not described.
(5) Resolution of source picture (b5 to b3)
Figure 0003603868
Other: pending
[0095]
The ATS-PGCIT (ATS program chain information table) shown in FIG. 31A is, as shown in detail in FIG.
An audio title set PGCI table information (ATS-PGCITI) detailed in FIG. 46;
47. n audio title set PGCI search pointers (ATS-PGCI-SRP # 1 to #n) shown in detail in FIGS.
-It is composed of a plurality of audio title sets PGCI shown in detail in FIG.
[0096]
The ATS-PGCITI is composed of 8 bytes as shown in detail in FIG.
The number of 2-byte ATS-PGCI-SRPs # 1 to #n;
A 2-byte reserved area,
-Consists of a 4-byte ATS-PGCIT end address. Each of the ATS-PGCI-SRPs # 1 to #n is composed of 8 bytes as shown in detail in FIG.
-The 4-byte ATS-PGC category (ATS-PGC-CAT) shown in detail in FIG.
-Consists of a 4-byte ATS-PGCI end address.
[0097]
The above 4-byte (b31 to b0) ATS-PGC categories are arranged in order from the top as shown in FIG.
1-bit (b31) entry type;
The number of ATS audio titles (ATS-TTN) of 7 bits (b30 to b24);
A 2-bit (b23, b22) block mode;
A 2-bit (b21, b20) block type;
The number of 4-bit (b19 to b16) audio channels;
An 8-bit (b15 to b8) audio encoding mode;
-Consists of an 8-bit (b7 to b0) reserved area.
[0098]
The contents of the category (ATS-PGC-CAT) will be described in detail below.
(1) Entry type (b31)
0b: Not entry PGC
1b: Entry PGC
(2) Number of ATS audio titles (b30 to b24)
The number of audio titles of this ATS is described in the range of “1” to “99”.
(3) Block mode (b23, b22)
00b: Not ATS-PGC of ATS-PGC block
01b: First ATS-PGC of ATS-PGC block
10b: pending
11b: last ATS-PGC of ATS-PGC block
(4) Block type (b21, b20)
00b: not part of this block
01b: Difference block only in audio coding mode
10b: Difference block of audio channel only
11b: Block of difference between audio coding mode and audio channel
(5) Number of audio channels (b19 to b16)
0000b: 2 channels or less
0001b: More than 2 channels
[0099]
As shown in detail in FIG. 49, each of the audio title sets PGCI (ATS-PGCI) shown in FIG.
-ATS-PGC general information (ATS-PGC-GI) shown in detail in FIGS.
ATS program information table (ATS-PGIT) shown in detail in FIGS.
-It is composed of an ATS cell playback information table (ATS-C-PBIT) shown in detail in Figs.
[0100]
The ATS-PGC-GI is composed of 16 bytes (RBP0 to 15) as shown in detail in FIG.
-ATS-PGC content (ATS-PGC-CNT) of 4 bytes (RBP0 to 3) shown in detail in FIG.
ATS-PGC playback time (ATS-PGC-PB-TM) of 4 bytes (RBP4 to 7);
A 2-byte (RBP8, 9) reserved area;
A 2-byte (RBP10, 11) ATS-PGIT start address;
A 2-byte (RBP12, 13) ATS-C-PBIT start address;
-Consists of a 2-byte (RBP14, 15) reserved area.
[0101]
The ATS-PGC contents of 4 bytes (b31 to b0) are sequentially arranged from the top as shown in FIG.
A 17-bit (b31 to b15) reserved area;
· Number of 7-bit (b14 to b8) programs
-It is constituted by the number of cells of 8 bits (b7 to b0). The number of programs is in the range of “1” to “99”, and the number of cells is in the range of “1” to “255”.
[0102]
The ATS program information table (ATS-PGIT) shown in FIG. 49 includes n ATS program information (ATS-PGI) # 1 to #n as shown in detail in FIG. Each of the ATS-PGIs # 1 to #n is composed of 20 bytes (RBP0 to RBP19) as shown in detail in FIG.
-ATS-PG content (ATS-PG-CNT) of 4 bytes (RBP0 to 3) shown in detail in FIG.
1-byte (RBP4) ATS-PG entry cell number;
A 1-byte (RBP5) reserved area;
The start presentation time (FAC-S-PTM) of the first audio cell of the ATS-PG of 4 bytes (RBP 6 to 9);
An ATS-PG playback time of 4 bytes (RBP10 to 13);
ATS-PG pause time of 4 bytes (RBP14-17),
A 1-byte (RBP18) reserved area (for copyright management data CMI);
• 1-byte (RBP19) reserved area
It consists of.
[0103]
As shown in detail in FIG. 54, the ATS-PG contents of 2 bytes (b31 to 0) are sequentially arranged from the top as shown in FIG.
-1 bit (b31) of the relationship between the previous and current PG (R / A);
1-bit (b30) STC discontinuity flag (STC-F);
The number of attributes (ATRN) of 3 bits (b29 to b27);
3 bits (b26 to b24) of a channel group (ChGr) “2” bit shift data;
A 2-bit (b23, b22) reserved area;
1-bit (b21) downmix mode (DM);
・ Effectiveness (illustration *) of 1-bit (b20) downmix coefficient,
A 4-bit (b19 to b16) downmix coefficient table number (DM-COEFTN);
-Each bit is composed of RTI flags F15 to F0 each having 1 bit and a total of 16 bits (b15 to b0).
[0104]
The ATS cell playback information table (ATS-C-PBIT) shown in FIG. 49 includes n ATS cell playback information (ATS-C-PBI) # 1 to ATS-C-PBI, as shown in detail in FIG. #N. Each of the ATS-C-PBIs # 1 to #n is composed of 12 bytes (RBP0 to 11) as shown in detail in FIG.
An ATS-C index number of 1 byte (RBP0);
An ATS-C type (ATS-C-TY) of 1 byte (RBP1) shown in detail in FIG.
A 2-byte (RBP2, 3) reserved area;
A 4-byte (RBP4 to 7) ATS-C start address;
-Consists of 4 bytes (RBP8 to 11) of ATS-C end address.
[0105]
As shown in detail in FIG. 57, the ATS-C type of 1 byte (b7 to b0) is
A 2-bit (b7, b6) ATS cell element (ATS-C-COMP);
A 2-bit (b5, b4) reserved area;
-It is configured for 4-bit (b3 to b0) ATS cell use (ATS-C-Usage).
[0106]
The contents of the above data are shown in detail below.
(1) ATS cell element (b7, b6)
00b: audio cell consisting of audio data only
01b: Audio cell composed of audio data and real-time information
10b: Silence cell consisting only of audio data for silence
11b: Picture cell consisting only of still pictures
(2) ATS cell use (b3 to b0)
0000b: No description
0001b: Spotlight part
Others: Hold
[0107]
Next, an encoding device according to a fifth embodiment will be described. 58 and 59 show the configuration and processing of the encoding device, respectively. The analog audio signal A is sampled by the A / D converter 31 at a sufficiently high sampling frequency (sampling period Δt), for example, 192 kHz, and is converted into a 24-bit high-resolution PCM signal, for example. In the subsequent bit shift / signal processing circuit 32, when compression is not performed, the PCM data converted by the A / D converter 31 is directly applied to the DVD formatting unit. On the other hand, when performing compression, the PCM data converted by the A / D converter 31 is compressed by the bit shift / signal processing circuit 32 according to the encoding mode, and then applied to the DVD formatting unit 34. (Steps S5 and S6). In the bit shift / signal processing circuit 32, each channel of the group “2” is bit-shifted.
[0108]
The video signal V is converted into a digital signal by the A / D converter 31V, and then the digital video signal is encoded into the MPEG format by the V encoder 32V and applied to the DVD formatter 34 (steps S1, S2). . Further, the still image signal SP is converted into a digital signal by the A / D converter 31SP, and then the digital still image signal SP is encoded into the MPEG format by the compression encoder 32SP and applied to the DVD formatter 34 (step S3). , S4). The copyright information and the real-time text information (RTI) are applied to the DVD formatting unit 34 via the interface (I / F) 40 (steps S7 and S8), and the character information and the disc identifier EX are applied to the DVD formatting unit 34 (step S7). S9, S10).
[0109]
Then, the DVD formatting unit 34 performs packing in the format as described above (step S11). The data formatted by the DVD formatter 34 is modulated by a modulation circuit 35 according to a modulation method corresponding to the disk, and a disk is manufactured based on the modulated data, recorded once in the recording unit 38, or communicated. The data is transmitted via the I / F 39 (step S12).
[0110]
FIG. 60 shows a specific configuration of the decoding device of the fifth embodiment, and FIG. 61 functionally shows the configuration of FIG. FIG. 62 shows the processing. 60 and 61, first, when a music selection, reproduction, fast-forward, and stop operation are performed by the operation unit 18 or the remote control device 19, the control unit 23 controls the drive device 2 and the reproduction device 17 according to the operation. During reproduction, the pit data recorded on the DVD audio disk 1 is read by the drive device 2 and then EFM demodulated.
[0111]
In the reproducing device 17, this signal is sent to the still image and V pack detecting section 3 and the A and RTI pack detecting sections 9. When a still image pack and a V pack are recorded on the disk 1, the still image and V pack detection unit 3 detects the still image pack and the V pack in the reproduced data and sets the control parameters in the parameter unit 8. At the same time, the still image pack and the V pack are sequentially written into the still image and V pack buffer 4. The still image pack and the user data (video signal, still image information) in the V pack written in the V pack buffer 4 are transferred to the still image pack and the SCR in the V pack by the buffer extracting unit 5 (see FIG. 13). Are extracted in the order of packs and in order of output time, and then output as analog video signals via the decompression and image conversion unit 6, the D / A conversion unit 7, and the video output terminals 15, 15 '.
[0112]
The A and RTI pack detector 9 detects the A and RTI packs in the reproduced data, sets the control parameters in the parameter section 14, and writes the A and RTI packs into the A and RTI pack buffers 10 sequentially. The user data (audio signal, real-time information) in the A pack and the RTI pack written in the A and RTI pack buffers 10 are extracted by the buffer extracting unit 11 in the order of packs and in the order of output time. The audio signal is output as an analog audio signal via the PCM conversion and bit shift / signal processing unit 12, the D / A conversion unit 13, and the audio output terminal 16. The real-time information is sent to the display signal generation unit 20 to generate a display signal. The display signal is output through the display signal output terminal 22 or is output to the built-in character display unit 21.
[0113]
The processing of this decoding device will be described with reference to FIG. First, the recording data is read out by accessing the disk 1 (step S20), and then, in each of the separation steps S21 to S29, a video signal, a still image signal, an audio signal, copyright information and real-time information (RTI), and text Information and disc identifier (EX) are separated. Next, each of the separated data is decoded in each of the decoding steps S22 to S30, and is then synchronously reproduced (steps S31 and S32).
[0114]
Here, there are the following three types of processing for reproducing the still image SP.
1) When the still image SP is obtained, the reproduction of the audio signal A is interrupted and muted.
2) When the still picture SP is obtained, the still picture SP is reproduced together with the audio signal A based on the time control signal. This is called a slide show.
3) When a still image SP is obtained, a page turning reproduction is performed based on a page turning command instructed by the user. At this time, the audio signal A is reproduced as it is. This is called browserable.
[0115]
When it is necessary to synchronize a still image with audio, a time control signal for real-time synchronization is provided under a still picture control information table (SPCIT) provided in addition to the ATSI shown in FIG. It is placed in the time control data information (SPCIT-TCDI).
[0116]
Still picture page control command information (SPPI) containing a page turning command is placed below SPCIT. As described above, SPCIT is composed of SPCIT general information (SPCIT-GI) of general information, time control data information (SPCIT-TCDI), and still picture page control command information (SPPI). .
[0117]
In addition, the still picture data of the SPCT pack in FIG. 38 may include side information for controlling a still picture page. The page control data specified by the side information is interpreted with reference to the SPPI. If there is not enough space to store the still picture data, it is acceptable to include the side information for controlling the still picture page in the RTI data of the RTI pack.
[0118]
Next, an embodiment for transmitting the digital audio signal formatted as described above via a communication line will be described. First, the packing device on the transmitting side will be described with reference to FIGS. As shown in FIG. 63, the packing device includes a packing processing unit 30, a buffer memory 30B, a control circuit 29, an operation unit 27, and a display 28. 64 to 67, first, when the video signal V, the still image signal SP, the audio signal A, the real-time information RTI, and the disc identifier (EX) are input, in step S100, as shown in FIG. A pack is generated (Step S101), a video pack is generated (Step S102), a still image pack is generated (Step S103), and then a real-time text is generated (Step S104).
[0119]
Next, the cell (ATS-C) is managed (step S200), then the PTT (part of title) is managed (step S300), then the title (AOTT-AOB) is managed (step S400), and then the title set (AOTT) -Manage AOBS (step S500) In the following step S600, to generate an ATS, a title set is generated as shown in detail in Fig. 66 (step S601), and then a menu is generated (step S602), and then the ATS is generated. -Describe the category of PGCI (step S603), and then generate ATS-PGCIT by generating PGIT composed of PG contents including bit shift and generate PGCI (step S604). By generating A Generating a SI (step S605). Then generate AMG (step S700), finally to produce a TOC (step S800).
[0120]
Next, when transmitting the digital audio signal formatted as described above via a communication line, as shown in FIG. 67, the transmission data stored in the transmission buffer is divided into predetermined lengths and divided into packets. (Step S41), a header including the destination address is added to the head of the packet (Step S42), and this is output on the network (Step S43).
[0121]
Next, the data receiving side will be described with reference to FIGS. As shown in FIG. 68, the unpacking device on the data receiving side includes an unpacking processing unit 60, a buffer memory 60B, a parameter memory 56, a control circuit 59, an operation unit 57, and a display 58. First, as shown in FIG. 69, the header is removed from the packet received from the network (step S51), the received data is restored (step S52), and the data is transferred to the memory (step S53).
[0122]
Next, as shown in FIGS. 70 to 72, first, the AMG is decoded to detect the ATS (step S1100). In the subsequent step S1200, in order to decode the ATSI of the target ATS, as shown in FIG. ATS-PGCI category is decoded (step S1201), PGIT composed of PG content including bit shift is decoded (step S1202), then MAT attributes and coefficients are decoded (step S1203), and these are decoded. Each parameter is set in the parameter memory 56 (step S1204).
[0123]
Next, when the reproduction is started, the pack is identified (step S1300), and in the subsequent step S1400, the audio pack is decoded (step S1401) as shown in detail in FIG. 72 to decode the pack, and then the video pack is decoded. (Step S1402), then decode the still image pack (Step S1403), and then decode the real-time text (Step S1404). Then, an audio signal, a video signal, a still image signal, and a real-time text signal decoded from each of these packs are output (step S1500), and the processing of steps S1300 to S1500 is repeated during reproduction.
[0124]
Next, the SPS (still picture set) shown in FIG. 31, that is, the ASVS (audio still video set) will be described in detail with reference to FIGS. Here, a still picture object set (SPOBS) described below is also called an audio still video object set (ASVOBS) to avoid confusion with a subpicture (SP). As shown in FIG. 73, the ASVS (audio still video set) includes an ASVS information (ASVSI) shown in detail in FIGS. 74 and 75, and an audio still video object set (ASVOBS) shown in detail in FIG. And a backup ASVSI.
[0125]
The ASVS information (ASVSI) includes audio still video unit information (ASVUI) shown in detail in FIG. 74, an ASV address map (ASV-ADMAP) shown in FIG. 75, and a stuffing area (00h). .
[0126]
ASVUI (888 bytes in total) is as shown in FIG.
A 12-byte ASVS-ID,
The number of 2-byte ASVUs,
A 2-byte holding area;
A 4-byte ASVOBS start address;
A 4-byte ASVOBS end address;
2 bytes × 4 ASVU attributes # 0 to # 3,
4 bytes × 16 ASVOBS sub-picture palettes # 0 to # 15,
-8 bytes x 99 ASVU # 1 to # 99 general information
It consists of.
[0127]
The ASV address map (ASV-ADMAP) shown in FIG. 73 is composed of m (≦ 99) ASVUs # 1 to #m as shown in detail in FIG. 75, and each of the ASVUs # 1 to #m is an ASVU # 1 to # 99.
[0128]
Next, the audio still video object set (ASVOBS) shown in FIG. 73 will be described. The audio still video object (ASVOB) is presentation data of one audio still video (ASV), and highlight (HLT) information data for a button and sub-picture (SP) data for the button. And still picture (SPCT) data. However,
-One ASVOB contains only one still picture (SPCT) data.
One ASVOB can include only one highlight (HLT) information data. The highlight information is used to operate a still picture button.
One ASVOB can include one to three sub-picture (SP) data according to the still picture mode. The SP data is used to display a still picture button.
[0129]
The audio still video object set (ASVOBS) shown in FIG. 73 is an aggregate of the above ASVOBs as shown in FIG. As shown in FIG. 76 (a), the ASVOB places a highlight (HLT) pack at the top but does not function as an HLT pack as an empty pack containing no highlight information. As shown in FIG. 76 (b), there are two types: a pack including only a pack, a highlight (HLT) pack, and a pack including a sub-picture (SP) pack and a still picture (SPCT) pack.
[0130]
As shown in FIG. 77A, the highlight (HLT) pack includes a 14-byte pack header, a system header, and a 2013-byte highlight information packet. The highlight information packet includes a 6-byte packet header, a 1-byte substream ID, and 694-byte highlight information (ASV-HLI). The system header is composed of a 4-byte system start code, a 2-byte header length, a 3-byte rate bound, a 2-byte audio bound, a 1-byte restriction flag, and a 9-byte stream ID area. ing.
[0131]
As shown in FIG. 78, the highlight information (ASV-HLI) includes general ASV highlight information (22 bytes), an ASV button color information table (8 bytes × 3), and an ASV button information table (18 bytes × 36). Consists of The ASV button information table includes ASV button information # 1 to #n, and each ASV button information #i includes an ASV button command which is a picture control command. In this ASV button command, a navigation command when the button shown in FIG. 81 is operated is described.
[0132]
On the other hand, as shown in FIG. 77 (b), the SPCT pack and the SP pack are composed of a 14-byte pack header and a 2025-byte still picture packet or sub-picture packet. , 6 byte SCR, 3 byte program mux rate, and 9 or 22 byte stuffing length.
[0133]
The still picture (SPCT) packet includes an SPCT packet header and video data for a still picture as shown in detail in FIG. The SPCT packet header has 9 bytes of SPCT packet information always provided at the beginning, 5 + 5 bytes of SPCT packet information provided only for the first SPCT packet of a still image, and only for the first SPCT packet of ASVOB. Contains the provided 3-byte SPCT packet information.
[0134]
A sub-picture (SP) packet includes an SP packet header and sub-picture data as shown in detail in FIG. This SP packet header has 9 bytes of SP packet information always provided at the head, 5 bytes of SP packet information provided only in the case of the first SP packet of the SP unit, and only in the case of the first SP packet of the ASVOB. It contains the provided 3-byte SP packet information. On the decoder side based on such a data structure, the main picture, the sub-picture, and the highlight information are combined and displayed as shown in FIG.
[0135]
Next, a data structure of a modification of the fifth embodiment will be described with reference to FIG. Here, in the data structure shown in FIG. 31B, the still picture control information table (SPCIT) is provided in the ATS independently of the ATSI-MAT and the ATS-PGCIT. In the example, as shown in FIG. 82, it is provided in the ATS-PGCIT. In the following description, SPCIT is referred to as ATS-ASV-PBIT (ATS audio still video playback information table) in order to avoid confusion with a sub-picture (SP).
[0136]
This ATS-ASV-PBIT is additionally provided in the ATS-PBIT shown in FIG. 49, as shown in detail in FIG. 83, and each ATS of m programs # 1 to #m shown in FIGS. 84, 85 in detail. It has an ASV-playback information search pointer (ATS-PG-ASV-PBI-SRP # 1 to #m) and n ATS-ASV-PBIs # 1 to #n shown in detail in FIGS. (N ≦ m ≦ 99). Each of the SRPs # 1 to #m is, as shown in FIG.
A 1-byte ASVU number,
1-byte ASV display mode (ASV-DMOD)
A 2-byte ATS-ASV-PBI start address;
• ATS-ASV-PBI end address of 2 bytes
It consists of.
[0137]
The ASVU number is a value in a range from “1” to “99”. The ASV display mode is as shown in FIG.
A 4-bit (b7 to b4) reserved area;
A 2-bit (b3, b2) display timing mode;
・ Display order mode of 2 bits (b1, b0)
It consists of. The above data is shown in detail below.
(1) Display timing mode
00b: Slide show
01b: Browserable
Other: pending
(2) Display order mode
00b: Sequential
01b: random
11b: Shuffle
Other: pending
[0138]
Each of the ATS-ASV-PBIs # 1 to #n includes an ASV display list of 10 bytes × k (k ≦ 99) as shown in FIG. FIG. 87 shows an ASV display list when the display timing mode (b3, b2) is the slide show (00b) and the display order mode (b1, b0) is the sequential (00b).
An 8-bit (b79 to b72) ASV number;
An 8-bit (b71 to b64) reserved area;
An 8-bit (b63 to b56) button number (FOSL-BTNN) forcibly selected at the start of ASV;
An 8-bit (b55 to b48) program number to be played back at the start of ASV;
Display start timing (31 to 0) of 8 bits × 4 (b47 to b16);
A 4-bit (b15-b12) start effect mode;
A 4-bit (b11 to b8) start effect period;
A 4-bit (b7 to b4) end effect mode;
・ 4 bits (b3 to b0) end effect period
It consists of.
[0139]
The contents of the above data are shown in detail below.
(1) Display start timing (31 to 0) indicates the display start timing from the start PTS, and represents 31 to 0/90000 (seconds).
(2) Start effect mode (b15 to b12)
0000b: Cut-in
0001b: Fade in
0010b: Dissolve
0011b: Wipe from Top
0100b: Wipe from bottom
0101b: Wipe from Left
0110b: Wipe from Light
0111b: Wipe Diagonal Left
1000b: Wipe Diagonal Light
Others: Hold
(3) End effect mode (b7 to b4)
0000b: Cut out
0001b: Fade out
Others: (2) Same as start effect mode (b15 to b12)
[0140]
FIG. 88 shows an ASV display list when the display timing mode (b3, b2) is the slide show (00b) and the display order mode (b1, b0) is random (01b) in the display mode of FIG. 87 is the same as the list shown in FIG. 87 except that 8 bits (b79 to b72) are reserved. FIG. 89 shows an ASV display list when the display timing mode (b3, b2) is browsable (01b) and the display order mode (b1, b0) is sequential (00b) in the display mode of FIG. The list is the same as the list shown in FIG. 97 except that 8 bits (b55 to b48) are reserved. FIG. 90 shows an ASV display list when the display timing mode (b3, b2) is browsable (01b) and the display order mode (b1, b0) is random (01b) in the display mode of FIG. The list is the same as the list shown in FIG. 87 except that 8 bits (b79 to b72) and 8 bits (b55 to b48) are reserved.
[0141]
The encoding device and the decoding device can also be realized by storing the encoding method and the decoding method as a computer program on an IC chip such as a ROM, and operating a CPU (Central Processing Unit) of the computer with the program. The present invention can be applied not only to transmission via a recording medium such as a DVD, but also to transmission via a communication line such as the Internet or a karaoke communication line and processing on a reproduction side by hardware or an application on a PC. Can be applied.
[0142]
【The invention's effect】
As described above, according to the present invention, when an audio signal is mainly recorded, the audio signal can be easily reproduced for the user, the usability is good, and the management in real time can be simplified.
[Brief description of the drawings]
FIG. 1 is an explanatory diagram showing a first embodiment of a DVD-video format and a DVD-audio format applied to the present invention.
FIG. 2 is an explanatory diagram showing a format of an audio manager (AMG) of FIG. 1 in detail.
FIG. 3 is an explanatory diagram showing a format of an audio title set (ATS) of FIG. 1 in detail.
FIG. 4 is an explanatory diagram showing the format of audio manager information (AMGI) in FIG. 2 in detail;
FIG. 5 is an explanatory diagram showing a format of an audio title set attribute table (ATS-ATRT) of FIG. 4 in detail.
FIG. 6 is an explanatory diagram showing the format of the audio title set attribute data (ATS-ATR) of FIG. 5 in detail.
FIG. 7 is an explanatory diagram showing the format of the audio title set information (ATSI) of FIG. 3 in detail.
FIG. 8 is an explanatory diagram showing the format of the audio title set information management table (ATSI-MAT) of FIG. 7 in detail.
9 is an explanatory diagram showing the audio title set menu, audio stream, and attribute data (ATSM-AST-ATR) of FIG. 8 in detail.
FIG. 10 is an explanatory diagram showing the format of an audio title set audio stream attribute table (ATS-AST-ATRT) of FIG. 8 in detail.
FIG. 11 is an explanatory diagram showing in detail attribute data (ATS-AST-ATR) of each audio stream in FIG. 10;
FIG. 12 is an explanatory diagram showing an audio content block unit (ACBU) of FIG. 1;
13 is an explanatory diagram showing the format of the audio pack and the video pack of FIG. 12 in detail.
FIG. 14 is an explanatory diagram showing the format of the audio control (A-CONT) pack of FIG. 12 in detail.
FIG. 15 is an explanatory diagram showing in detail a format of an audio character display (ACD) area in FIG. 14;
FIG. 16 is an explanatory diagram showing an example displayed by the namespace information of FIG. 15;
FIG. 17 is an explanatory diagram showing a format of an audio search data (ASD) area in FIG. 14 in detail;
FIG. 18 is an explanatory diagram showing a modification of the audio content block unit of FIG. 1;
FIG. 19 is an explanatory diagram showing in detail a format of audio manager information (AMGI) in the second embodiment.
20 is an explanatory diagram showing the TOC information of FIG. 19 in detail.
FIG. 21 is an explanatory diagram showing the format of audio title set information (ATSI) of the third embodiment in detail.
FIG. 22 is an explanatory diagram showing a basic format of a DVD-Audio disc according to the fourth embodiment.
FIG. 23 is an explanatory diagram showing an audio data structure of the DVD-audio disc of FIG. 22.
FIG. 24 is an explanatory diagram showing a basic format of a DVD-Van disc.
FIG. 25 is an explanatory diagram showing a basic format of a DVD video disk.
FIG. 26 is an explanatory diagram showing a basic format of a DVD-Avd disk.
FIG. 27 is an explanatory diagram showing AOTT-AOB-ATR in the DVD-Audio disc of the fourth embodiment.
FIG. 28 is an explanatory diagram showing a private header of the linear PCM on the DVD-Avd disc of the fourth embodiment.
FIG. 29 is a block diagram showing an embodiment of an audio signal encoding device applied to the present invention.
FIG. 30 is a block diagram showing the details of the signal processing circuit of FIG. 29;
FIG. 31 is an explanatory diagram showing a data structure of the fifth embodiment.
FIG. 32 is an explanatory diagram showing the audio object set for audio-only title (AOTT-AOBS) of FIG. 31 in detail;
FIG. 33 is an explanatory diagram showing an example of the audio pack of FIG. 32 in detail;
FIG. 34 is an explanatory diagram showing the private header of FIG. 33 in detail.
FIG. 35 is an explanatory diagram showing the UPC / EAN-ISRC data of FIG. 34 in detail.
FIG. 36 is an explanatory diagram showing a bit shift of the audio data of FIG. 33;
FIG. 37 is an explanatory diagram showing in detail the real-time information (RTI) pack of FIG. 32;
FIG. 38 is an explanatory diagram showing a still picture (SPCT) pack in detail.
FIG. 39 is an explanatory diagram showing in detail the audio title set information management table (ATSI-MAT) of FIG. 31;
FIG. 40 is an explanatory diagram showing in detail an audio object attribute (AOTT-AOB-ATR) for audio-only title of FIG. 39;
FIG. 41 is an explanatory diagram showing in detail an audio-only title video object audio stream attribute (AOTT-VOB-AST-ATR) of FIG. 39;
FIG. 42 is an explanatory diagram showing the channel assignment information of FIGS. 40 and 41 in detail.
FIG. 43 is an explanatory diagram showing the downmix coefficient (ATS-DM-COEFT) of FIG. 39 in detail;
FIG. 44 is an explanatory diagram showing the still picture data attribute (ATS-SPCT-ATR) of FIG. 39 in detail.
FIG. 45 is an explanatory diagram showing in detail an audio title set program chain information table (ATS-PGCIT) of FIG. 31;
FIG. 46 is an explanatory diagram showing the ATS-PGCIT information (ATS-PGCITI) of FIG. 45 in detail;
FIG. 47 is an explanatory diagram showing an ATS-PGCI search pointer (ATS-PGCI-SRP) in FIG. 45 in detail;
FIG. 48 is an explanatory diagram showing an ATS-PGC category (ATS-PGCI-CAT) in FIG. 47 in detail;
FIG. 49 is an explanatory diagram showing the audio title set program chain information (ATS-PGCI) in FIG. 45 in detail;
50 is an explanatory diagram showing the ATS-PGC general information (ATS-PGC-GI) of FIG. 49 in detail.
FIG. 51 is an explanatory diagram showing the ATS-PGC content (ATS-PGC-CNT) of FIG. 50 in detail;
FIG. 52 is an explanatory diagram showing an ATS program information table (ATS-PGIT) in FIG. 49 in detail;
FIG. 53 is an explanatory diagram showing the ATS program information (ATS-PGI) of FIG. 52 in detail;
FIG. 54 is an explanatory diagram showing the ATS-PG content (ATS-PG-CNT) of FIG. 53 in detail;
FIG. 55 is an explanatory diagram showing an ATS cell playback information table (ATS-C-PBIT) of FIG. 52 in detail;
FIG. 56 is an explanatory diagram showing the ATS cell playback information (ATS-C-PBI) of FIG. 55 in detail;
FIG. 57 is an explanatory diagram showing the ATS-C type (ATS-C-TY) of FIG. 56 in detail.
FIG. 58 is a block diagram illustrating an encoding device according to a fifth embodiment.
FIG. 59 is a flowchart showing the processing of the encoding device in FIG. 58;
FIG. 60 is a block diagram illustrating a decoding device according to a fifth embodiment.
FIG. 61 is a block diagram functionally showing the decoding device of FIG. 60.
FIG. 62 is a flowchart showing processing of the decoding device in FIGS. 60 and 61.
FIG. 63 is a block diagram showing a packing device for transmitting an audio signal according to the fifth embodiment.
FIG. 64 is a flowchart showing a packing process of the packing device of FIG. 63.
FIG. 65 is a flowchart showing the pack generation processing of FIG. 64 in detail.
FIG. 66 is a flowchart showing the ATS generation processing of FIG. 64 in detail.
FIG. 67 is a flowchart showing a transmission process of the packing device of FIG. 63.
FIG. 68 is a block diagram showing an unpacking device for transmitting an audio signal according to the fifth embodiment.
FIG. 69 is a flowchart showing a receiving process of the unpacking device of FIG. 68.
70 is a flowchart showing an unpacking process of the unpacking device of FIG. 68.
FIG. 71 is a flowchart showing the ATSI decoding process of FIG. 70 in detail.
FIG. 72 is a flowchart showing the pack decoding process of FIG. 70 in detail.
FIG. 73 is an explanatory diagram showing an SPS (still picture set), that is, an ASVS (audio still video set) in FIG. 31 in detail;
FIG. 74 is an explanatory diagram showing ASVUI (Audio Still Video Unit Information) of FIG. 73 in detail;
FIG. 75 is an explanatory diagram showing in detail an ASV-ADMAP (audio still video address map) shown in FIG. 73;
FIG. 76 is an explanatory diagram showing ASVOBS (Audio Still Video Object Set) of FIG. 73 in detail;
FIG. 77 is an explanatory diagram showing the highlight information pack, the still picture pack, and the sub-picture pack in FIG. 76 in detail;
FIG. 78 is an explanatory diagram showing the highlight information of FIG. 77 in detail;
FIG. 79 is an explanatory diagram showing the still picture packet of FIG. 77 in detail;
FIG. 80 is an explanatory diagram showing the sub-picture packet of FIG. 77 in detail;
FIG. 81 is an explanatory diagram showing a display screen using the highlight information pack, still picture pack, and sub-picture pack shown in FIG. 78;
FIG. 82 is an explanatory diagram showing a modification of the data structure of FIG. 31;
FIG. 83 is an explanatory diagram specifically showing a still picture control information table (SPCIT) of FIG. 82, that is, an ATS-ASV-PBIT (ATS audio still video playback information table).
FIG. 84 is an explanatory diagram showing in detail ATS-ASV-playback information search pointers (ATS-PG-ASV-PBIT-SRP # 1- # m) of FIG. 83;
FIG. 85 is an explanatory diagram showing the ASV display mode of FIG. 84 in detail;
86 is an explanatory diagram showing the ATS-ASV-PBI (ATS audio still video playback information) of FIG. 83 in detail;
FIG. 87 is an explanatory diagram showing the ASV display list in FIG. 86 in detail;
FIG. 88 is an explanatory diagram showing another ASV display list in FIG. 86 in detail.
FIG. 89 is an explanatory diagram showing another ASV display list in FIG. 86 in detail.
FIG. 90 is an explanatory diagram showing another ASV display list in FIG. 86 in detail;
[Explanation of symbols]
A pack 1st pack
AOB audio object
AOBS Audio Object Set
ATSI Audio Title Set Information
ATSI-MAT audio title set information management table
RTI pack second pack
SPS Still Picture Set
ASVS Audio Still Video Set
SPCT Pack Third Pack

Claims (4)

マルチチャネルのアナログオーディオ信号の第1のグループのチャネルと第2のグループのチャネルとでそれぞれ同一または異なる第1及び第2のサンプリング周波数(fs1、fs2)によりグループ別にA/D変換してオーディオデータを生成するステップと、
複数のオーディオオブジェクト(AOB)を含むオーディオタイトルセット(ATS)と、スチルピクチャセット(SPS)とを有し、
前記オーディオオブジェクト(AOB)が、
実データとして前記オーディオデータを有する第1のパックのみにより構成された第1のタイプのオーディオ・セル(ATS−C)から構成される第1のオーディオオブジェクト(AOB)と、
前記第1のパック、及び実データとして前記オーディオデータに関するリアルタイムインフォメーションデータを有する第2のパックにより構成された第2のタイプのオーディオ・セル(ATS−C)から構成される第2のオーディオオブジェクト(AOB)の2種類で構成され、
さらに、前記スチルピクチャセット(SPS)が前記オーディオデータに関するスチルピクチャデータを含む第3のパックを有し、
前記オーディオタイトルセット(ATS)は前記オーディオ・セル(ATS−C)のタイプを識別するタイプ識別データ(ATS−C−TY)を含むと共に前記複数のオーディオオブジェクト(AOB)が所定の再生順に再生されるための制御情報であってオーディオ・セル単位で再生制御するためのオーディオ・セル・プレイバック・インフォメーション(ATS−C−PBI)を有する制御情報(ATS−PGCIT)を含むオーディオタイトルセット・インフォメーション(ATSI)が配置され、このオーディオタイトルセット・インフォメーション(ATSI)は、前記スチルピクチャセット(SPS)内のスチルピクチャデータをページ制御する制御情報であってシーケンシャル再生モード(シーケンシャル)とランダム再生モード(ランダム)とを識別するモードデータ(ディスプレイオーダーモード)を含むスチルピクチャ制御情報(SPCIT)を有しており、
さらに、前記第1のパック内には前記オーディオデータが記録されるパケットを有し、前記パケットにはさらに前記オーディオデータの第1及び第2のサンプリング周波数(fs1、fs2)が記録されるプライベートヘッダを有するように構成される、
データ構造にフォーマット化するステップと、
からなるオーディオ信号のエンコード方法
A / D conversion is performed for each group using the same or different first and second sampling frequencies (fs1, fs2) for the channels of the first group and the channels of the second group of the multi-channel analog audio signal , and audio data is obtained. the method comprising the steps of: generating a,
An audio title set (ATS) including a plurality of audio objects (AOB) and a still picture set (SPS);
The audio object (AOB) is
The first and the audio object (AOB) formed from a first type of the audio cell composed by only the first pack having the audio data as real data (ATS-C),
A second audio object ( ATS-C) composed of a second type of audio cell (ATS-C) composed of the first pack and a second pack having real-time information data on the audio data as actual data. AOB)
Further, the still picture set (SPS) has a third pack including still picture data related to the audio data,
The audio title set (ATS) includes type identification data (ATS-C-TY) for identifying the type of the audio cell (ATS-C), and the plurality of audio objects (AOB) are reproduced in a predetermined reproduction order. Title information including control information (ATS-PGCIT) having audio cell playback information (ATS-C-PBI) for controlling playback in units of audio cells. ATSI) are arranged, the audio title set information (ATSI), the still picture set (SPS) in the still picture data and a control information for page control of the sequential playback mode (sequential) and the random reproduction mode De has a (random) and identifying the mode data still picture control information including (Display Order Mode) (SPCIT),
The first pack further includes a packet in which the audio data is recorded, and the packet further includes a private header in which first and second sampling frequencies (fs1, fs2) of the audio data are recorded. Is configured to have
A step of formatting the data structure,
An audio signal encoding method consisting of :
請求項1に記載のオーディオ信号のエンコード方法によりエンコードされて生成されたデータ構造のデータを送信または受信するオーディオ信号送信受信方法であって、
前記データを所定の通信フォーマットに変換して送信し、または前記所定の通信フォーマットに変換されたデータを受信して元のデータに復元するステップを有するオーディオ信号送信受信方法。
An audio signal transmission / reception method for transmitting or receiving data having a data structure encoded and generated by the audio signal encoding method according to claim 1,
An audio signal transmission / reception method, comprising: converting the data into a predetermined communication format and transmitting the data; or receiving the data converted into the predetermined communication format and restoring the original data.
請求項1に記載のオーディオ信号のエンコード方法によりエンコードされて生成されたデータ構造が記録されたデータをデコードするコンピュータプログラムが記録されたコンピュータプログラムの記録媒体であって、
前記記録されたオーディオタイトルセット(ATS)に配置されるオーディオタイトルセット・インフォメーション(ATSI)からスチルピクチャのモードデータ(ディスプレイオーダーモード)を含むスチルピクチャ制御情報(SPCIT)をデコードしてモードデータ(ディスプレイオーダーモード)を取り出す第1のデコードのステップと、
前記記録されたオーディオタイトルセット(ATS)に配置される第1のパック、及び第2のパック、さらにスチルピクチャセット(SPS)に配置される第3のパックを識別する第2のデコードのステップと、
前記第2のデコードのステップから取り出されたそれぞれのパックからオーディオデータ 、リアルタイムインフォメーションデータ、及びスチルピクチャデータをデコードする第3のデコードのステップと、
少なくとも前記第1のデコードのステップから取り出されたモードデータ(ディスプレイオーダーモード)に基づいて前記第2のデコードのステップで取り出されたスチルピクチャデータを、制御して単独で/または前記オーディオデータと共に出力するステップとを、有するコンピュータプログラムの記録媒体。
A recording medium of a computer program recording a computer program for decoding data recorded with a data structure encoded and generated by the audio signal encoding method according to claim 1,
The recorded audio title set audio title set information (ATSI) decodes the mode data of the still picture control information (SPCIT) including mode data of a still picture (display order mode) from (display arranged in (ATS) Order mode) , a first decoding step to retrieve
A second decoding step for identifying a first pack and a second pack arranged in the recorded audio title set (ATS) , and a third pack arranged in a still picture set (SPS) ; ,
A third decoding step of decoding audio data , real-time information data, and still picture data from each of the packs extracted from the second decoding step;
The still picture data extracted in the second decoding step is controlled and output alone and / or together with the audio data based on at least the mode data (display order mode) extracted from the first decoding step. And a recording medium for a computer program.
請求項1に記載のオーディオ信号のエンコード方法によりエンコードされて生成されたデータ構造が記録されたデータをデコードするオーディオ信号のデコード方法であって、
前記記録されたオーディオタイトルセット(ATS)に配置されるオーディオタイトルセット・インフォメーション(ATSI)からスチルピクチャのモードデータ(ディスプレイオーダーモード)を含むスチルピクチャ制御情報(SPCIT)をデコードしてモードデータ(ディスプレイオーダーモード)を取り出す第1のデコードのステップと、
前記記録されたオーディオタイトルセット(ATS)に配置される第1のパック、及び第2のパック、さらにスチルピクチャセット(SPS)に配置される第3のパックを識別する第2のデコードのステップと、
前記第2のデコードのステップから取り出されたそれぞれのパックからオーディオデータ、リアルタイムインフォメーションデータ、及びスチルピクチャデータをデコードする第3のデコードのステップと、
少なくとも前記第1のデコードのステップから取り出されたモードデータ(ディスプレイオーダーモード)に基づいて前記第2のデコードのステップで取り出されたスチルピクチャデータを、制御して単独で/または前記オーディオデータと共に出力するステップとを、有するオーディオ信号のデコード方法
An audio signal decoding method for decoding data in which a data structure encoded and generated by the audio signal encoding method according to claim 1 is recorded,
The recorded audio title set audio title set information (ATSI) decodes the mode data of the still picture control information (SPCIT) including mode data of a still picture (display order mode) from (display arranged in (ATS) Order mode), a first decoding step to retrieve
A second decoding step for identifying a first pack and a second pack arranged in the recorded audio title set (ATS) , and a third pack arranged in a still picture set (SPS); ,
A third decoding step of decoding audio data, real-time information data, and still picture data from each of the packs extracted from the second decoding step;
The still picture data extracted in the second decoding step is controlled and output alone and / or together with the audio data based on at least the mode data (display order mode) extracted from the first decoding step. And an audio signal decoding method .
JP2002022905A 1997-11-28 2002-01-31 Audio signal encoding method, audio signal transmission / reception method, recording medium for computer program, and audio signal decoding method Expired - Fee Related JP3603868B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002022905A JP3603868B2 (en) 1997-11-28 2002-01-31 Audio signal encoding method, audio signal transmission / reception method, recording medium for computer program, and audio signal decoding method

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP9-343916 1997-11-28
JP34391697 1997-11-28
JP12289998 1998-04-16
JP10-122899 1998-04-16
JP2002022905A JP3603868B2 (en) 1997-11-28 2002-01-31 Audio signal encoding method, audio signal transmission / reception method, recording medium for computer program, and audio signal decoding method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP24255398A Division JP3377176B2 (en) 1997-11-28 1998-08-12 Audio disc and decoding device

Publications (3)

Publication Number Publication Date
JP2002304850A JP2002304850A (en) 2002-10-18
JP3603868B2 true JP3603868B2 (en) 2004-12-22
JP2002304850A5 JP2002304850A5 (en) 2005-06-09

Family

ID=27314575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002022905A Expired - Fee Related JP3603868B2 (en) 1997-11-28 2002-01-31 Audio signal encoding method, audio signal transmission / reception method, recording medium for computer program, and audio signal decoding method

Country Status (1)

Country Link
JP (1) JP3603868B2 (en)

Also Published As

Publication number Publication date
JP2002304850A (en) 2002-10-18

Similar Documents

Publication Publication Date Title
JP3603868B2 (en) Audio signal encoding method, audio signal transmission / reception method, recording medium for computer program, and audio signal decoding method
JP3603861B2 (en) Audio signal encoding method, audio signal transmission / reception method, and recording medium for computer program
JP3603858B2 (en) Audio signal encoding method and decoding method
JP3603870B2 (en) Audio signal encoding method, audio signal transmission / reception method, and recording medium for computer program
JP3603852B2 (en) Audio signal encoding method and decoding method
JP3603860B2 (en) Audio signal encoding method and decoding method
JP3603853B2 (en) Audio signal encoding method and decoding method
JP3603856B2 (en) Audio signal encoding method and decoding method
JP3603866B2 (en) Audio signal encoding method, audio signal transmission / reception method, and recording medium for computer program
JP3603869B2 (en) Audio signal encoding method, audio signal transmission / reception method, and recording medium for computer program
JP3603862B2 (en) Audio signal encoding method, audio signal transmission / reception method, and recording medium for computer program
JP3603865B2 (en) Audio signal encoding method, audio signal transmission / reception method, and recording medium for computer program
JP3603867B2 (en) Audio signal encoding method, audio signal transmission / reception method, and recording medium for computer program
JP3603864B2 (en) Audio signal encoding method, audio signal transmission / reception method, and recording medium for computer program
JP3601790B2 (en) Audio signal encoding method and decoding method
JP3603857B2 (en) Audio signal encoding method and decoding method
JP3603863B2 (en) Audio signal encoding method, audio signal transmission / reception method, and recording medium for computer program
JP3603854B2 (en) Audio signal encoding method and decoding method
JP3603855B2 (en) Audio signal encoding method and decoding method
JP3603859B2 (en) Audio signal encoding method and reproduction method
JP2004006058A (en) Dvd audio disk and decoder
JP2004103238A (en) Digital video disk audio disk and decoding system
JP2004103237A (en) Dvd audio disk and reproducing device
JP2004127498A (en) Encoding method and decoding device for audio signal
JP2004079175A (en) Encoding method and decoding method for audio signal

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040907

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040920

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071008

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081008

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091008

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101008

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101008

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111008

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121008

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121008

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121008

Year of fee payment: 8

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131008

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees