JPWO2004008759A1 - データ処理装置 - Google Patents

データ処理装置 Download PDF

Info

Publication number
JPWO2004008759A1
JPWO2004008759A1 JP2005505097A JP2005505097A JPWO2004008759A1 JP WO2004008759 A1 JPWO2004008759 A1 JP WO2004008759A1 JP 2005505097 A JP2005505097 A JP 2005505097A JP 2005505097 A JP2005505097 A JP 2005505097A JP WO2004008759 A1 JPWO2004008759 A1 JP WO2004008759A1
Authority
JP
Japan
Prior art keywords
data
file
information
stream
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005505097A
Other languages
English (en)
Other versions
JP4299836B2 (ja
Inventor
伊藤 正紀
正紀 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2004008759A1 publication Critical patent/JPWO2004008759A1/ja
Application granted granted Critical
Publication of JP4299836B2 publication Critical patent/JP4299836B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明のデータ処理装置は、映像・音声データを受け取る受信部100、102と、受け取った映像・音声データを符号化して、MPEG2システム規格の符号化データを生成する圧縮部101と、符号化データを参照する参照情報、および、符号化データのVOBUをサンプル単位とし、サンプル単位の属性を記述した属性情報を含む付属情報を生成する付属情報生成部103と、符号化データをデータファイルとして記録媒体に記録し、付属情報を付属情報ファイルとして記録媒体に記録する記録部120とを備えている。符号化データは、付属情報ファイルおよびMPEG2システム規格のいずれに基づいても復号化することが可能である。

Description

本発明は、光ディスク等の記録媒体に動画ストリームのストリームデータを記録するデータ処理装置および方法等に関する。
映像データを低いビットレートで圧縮し符号化する種々のデータストリームが規格化されている。そのようなデータストリームの例として、MPEG2システム規格(ISO/IEC 13818−1)のシステムストリームが知られている。システムストリームは、プログラムストリーム(PS)、トランスポートストリーム(TS)、およびPESストリームの3種類を包含する。
近年、新たにMPEG4システム規格(ISO/IEC 14496−1)のデータストリームを規定する動きが進んでいる。MPEG4システム規格のフォーマットでは、MPEG2映像ストリームまたはMPEG4映像ストリームを含む映像ストリーム、および、各種音声ストリームが多重化され、動画ストリームのデータとして生成される。さらにMPEG4システム規格のフォーマットでは付属情報が規定される。付属情報と動画ストリームとは1つのファイル(MP4ファイル)として規定される。MP4ファイルのデータ構造は、Apple(登録商標)社のクイックタイム(QuickTime)ファイルフォーマットをベースにして、そのフォーマットを拡張して規定されている。なお、MPEG2システム規格のシステムストリームには、付属情報(アクセス情報、特殊再生情報、記録日時等)を記録するデータ構造は規定されていない。MPEG2システム規格では、付属情報はシステムストリーム内に設けられているからである。
映像データおよび音声データは、従来、磁気テープに記録されることが多かった。しかし、近年は磁気テープに代わる記録媒体として、DVD−RAM、MO等に代表される光ディスクが注目を浴びている。
図1は、従来のデータ処理装置350の構成を示す。データ処理装置350は、DVD−RAMディスクにデータストリームを記録し、DVD−RAMディスクに記録されたデータストリームを再生することができる。データ処理装置350は、映像信号入力部300および音声信号入力部302において映像データ信号および音声データ信号を受け取り、それぞれMPEG2圧縮部301に送る。MPEG2圧縮部301は、映像データおよび音声データを、MPEG2規格および/またはMPEG4規格に基づいて圧縮符号化し、MP4ファイルを生成する。より具体的に説明すると、MPEG2圧縮部301は、映像データおよび音声データをMPEG2ビデオ規格に基づいて圧縮符号化して映像ストリームおよび音声ストリームを生成した後で、さらにMPEG4システム規格に基づいてそれらのストリームを多重化してMP4ストリームを生成する。このとき、記録制御部341は記録部320の動作を制御する。連続データ領域検出部340は、記録制御部341の指示によって、論理ブロック管理部343で管理されるセクタの使用状況を調べ、物理的に連続する空き領域を検出する。そして記録部320は、ピックアップ330を介してMP4ファイルをDVD−RAMディスク331に書き込む。
図2は、MP4ファイル20のデータ構造を示す。MP4ファイル20は、付属情報21および動画ストリーム22を有する。付属情報21は、映像データ、音声データ等の属性を規定するアトム構造23に基づいて記述されている。図3は、アトム構造23の具体例を示す。アトム構造23は、映像データおよび音声データの各々について、独立してフレーム単位のデータサイズ、データの格納先アドレス、再生タイミングを示すタイムスタンプ等の情報が記述されている。これは映像データおよび音声データが、それぞれ別個のトラックアトムとして管理されていることを意味する。
図2に示すMP4ファイルの動画ストリーム22には、映像データおよび音声データがそれぞれ1つ以上のフレーム単位で配置され、ストリームを構成している。例えば動画ストリームがMPEG2規格の圧縮符号化方式を利用して得られたとすると、動画ストリームには、複数のGOPが規定されている。GOPは、単独で再生され得る映像フレームであるIピクチャと、次のIピクチャまでのPピクチャおよびBピクチャを含む複数の映像フレームをまとめた単位である。動画ストリーム22の任意の映像フレームを再生するとき、まず動画ストリーム22内のその映像フレームを含むGOPが特定される。
なお、以下では、図2のMP4ファイルのデータ構造に示すように、動画ストリームと付属情報とを有する構造のデータストリームを「MP4ストリーム」と称する。
図4は、動画ストリーム22のデータ構造を示す。動画ストリーム22は、映像トラックと音声トラックとを含み、各トラックには識別子(TrackID)が付されている。トラックは各1つ存在するとは限らず、途中でトラックが切り替わる場合もある。図5は、途中でトラックが切り替わった動画ストリーム22を示す。
図6は、動画ストリーム22とDVD−RAMディスク331の記録単位(セクタ)との対応を示す。記録部320は、動画ストリーム22をDVD−RAMディスクにリアルタイムで記録する。より具体的には、記録部320は、最大記録レート換算で11秒分以上の物理的に連続する論理ブロックを1つの連続データ領域として確保し、この領域へ映像フレームおよび音声フレームを順に記録する。連続データ領域は、各々が32kバイトの複数の論理ブロックから構成され、論理ブロックごとに誤り訂正符号が付与される。論理ブロックはさらに、各々が2kバイトの複数のセクタから構成される。なお、データ処理装置350の連続データ領域検出部340は、1つの連続データ領域の残りが最大記録レート換算で3秒分を切った時点で、次の連続データ領域を再び検出する。そして、1つの連続データ領域が一杯になると、次の連続データ領域に動画ストリームを書き込む。MP4ファイル20の付属情報21も、同様にして確保された連続データ領域に書き込まれる。
図7は、記録されたデータがDVD−RAMのファイルシステムにおいて管理されている状態を示す。例えばUDF(Universal Disk Format)ファイルシステム、またはISO/IEC 13346(Volume and file structure of write−once and rewritable media using non−sequential recording for information interchange)ファイルシステムが利用される。図7では、連続して記録された1つのMP4ファイルがファイル名MOV0001.MP4として記録されている。このファイルは、ファイル名およびファイルエントリの位置が、FID(File Identifier Descriptor)で管理されている。そして、ファイル名はファイル・アイデンティファイア欄にMOV0001.MP4として設定され、ファイルエントリの位置は、ICB欄にファイルエントリの先頭セクタ番号として設定される。
なお、UDF規格はISO/IEC 13346規格の実装規約に相当する。また、DVD−RAMドライブを1394インタフェースおよびSBP−2(Serial Bus Protocol)プロトコルを介してコンピュータ(PC等)へ接続することにより、UDFに準拠した形態で書きこんだファイルをPCからも1つのファイルとして扱うことができる。
ファイルエントリは、アロケーションディスクリプタを使ってデータが格納されている連続データ領域(CDA:Contiguous Data Area)a、b、cおよびデータ領域dを管理する。具体的には、記録制御部341は、MP4ファイルを連続データ領域aへ記録している最中に不良論理ブロックを発見すると、その不良論理ブロックをスキップして連続データ領域bの先頭から書き込みを継続する。次に、記録制御部341がMP4ファイルを連続データ領域bへ記録している最中に、書き込みができないPCファイルの記録領域の存在を検出したときには、連続データ領域cの先頭から書き込みを継続する。そして、記録が終了した時点でデータ領域dに付属情報21を記録する。この結果、ファイルVR_MOVIE.VROは連続データ領域a、b、c、dから構成される。
図7に示すように、アロケーションディスクリプタa、b、c、dが参照するデータの開始位置は、セクタの先頭に一致する。そして、最後尾のアロケーションディスクリプタd以外のアロケーションディスクリプタa、b、cが参照するデータのデータサイズは1セクタの整数倍である。このような記述規則は予め規定されている。
MP4ファイルを再生するとき、データ処理装置350は、ピックアップ330および再生部321を経由して受け取った動画ストリームを取り出し、MPEG2復号部311で復号して映像信号と音声信号を生成し、映像信号出力部310および音声信号出力部312から出力する。DVD−RAMディスクからのデータの読み出しと読み出したデータのMPEG2復号部311への出力は同時に行われる。このとき、データの出力速度よりもデータの読出速度を大きくし、再生すべきデータが不足しないように制御する。したがって、連続してデータを読み出し、出力を続けると、データ読み出し速度とデータ出力速度との差分だけ出力すべきデータを余分に確保できることになる。余分に確保できるデータをピックアップのジャンプによりデータ読み出しが途絶える間の出力データとして使うことにより、連続再生を実現することができる。
具体的には、DVD−RAMディスク331からのデータ読み出し速度が11Mbps、MPEG2復号部311へのデータ出力速度が最大8Mbps、ピックアップの最大移動時間が3秒とすると、ピックアップ移動中にMPEG2復号部311へ出力するデータ量に相当する24Mビットのデータが余分な出力データとして必要になる。このデータ量を確保するためには、8秒間の連続読み出しが必要になる。すなわち、24Mビットをデータ読み出し速度11Mbpsとデータ出力速度8MbpSの差で除算した時間だけ連続読み出しする必要がある。
したがって、8秒間の連続読み出しの間に88Mビット分、すなわち11秒分の出力データを読み出すことになるので、11秒分以上の連続データ領域を確保することで、連続データ再生を保証することが可能となる。
なお、連続データ領域の途中には、数個の不良論理ブロックが存在していてもよい。ただし、この場合には、再生時にかかる不良論理ブロックを読み込むのに必要な読み出し時間を見越して、連続データ領域を11秒分よりも少し多めに確保する必要がある。
記録されたMP4ファイルを削除する処理を行う際には、記録制御部341は記録部320および再生部321を制御して所定の削除処理を実行する。MP4ファイルは、付属情報部分に全フレームに対する表示タイミング(タイムスタンプ)が含まれる。したがって、例えば動画ストリーム部分の途中を部分的に削除する際には、タイムスタンプに関しては付属情報部分のタイムスタンプのみを削除すればよい。なお、MPEG2システムストリームでは、部分削除位置において連続性を持たせるために動画ストリームを解析する必要がある。タイムスタンプがストリーム中に分散しているからである。
MP4ファイルフォーマットの特徴は、映像・音声ストリームの映像フレームまたは音声フレームを、ひとつの集合として記録する点にある。同時に、国際標準としては初めて、各フレームへのランダムアクセスを可能とするアクセス情報を規定している。アクセス情報はフレーム単位で設けられ、例えばフレームサイズ、フレーム周期、フレームに対するアドレス情報を含む。すなわち、映像フレームに対しては表示時間にして1/30秒ごと、音声フレームに対しては、例えば、AC−3音声の場合であれば合計1536個のサンプルを1単位(すなわち1音声フレーム)とし、単位ごとにアクセス情報が格納される。これにより、例えば、ある映像フレームの表示タイミングを変更したい場合には、アクセス情報の変更のみで対応でき、映像・音声ストリームを必ずしも変更する必要がない。このようなアクセス情報の情報量は1時間当り約1Mバイトである。
アクセス情報の情報量に関連して、例えば「リライタブル/再記録可能なディスクのためのDVD規格パート3ビデオレコーディング規格バージョン1.1」,DVDフォーラム発行,VR4,p.31〜35によれば、DVDビデオレコーディング規格のアクセス情報に必要な情報量は1時間当り70キロバイトである。DVDビデオレコーディング規格のアクセス情報の情報量は、MP4ファイルの付属情報に含まれるアクセス情報の情報量の10分の1以下である。図8はDVDビデオレコーディング規格のアクセス情報として利用されるフィールド名と、フィールド名が表すピクチャ等との対応関係を模式的に示す。図9は、図8に記載されたアクセス情報のデータ構造、データ構造に規定されるフィールド名、その設定内容およびデータサイズを示す。
また、例えば特開2001−94933号公報(第3図)に記載されている光ディスク装置は、映像フレームを1フレーム単位ではなく1GOP単位で記録し、同時に音声フレームを1GOPに相当する時間長で連続的に記録する。そして、GOP単位でアクセス情報を規定する。これによりアクセス情報に必要な情報量を低減している。
また、MP4ファイルは、MPEG2ビデオ規格に基づいて動画ストリームを記述しているものの、MPEG2システム規格のシステムストリームと互換性がない。よって、現在PC等で用いられているアプリケーションの動画編集機能を利用して、MP4ファイルを編集することはできない。多くのアプリケーションの編集機能は、MPEG2システム規格の動画ストリームを編集の対象としているからである。また、MP4ファイルの規格には、動画ストリーム部分の再生互換性を確保するためのデコーダモデルの規定も存在しない。これでは、現在極めて広く普及しているMPEG2システム規格に対応したソフトウェアおよびハードウェアを全く活用できない。
本発明の目的は、アクセス情報の情報量が小さく、かつ、従来のフォーマットに対応するアプリケーション等でも利用可能なデータ構造を提供すること、および、そのデータ構造に基づく処理が可能なデータ処理装置等を提供することである。
本発明によるデータ処理装置は、映像データおよび音声データを受け取る受信部と、受け取った前記映像データおよび前記音声データを符号化して、MPEG2システム規格の符号化データを生成する圧縮部と、前記符号化データを参照する参照情報、および、前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位とし、前記サンプル単位の属性を記述した属性情報を含む付属情報を生成する付属情報生成部と、前記符号化データをデータファイルとして記録媒体に記録し、前記付属情報を付属情報ファイルとして前記記録媒体に記録する記録部とを備えている。前記符号化データは、前記付属情報ファイルおよび前記MPEG2システム規格のいずれに基づいても復号化することが可能である。
ある好ましい実施形態において、前記参照情報は、前記記録媒体に記録された前記データファイルのファイル名および格納位置を示している。
ある好ましい実施形態において、前記圧縮部は、複数の符号化データを生成し、前記付属情報生成部は、前記複数の符号化データの各々を参照する前記参照情報を生成する。
ある好ましい実施形態において、前記圧縮部は、複数の符号化データを生成し、前記付属情報生成部は、前記複数の符号化データを連続的に配列して1つのストリームデータを生成し、再生タイミングごとの符号化データのデータサイズが一定でない場合の符号化データの記録位置を特定する位置情報をさらに記述した付属情報を生成する。
ある好ましい実施形態において、前記圧縮部は、MPEG2プログラムストリームおよびMPEG2トランスポートストリームの一方に準拠した符号化データを生成する。
ある好ましい実施形態において、前記付属情報生成部は、前記符号化データのうち、前記音声データに対応する符号化音声データの音声フレームを、さらに他のサンプル単位として前記属性情報に記述する。
ある好ましい実施形態において、前記圧縮部は、第1〜第3のデータファイルを生成し、前記第2のデータファイルは、前記第1のデータファイルの符号化データと前記第3のデータファイルの符号化データとを時間的に連続して復号するために必要なフレームデータを含む。
ある好ましい実施形態において、付属情報生成部は、MP4フォーマットにしたがって記述された付属情報ファイルを生成する。
ある好ましい実施形態において、付属情報生成部は、QuickTimeフォーマットにしたがって記述された付属情報ファイルを生成する。
本発明のストリームデータは、データファイルに含まれる符号化データと、付属情報ファイルに含まれる付属情報とによって構成される。前記符号化データは、映像データおよび音声データがMPEG2システム規格にしたがって符号化され、かつ、前記付属情報および前記MPEG2システム規格のいずれに基づいても復号化することが可能である。前記付属情報は、前記符号化データを参照する参照情報および前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位として前記サンプル単位の属性を記述した属性情報を含む。本発明の記録媒体には、上述のストリームデータが記録されている。
本発明の他のデータ処理装置は、上述のストリームデータから前記付属情報ファイルを読み出し、さらに制御信号に基づいて前記データファイルを読み出す再生部と、前記付属情報ファイルの前記付属情報に規定される前記参照情報に基づいて、前記データファイルの読み出しを指示する信号を前記制御信号として生成する再生制御部と、読み出された前記データファイルの符号化データおよび前記付属情報を受け取り、前記付属情報に含まれる前記属性情報に基づいて、前記符号化データから前記映像データおよび前記音声データを復号する復号部と、復号された前記映像データおよび前記音声データを出力する出力部とを備えている。
本発明のデータ記録方法は、映像データおよび音声データを受け取るステップと、受け取った前記映像データおよび前記音声データを符号化して、MPEG2システム規格の符号化データを生成するステップと、前記符号化データを参照する参照情報、および、前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位とし、前記サンプル単位の属性を記述した属性情報を含む付属情報を生成するステップと、前記符号化データをデータファイルとして記録媒体に記録し、前記付属情報を付属情報ファイルとして前記記録媒体に記録するステップと、を包含する。前記符号化データは、前記付属情報ファイルおよび前記MPEG2システム規格のいずれに基づいても復号化することが可能である。
本発明のデータ記録プログラムは、データ処理装置において実行可能なコンピュータプログラムである。データ記録プログラムは、映像データおよび音声データを受け取るステップと、受け取った前記映像データおよび前記音声データを符号化して、MPEG2システム規格の符号化データを生成するステップと、前記符号化データを参照する参照情報、および、前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位とし、前記サンプル単位の属性を記述した属性情報を含む付属情報を生成するステップと、前記符号化データをデータファイルとして記録媒体に記録し、前記付属情報を付属情報ファイルとして前記記録媒体に記録するステップと、を包含する。前記符号化データは、前記付属情報ファイルおよび前記MPEG2システム規格のいずれに基づいても復号化することが可能である。
本発明のデータ再生方法は、上述のストリームデータから前記付属情報ファイルを読み出すステップと、前記付属情報ファイルの前記付属情報に規定される前記参照情報に基づいて、前記データファイルの読み出しを指示する制御信号を生成するステップと、前記制御信号に基づいて前記データファイルを読み出すステップと、読み出された前記データファイルの符号化データおよび前記付属情報を受け取り、前記付属情報に含まれる前記属性情報に基づいて、前記符号化データから前記映像データおよび前記音声データを復号するステップと、復号された前記映像データおよび前記音声データを出力するステップとを包含する。
本発明のデータ再生プログラムは、データ処理装置において実行可能なコンピュータプログラムである。データ再生プログラムは、上述のストリームデータから前記付属情報ファイルを読み出すステップと、前記付属情報ファイルの前記付属情報に規定される前記参照情報に基づいて、前記データファイルの読み出しを指示する制御信号を生成するステップと、前記制御信号に基づいて前記データファイルを読み出すステップと、読み出された前記データファイルの符号化データおよび前記付属情報を受け取り、前記付属情報に含まれる前記属性情報に基づいて、前記符号化データから前記映像データおよび前記音声データを復号するステップと、復号された前記映像データおよび前記音声データを出力するステップとを包含する。
本発明のさらに他のデータ処理装置は、映像データおよび音声データを受け取る受信部と、受け取った前記映像データおよび前記音声データを所定の符号化形式で符号化して、前記映像データに対応するデータと前記音声データに対応するデータとがインターリーブされた符号化データを生成する圧縮部と、付属情報を生成する付属情報生成部であって、前記付属情報は、符号化データを参照する参照情報およびサンプル単位の属性を記述した属性情報を含む付属情報生成部とを備えている。前記サンプルは、前記映像データの再生時間に基づいて構成された前記符号化データの集合であり、前記符号化データは、前記付属情報に基づく復号化、および、前記所定の符号化方式に対応する復号化方式のいずれに基づいても復号化することが可能である。
図1は、従来のデータ処理装置350の構成を示す図である。
図2は、MP4ファイル20のデータ構造を示す図である。
図3は、アトム構造23の具体例を示す図である。
図4は、動画ストリーム22のデータ構造を示す図である。
図5は、途中でトラックが切り替わった動画ストリーム22を示す図である。
図6は、動画ストリーム22とDVD−RAMディスク331のセクタとの対応を示す図である。
図7は、記録されたデータがDVD−RAMのファイルシステムにおいて管理されている状態を示す図である。
図8は、DVDビデオレコーディング規格のアクセス情報として利用されるフィールド名と、フィールド名が表すピクチャ等との対応関係を模式的に示す図である。
図9は、図8に記載されたアクセス情報のデータ構造、データ構造に規定されるフィールド名、その設定内容およびデータサイズを示す図である。
図10は、本発明によるデータ処理を行うポータブルビデオコーダ10−1、ムービーレコーダ10−2およびPC10−3の接続環境を示す図である。
図11は、データ処理装置10における機能ブロックの構成を示す図である。
図12は、本発明によるMP4ストリーム12のデータ構造を示す図である。
図13は、MPEG2−PS14の音声データの管理単位を示す図である。
図14は、プログラムストリームとエレメンタリストリームとの関係を示す図である。
図15は、付属情報13のデータ構造を示す図である。
図16は、アトム構造を構成する各アトムの内容を示す図である。
図17は、データ参照アトム15の記述形式の具体例を示す図である。
図18は、サンプルテーブルアトム16に含まれる各アトムの記述内容の具体例を示す図である。
図19は、サンプル記述アトム17の記述形式の具体例を示す図である。
図20は、サンプル記述エントリ18の各フィールドの内容を示す図である。
図21は、MP4ストリームの生成処理の手順を示すフローチャートである。
図22は、本発明による処理に基づいて生成されたMPEG2−PSと、従来のMPEG2 Video(エレメンタリストリーム)との相違点を示す表である。
図23は、1チャンクに1VOBUを対応させたときのMP4ストリーム12のデータ構造を示す図である。
図24は、1チャンクに1VOBUを対応させたときのデータ構造を示す図である。
図25は、1チャンクに1VOBUを対応させたときの、サンプルテーブルアトム19に含まれる各アトムの記述内容の具体例を示す図である。
図26は、1つの付属情報ファイルに対して2つのPSファイルが存在するMP4ストリーム12の例を示す図である。
図27は、1つのPSファイル内に不連続なMPEG2−PSが複数存在する例を示す図である。
図28は、シームレス接続用のMPEG2−PSを含むPSファイルを設けたMP4ストリーム12を示す図である。
図29は、不連続点において不足する音声(オーディオ)フレームを示す図である。
図30は、本発明の他の例によるMP4ストリーム12のデータ構造を示す図である。
図31は、本発明のさらに他の例によるMP4ストリーム12のデータ構造を示す図である。
図32は、MTFファイル32のデータ構造を示す図である。
図33は、各種のファイルフォーマット規格の相互関係を示す図である。
図34は、QuickTimeストリームのデータ構造を示す図である。
図35は、QuickTimeストリームの付属情報13における各アトムの内容を示す図である。
図36は、記録画素数が変化する場合の動画ストリームのフラグ設定内容を説明する図である。
以下、添付の図面を参照しながら、本発明の実施形態を説明する。
図10は、本発明によるデータ処理を行うポータブルビデオコーダ10−1、ムービーレコーダ10−2およびPC10−3の接続関係を示す。
ポータブルビデオコーダ10−1は、付属のアンテナを利用して放送番組を受信し、放送番組を動画圧縮してMP4ストリームを生成する。ムービーレコーダ10−2は、映像を録画するとともに、映像に付随する音声を録音し、MP4ストリームを生成する。MP4ストリームでは、映像・音声データは、所定の圧縮符号化方式によって符号化され、本発明によるデータ構造にしたがって記述されている。ポータブルビデオコーダ10−1およびムービーレコーダ10−2は、生成したMP4ストリームをDVD−RAM等の記録媒体131に記録し、またはIEEE1394、USB等のディジタルインターフェースを介して出力する。なお、ポータブルビデオコーダ10−1、ムービーレコーダ10−2等はより小型化が必要とされているため、記録媒体131は直径8cmの光ディスクに限られず、それよりも小径の光ディスク等であってもよい。
PC10−3は、記録媒体または伝送媒体を介してMP4ストリームを受け取る。各機器がディジタルインターフェースを介して接続されていると、PC10−3は、ムービーレコーダ10−2等を外部記憶装置として制御して、各機器からMP4ストリームを受け取ることができる。
PC10−3が本発明によるMP4ストリームの処理に対応したアプリケーションソフトウェア、ハードウェアを有する場合には、PC10−3は、MP4ファイル規格に基づくMP4ストリームとしてMP4ストリームを再生することができる。一方、本発明によるMP4ストリームの処理に対応していない場合には、PC10−3は、MPEG2システム規格に基づいて動画ストリーム部分を再生することができる。なお、PC10−3はMP4ストリームの部分削除等の編集に関する処理を行うこともできる。本明細書においては「再生」という語は編集に関する処理を含む。以下では、図10のポータブルビデオコーダ10−1、ムービーレコーダ10−2およびPC10−3を「データ処理装置」と称して説明する。
図11は、データ処理装置10における機能ブロックの構成を示す。以下では、本明細書では、データ処理装置10は、MP4ストリームの記録機能と再生機能の両方を有するとして説明する。具体的には、データ処理装置10は、MP4ストリームを生成して記録媒体131に書き込むことができ、かつ、記録媒体131に書き込まれたMP4ストリームを再生することができる。記録媒体131は例えばDVD−RAMディスクであり、以下、「DVD−RAMディスク131」と称する。
まず、データ処理装置10のMP4ストリーム記録機能を説明する。この機能に関連する構成要素として、データ処理装置10は、映像信号入力部100と、MPEG2−PS圧縮部101と、音声信号入力部102と、付属情報生成部103と、記録部120と、光ピックアップ130と、記録制御部141とを備えている。
映像信号入力部100は映像信号入力端子であり、映像データを表す映像信号を受け取る。音声信号入力部102は音声信号入力端子であり、音声データを表す音声信号を受け取る。例えば、ポータブルビデオコーダ10−1(図10)の映像信号入力部100および音声信号入力部102は、それぞれチューナ部(図示せず)の映像出力部および音声出力部と接続され、それぞれから映像信号および音声信号を受け取る。また、ムービーレコーダ10−2(図10)の映像信号入力部100および音声信号入力部102は、それぞれカメラのCCD(図示せず)出力およびマイク出力から映像信号および音声信号を受け取る。
MPEG2−PS圧縮部(以下「圧縮部」と称する)101は、映像信号および音声信号を受け取ってMPEG2システム規格のMPEG2プログラムストリーム(以下、「MPEG2−PS」と称する)を生成する。生成されたMPEG2−PSは、MPEG2システム規格に基づいて、ストリームのみに基づいて復号することができる。MPEG2−PSの詳細は後述する。
付属情報生成部103は、MP4ストリームの付属情報を生成する。付属情報は、参照情報および属性情報を含む。参照情報は、圧縮部101により生成されたMPEG2−PSを特定する情報であって、例えばMPEG2−PSが記録される際のファイル名およびDVD−RAMディスク131上の格納位置である。一方、属性情報は、MPEG2−PSのサンプル単位の属性を記述した情報である。「サンプル」とは、MP4ファイル規格の付属情報に規定されるサンプル記述アトム(Sample Description Atom;後述)における最小管理単位であり、サンプルごとのデータサイズ、再生時間等を記録している。1サンプルは、例えばランダムにアクセスすることが可能なデータ単位である。換言すれば、属性情報とはサンプルを再生するために必要な情報である。特に後述のサンプル記述アトム(Sample Description Atom)は、アクセス情報とも称される。
属性情報は、具体的には、データの格納先アドレス、再生タイミングを示すタイムスタンプ、符号化ビットレート、コーデック等の情報である。属性情報は、各サンプル内の映像データおよび音声データの各々に対して設けられ、以下に明示的に説明するフィールドの記述を除いては、従来のMP4ストリーム20の付属情報の内容に準拠している。
後述のように、本発明の1サンプルは、MPEG2−PSの1ビデオオブジェクトユニット(VOBU)である。なお、VOBUはDVDビデオレコーディング規格の同名のビデオオブジェクトユニットを意味する。付属情報の詳細は後述する。
記録部120は、記録制御部141からの指示に基づいてピックアップ130を制御し、DVD−RAMディスク131の特定の位置(アドレス)にデータを記録する。より具体的には、記録部120は、圧縮部101において生成されたMPEG2−PSおよび付属情報生成部103において生成された付属情報を、それぞれ別個のファイルとしてDVD−RAMディスク131上に記録する。
なお、データ処理装置10は、データの記録に際して動作する連続データ領域検出部(以下、「検出部」)140および論理ブロック管理部(以下、「管理部」)143を有している。連続データ領域検出部140は、記録制御部141からの指示に応じて論理ブロック管理部143において管理されるセクタの使用状況を調べ、物理的に連続する空き領域を検出する。記録制御部141は、この空き領域に対して記録部120にデータの記録を指示する。データの具体的な記録方法は、図7を参照しながら説明した記録方法と同様であり特に差異はないので、その詳細な説明は省略する。なお、MPEG2−PSおよび付属情報は、それぞれ別個のファイルとして記録されるので、図7におけるファイル・アイデンティファイア欄には、それぞれのファイル名が記述される。
次に、図12を参照しながらMP4ストリームのデータ構造を説明する。図12は、本発明によるMP4ストリーム12のデータ構造を示す。MP4ストリーム12は、付属情報13を含む付属情報ファイル(”MOV001.MP4”)と、MPEG2−PS14のデータファイル(”MOV001.MPG”)(以下「PSファイル」と称する)とを備えている。これら2つのファイル内のデータによって、1つのMP4ストリームを構成する。本明細書では、同じMP4ストリームに属することを明確にするため、付属情報ファイルおよびPSファイルに同じ名(”MOV001“)を付し、拡張子を異ならせている。具体的には、付属情報ファイルの拡張子は従来のMP4ファイルの拡張子と同じ“MP4”を採用し、PSファイルの拡張子は従来のプログラムストリームの一般的な拡張子“MPG”を採用する。
付属情報13は、MPEG2−PS14を参照するための参照情報(”dref”)を有する。さらに、付属情報13はMPEG2−PS14のビデオオブジェクトユニット(VOBU)ごとの属性を記述した属性情報を含む。属性情報はVOBUごとの属性を記述しているので、データ処理装置10はVOBU単位でMPEG2−PS14に含まれるVOBUの任意の位置を特定して再生・編集等をすることができる。
MPEG2−PS14は、映像パック、音声パック等がインターリーブされて構成されたMPEG2システム規格に基づく動画ストリームである。映像パックは、パックヘッダと符号化された映像データとを含む。音声パックは、パックヘッダと符号化された音声データとを含む。MPEG2−PS14では、映像の再生時間に換算して0.4〜1秒に相当する動画データを単位とするビデオオブジェクトユニット(VOBU)によりデータが管理されている。動画データは、複数の映像パックおよび音声パックを含む。データ処理装置10は、付属情報13において記述されている情報に基づいて、任意のVOBUの位置を特定しそのVOBUを再生することができる。なお、VOBUは1以上のGOPを含む。
本発明によるMP4ストリーム12の特徴の一つは、MPEG2−PS14は、MPEG4システム規格で規定されるMP4ストリームのデータ構造に従った属性情報13に基づいて復号化することが可能であるとともに、MPEG2システム規格に基づいても復号化することが可能な点にある。付属情報ファイルおよびPSファイルが別々に記録されているため、データ処理装置10がそれぞれを独立して解析、処理等することが可能だからである。例えば、本発明のデータ処理を実施可能なMP4ストリーム再生装置等は、属性情報13に基づいてMP4ストリーム12の再生時間等を調整し、MPEG2−PS14の符号化方式を特定して、対応する復号化方式によって復号化できる。また、MPEG2−PSを復号化することができる従来の装置等においては、はMPEG2システム規格にしたがって復号化できる。これにより、現在広く普及しているMPEG2システム規格にのみ対応したソフトウェアおよびハードウェアであっても、MP4ストリームに含まれる動画ストリームを再生することができる。
なお、VOBU単位のサンプル記述アトム(Sample Description Atom)を設けると同時に、図13に示すように、MPEG2−PS14の音声データの所定時間のフレーム分を管理単位としたサンプル記述アトム(Sample Description Atom)を設けてもよい。所定時間とは、例えば0.1秒である。図中「V」は図12の映像パックを示し、「A」は音声パックを示す。0.1秒分の音声フレームは1個以上の複数のパックから構成される。1音声フレームは、例えばAC−3の場合、サンプリング周波数を48kHzとしたとき、サンプリング個数にして1536サンプルの音声データを含む。このとき、サンプル記述アトムは、トラックアトム内のユーザデータアトム内に設けるか、または独立したトラックのサンプル記述アトムとして設けてもよい。また、他の実施例としては、付属情報13は、VOBUに同期する0.4〜1秒分の音声フレームを単位として、その単位毎の合計データサイズ、先頭パックのデータアドレス、および出力タイミングを示すタイムスタンプ等の属性を保持してもよい。
次に、MPEG2−PS14のビデオオブジェクトユニット(VOBU)のデータ構造を説明する。図14は、プログラムストリームとエレメンタリストリームとの関係を示す。MPEG2−PS14のVOBUは、複数の映像パック(V_PCK)および音声パック(A_PCK)を含む。なお、より厳密には、VOBUはシーケンスヘッダ(図中のSEQヘッダ)から、次のシーケンスヘッダの直前のパックまでによって構成される。すなわち、シーケンスヘッダはVOBUの先頭に配置される。一方、エレメンタリストリーム(Video)は、N個のGOPを含む。GOPは、各種のヘッダ(シーケンス(SEQ)ヘッダおよびGOPヘッダ)および映像データ(Iピクチャ、Pピクチャ、Bピクチャ)を含む。エレメンタリストリーム(Audio)は、複数の音声フレームを含む。
MPEG2−PS14のVOBUに含まれる映像パックおよび音声パックは、それぞれエレメンタリストリーム(Video)/(Audio)の各データを用いて構成されており、それぞれのデータ量が2キロバイトになるように構成されている。なお、上述のように各パックにはパックヘッダが設けられる。
なお、字幕データ等の副映像データに関するエレメンタリストリーム(図示せず)が存在するときは、MPEG2−PS14のVOBUはさらにその副映像データのパックも含む。
次に、図15および図16を参照しながら、MP4ストリーム12における付属情報13のデータ構造を説明する。図15は、付属情報13のデータ構造を示す。このデータ構造は「アトム構造」とも呼ばれ、階層化されている。例えば、“Movie Atom”は、“Movie Header Atom”、“Object Descriptor Atom”および“Track Atom”を含む。さらに“Track Atom”は、“Track Header Atom”、“Edit List Atom”、“Media Atom”および“User Data Atom”を含む。図示された他のAtomも同様である。
本発明では、特にデータ参照アトム(“Data Reference Atom”;dref)15およびサンプルテーブルアトム(“Sample Table Atom”;stbl)16を利用して、サンプル単位の属性を記述する。上述のように、1サンプルはMPEG2−PSの1ビデオオブジェクトユニット(VOBU)に対応する。サンプルテーブルアトム16は、図示される6つの下位アトムを含む。
図16は、アトム構造を構成する各アトムの内容を示す。データ参照アトム(“Data Reference Atom”)は、動画ストリーム(MPEG2−PS)14のファイルを特定する情報をURL形式で格納する。一方、サンプルテーブルアトム(“Sample Table Atom”)は、下位のアトムによってVOBU毎の属性を記述する。例えば、“Decoding Time to Sample Atom”においてVOBU毎の再生時間を格納し、“Sample Size Atom”においてVOBU毎のデータサイズを格納する。また“Sample Description Atom”は、MP4ストリーム12を構成するPSファイルのデータがMPEG2−PS14であることを示すとともに、MPEG2−PS14の詳細な仕様を示す。以下では、データ参照アトム(“Data Reference Atom)によって記述される情報を「参照情報」と称し、サンプルテーブルアトム(“Sample Table Atom”)において記述される情報を「属性情報」と称する。
図17は、データ参照アトム15の記述形式の具体例を示す。ファイルを特定する情報は、データ参照アトム15を記述するフィールドの一部(ここでは“DataEntryUrlAtom”)において記述される。ここでは、URL形式により、MPEG2−PS14のファイル名およびファイルの格納位置が記述されている。データ参照アトム15を参照することにより、その付属情報13とともにMP4ストリーム12を構成するMPEG2−PS14を特定できる。なお、MPEG2−PS14がDVD−RAMディスク131に記録される前であっても、図11の付属情報生成部103は、MPEG2−PS14のファイル名およびファイルの格納位置を特定することができる。ファイル名は予め決定でき、かつ、ファイルの格納位置もファイルシステムの階層構造の表記によって論理的に特定できるからである。
図18は、サンプルテーブルアトム16に含まれる各アトムの記述内容の具体例を示す。各アトムは、フィールド名、繰り返しの可否およびデータサイズを規定する。例えば、サンプルサイズアトム(Sample Size Atom”)は、3つのフィールド(“sample−size”、“sample count”および“entry−size”)を有する。このうち、サンプルサイズ(“sample−size”)フィールドには、VOBUのデフォルトのデータサイズが格納され、エントリサイズ(“entry−size”)フィールドには、VOBUのデフォルト値とは異なる個別のデータサイズが格納される。なお、図中の「設定値」欄のパラメータ(“VOBU_ENT”等)にはDVDビデオレコーディング規格の同名のアクセスデータと同じ値が設定される。
図18に示すサンプル記述アトム(“Sample Description Atom”)17は、サンプル単位の属性情報を記述する。以下、サンプル記述アトム17に記述される情報の内容を説明する。
図19は、サンプル記述アトム17の記述形式の具体例を示す。サンプル記述アトム17は、そのデータサイズ、各VOBUを1サンプルとするサンプル単位の属性情報等を記述する。属性情報は、サンプル記述アトム17の“sample_description_entry”18に記述される。
図20は、“sample_description_entry”18の各フィールドの内容を示す。エントリ18は、対応するMPEG2−PS14の符号化形式を指定するデータフォーマット(“data−format”)を含む。図中の“p2sm”は、MPEG2−PS14がMPEG2 Videoを含むMPEG2プログラムストリームであることを示す。
エントリ18は、そのサンプルの表示開始時刻(“開始Presentation Time”)および表示終了時刻(“終了Presentation Time”)を含む。これらは、最初および最後の映像フレームのタイミング情報を格納する。また、エントリ18は、そのサンプル内の映像ストリームの属性情報(“映像ES属性”)および音声ストリームの属性情報(“音声ES属性”)を含む。図19に示すように、映像データの属性情報は、映像のCODEC種別(例えば、MPEG2ビデオ)、映像データの幅(“Width”)、高さ(“height”)等を特定する。同様に、音声データの属性情報は、音声のCODEC種別(例えば、AC−3)、音声データのチャネル数(“channel count”)、音声サンプルのサイズ(“samplesize”)、サンプリングレート(“samplerate”)等を特定する。
さらにエントリ18は、不連続点開始フラグおよびシームレス情報を含む。これらの情報は、後述のように、1つのMP4ストリーム12内に複数のPSストリームが存在するときに記述される。例えば、不連続点開始フラグの値が“0”のときは、前の動画ストリームと現在の動画ストリームとが完全に連続したプログラムストリームであることを示し、値が“1”のときは、それらの動画ストリームは不連続のプログラムストリームであることを示す。そして不連続の場合には、動画や音声等の不連続点においても途切れ無く動画、音声等を再生するためのシームレス情報の記述が可能である。シームレス情報は、再生時に音声不連続情報およびSCR不連続情報を含む。音声不連続情報の無音声区間(すなわち図31のオーディオギャップ)の有無、開始タイミングおよび時間長を含む。SCR不連続情報には不連続点の直前と直後のパックのSCR値を含む。
不連続点開始フラグを設けることにより、Sample Description Entryの切り替えと動画ストリームの連続性の切り替え箇所を独立して指定できる。図36に示すように、例えば、記録画素数が途中で変化する際にはSample Descriptionを変化させるが、このとき、動画ストリーム自体が連続しているのであれば不連続点開始フラグを0に設定してもよい。不連続点開始フラグが0であることにより、情報ストリームを直接編集する場合に、PC等は、2つの動画ストリームの接続点を再編集しなくてもシームレスな再生が可能であることを把握することができる。なお、図36では水平画素数が変化した場合を例にしているが、その他の属性情報が変化した場合であってもよい。例えば、アスペクト情報に関して4:3のアスペクト比が16:9に変化した場合や、音声のビットレートが変化した場合等である。
以上、図12に示すMP4ストリーム12の付属情報13およびMPEG2−PS14のデータ構造を説明した。上述のデータ構造においては、MPEG2−PS14の部分削除を行う際には、付属情報13内のタイムスタンプ等の属性情報を変更するだけでよく、MPEG2−PS14に設けられているタイムスタンプを変更する必要がない。よって従来のMP4ストリームの利点を活かした編集処理が可能である。さらに、上述のデータ構造によれば、MPEG2システム規格のストリームに対応したアプリケーションやハードウェアを用いてPC上で動画編集するときは、PSファイルのみをPCにインポートすればよい。PSファイルのMPEG2−PS14は、MPEG2システム規格の動画ストリームだからである。このようなアプリケーションやハードウェアは広く普及しているので、既存のソフトウェアおよびハードウェアを有効に活用できる。同時に、付属情報をISO規格に準拠したデータ構造で記録できる。
次に、図11および図21を参照しながら、データ処理装置10がMP4ストリームを生成し、DVD−RAMディスク131上に記録する処理を説明する。図21は、MP4ストリームの生成処理の手順を示すフローチャートである。まずステップ210において、データ処理装置10は、映像信号入力部100を介して映像データを受け取り、音声信号入力部102を介して音声データを受け取る。そしてステップ211において、圧縮部101は受け取った映像データおよび音声データをMPEG2システム規格に基づいて符号化する。続いて圧縮部101は、ステップ212において映像および音声の符号化ストリームを利用して、MPEG2−PSを構成する(図14)。
ステップ213において、記録部120は、MPEG2−PSをDVD−RAMディスク131に記録する際のファイル名および記録位置を決定する。ステップ214において、付属情報生成部103は、PSファイルのファイル名および記録位置を取得して参照情報(Data Reference Atom;図17)として記述すべき内容を特定する。図17に示すように、本明細書では、ファイル名と記録位置とを同時に指定できる記述方式を採用した。
次に、ステップ215において、付属情報生成部103はMPEG2−PS14に規定されるVOBU毎に、再生時間、データサイズ等を表すデータを取得して属性情報(Sample Table Atom;図18〜20)として記述すべき内容を特定する。属性情報をVOBU単位で設けることにより、任意のVOBUの読み出しおよび復号化が可能になる。これは、1VOBUを1サンプルとして取り扱うことを意味する。
次に、ステップ216において、付属情報生成部103は参照情報(Data Reference Atom)および属性情報(Sample Table Atom)等に基づいて、付属情報を生成する。
ステップ217において、記録部120は、付属情報13およびMPEG2−PS14をMP4ストリーム12として出力し、DVD−RAMディスク131上にそれぞれ付属情報ファイルおよびPSファイルとして別々に記録する。以上の手順にしたがって、MP4ストリームが生成され、DVD−RAMディスク131に記録される。
次に、再び図11および図12を参照しながら、データ処理装置10のMP4ストリーム再生機能を説明する。DVD−RAMディスク131には、上述のデータ構造を有する付属情報13およびMPEG2−PS14を有するMP4ストリーム12が記録されているとする。データ処理装置10は、ユーザの選択によりDVD−RAMディスク131に記録されたMPEG2−PS14を再生および復号化する。再生機能に関連する構成要素として、データ処理装置10は、映像信号出力部110と、MPEG2−PS復号部111と、音声信号出力部112と、再生部121と、ピックアップ130と、再生制御部142とを備えている。
まず、再生部121は、再生制御部142からの指示に基づいてピックアップ130を制御し、DVD−RAMディスク131からMP4ファイルを読み出して付属情報13を取得する。再生部121は、取得した付属情報13を再生制御部142に出力する。また、再生部121は、後述の再生制御部142から出力された制御信号に基づいて、DVD−RAMディスク131からPSファイルを読み出す。制御信号は、読み出すべきPSファイル(“MOV001.MPG”)を指定する信号である。
再生制御部142は、再生部121から付属情報13を受け取り、そのデータ構造を解析することにより、付属情報13に含まれる参照情報15(図17)を取得する。再生制御部142は、参照情報15において指定されたPSファイル(“MOV001.MPG”)を、指定された位置(“./”:ルートディレクトリ)から読み出すことを指示する制御信号を出力する。
MPEG2−PS復号部111は、MPEG2−PS14および付属情報13を受け取り、付属情報13に含まれる属性情報に基づいて、MPEG2−PS14から映像データおよび音声データを復号する。より具体的に説明すると、MPEG2−PS復号部111は、サンプル記述アトム17(図19)のデータフォーマット(“data−format”)、映像ストリームの属性情報(“映像ES属性”)、音声ストリームの属性情報(“音声ES属性”)等を読み出し、それらの情報に指定された符号化形式、映像データの表示サイズ、サンプリング周波数等に基づいて、映像データおよび音声データを復号する。
映像信号出力部110は映像信号出力端子であり、復号化された映像データを映像信号として出力する。音声信号出力部112は音声信号出力端子であり、復号化された音声データを音声信号として出力する。
データ処理装置10がMP4ストリームを再生する処理は、従来のMP4ストリームファイルの再生処理と同様、まず拡張子が“MP4”のファイル(“MOV001.MP4”)の読み出しから開始される。具体的には以下のとおりである。まず再生部121は付属情報ファイル(“MOV001.MP4”)を読み出す。次に、再生制御部142は付属情報13を解析して参照情報(Data Reference Atom)を抽出する。再生制御部142は、抽出された参照情報に基づいて、同じMP4ストリームを構成するPSファイルの読み出しを指示する制御信号を出力する。本明細書では、再生制御部142から出力された制御信号は、PSファイル(“MOV001.MPG”)の読み出しを指示している。
次に、再生部121は、制御信号に基づいて、指定されたPSファイルを読み出す。次に、MPEG2−PS復号部111は、読み出されたデータファイルに含まれるMPEG2−PS14および付属情報13を受け取り、付属情報13を解析して属性情報を抽出する。そしてMPEG2−PS復号部111は、属性情報に含まれるサンプル記述アトム17(図19)に基づいて、MPEG2−PS14のデータフォーマット(“data−format”)、MPEG2−PS14に含まれる映像ストリームの属性情報(“映像ES属性”)、音声ストリームの属性情報(“音声ES属性”)等を特定して、映像データおよび音声データを復号する。以上の処理により、付属情報13に基づいてMPEG2−PS14が再生される。
なお、MPEG2システム規格のストリームを再生可能な従来の再生装置、再生ソフトウェア等であれば、PSファイルのみを再生することによってMPEG2−PS14を再生することができる。このとき、再生装置等はMP4ストリーム12の再生に対応していなくてもよい。MP4ストリーム12は付属情報13およびMPEG2−PS14を別個のファイルによって構成されているので、例えば拡張子に基づいてMPEG2−PS14が格納されているPSファイルを容易に識別し、再生することができる。
図22は、本発明による処理に基づいて生成されたMPEG2−PSと、従来のMPEG2 Video(エレメンタリストリーム)との相違点を示す表である。図において、本発明(1)のカラムがこれまで説明した1VOBUを1サンプルとする例に相当する。従来例では、1映像フレーム(Video frame)を1サンプルとして各サンプルにサンプルテーブルアトム(Sample Table Atom)等の属性情報(アクセス情報)を設けていた。本発明によれば、映像フレームを複数含むVOBUをサンプル単位としてサンプル毎にアクセス情報を設けたので、属性情報の情報量を大幅に低減できる。したがって本発明による1VOBUを1サンプルとすることが好適である。
図22の本発明(2)のカラムは、本発明(1)に示すデータ構造の変形例を示す。本発明(2)と本発明(1)との相違点は、本発明(2)の変形例では1チャンク(chunk)に1VOBUを対応させてチャンク毎にアクセス情報を構成する点である。ここで、「チャンク」とは、複数のサンプルによって構成された単位である。このとき、MPEG2−PS14のパックヘッダを含む映像フレームが、1サンプルに対応する。図23は、1チャンクに1VOBUを対応させたときのMP4ストリーム12のデータ構造を示す。図12の1サンプルを1チャンクに置き換えた点が相違する。なお、従来例では1サンプルに1映像フレームを対応させ、1チャンクに1GOPを対応させている。
図24は、1チャンクに1VOBUを対応させたときのデータ構造を示す図である。図15に示す1サンプルに1VOBUを対応させたときのデータ構造と比較すると、付属情報13の属性情報に含まれるサンプルテーブルアトム19に規定される内容が異なっている。図25は、1チャンクに1VOBUを対応させたときの、サンプルテーブルアトム19に含まれる各アトムの記述内容の具体例を示す。
次に、MP4ストリーム12を構成するPSファイルに関する変形例を説明する。図26は、1つの付属情報ファイル(“MOV001.MP4”)に対して2つのPSファイル(”MOV001.MPG”および”MOV002.MPG”)が存在するMP4ストリーム12の例を示す。2つのPSファイルには、別個の動画シーンを表すMPEG2−PS14のデータが別々に記録されている。各PSファイル内では動画ストリームは連続し、MPEG2システム規格に基づくSCR(System Clock Reference)、PTS(Presentation Time Stamp)およびDTS(Decoding Time Stamp)は連続している。しかし、PSファイル相互間(各PSファイルに含まれるMPEG−PS#1の末尾とMPEG−PS#2の先頭の間)には、SCR、PTSおよびDTSはそれぞれ連続していないとする。2つのPSファイルは別々のトラック(図)として取り扱われる。
付属情報ファイルには、各PSファイルのファイル名および記録位置を特定する参照情報(dref;図17)が記述されている。例えば、参照情報は参照すべき順序に基づいて記述されている。図では、参照#1により特定されたPSファイル”MOV001.MPG”が再生され、その後、参照#2により特定されたPSファイル”MOV002.MPG”が再生される。このように複数のPSファイルが存在していても、付属情報ファイル内に各PSファイルの参照情報を設けることにより、各PSファイルを実質的に接続して再生することができる。
図27は、1つのPSファイル内に不連続のMPEG2−PSが複数存在する例を示す。PSファイルには、別個の動画シーンを表すMPEG2−PS#1および#2のデータが連続的に配列されている。「不連続のMPEG2−PS」とは、2つのMPEG2−PS間(MPEG−PS#1の末尾とMPEG−PS#2の先頭の間)では、SCR、PTSおよびDTSはそれぞれ連続していないことを意味する。すなわち、再生タイミングに連続性がないことを意味する。不連続点は、2つのMPEG2−PSの境界に存在する。なお各MPEG2−PS内では動画ストリームは連続し、MPEG2システム規格に基づくSCR、PTSおよびDTSは連続している。
付属情報ファイルには、PSファイルのファイル名および記録位置を特定する参照情報(dref;図17)が記述されている。付属情報ファイルにはそのPSファイルを指定する参照情報が1つ存在する。しかしPSファイルを順に再生すると、MPEG2−PS#1と#2との不連続点においては再生できなくなる。SCR、PTS、DTS等が不連続になるからである。そこで、この不連続点に関する情報(不連続点の位置情報(アドレス)等)を付属情報ファイルに記述する。具体的には、不連続点の位置情報は、図19における「不連続点開始フラグ」として記録する。例えば、再生時には再生制御部142は不連続点の位置情報を算出して、不連続点の後に存在するMPEG2−PS#2の映像データを先読み等することにより、少なくとも映像データの連続的な再生が途切れないように再生を制御する。
図26を参照しながら、互いに不連続なMPEG2−PSを含む2つのPSファイルに対して、2つの参照情報を設けて再生する手順を説明した。しかし、図28に示すように、2つのPSファイルに対してシームレス接続用のMPEG2−PSを含むPSファイルを新たに挿入し、シームレスに当初の2つのPSファイルを再生することができる。図28は、シームレス接続用のMPEG2−PSを含むPSファイル(“MOV002.MPG”)を設けたMP4ストリーム12を示す。PSファイル(“MOV002.MPG”)は、MPEG2−PS#1とMPEG2−PS#3との不連続点において不足する音声フレームを含む。以下、図29を参照しながらより詳しく説明する。
図29は、不連続点において不足する音声(オーディオ)フレームを示す。図では、MPEG2−PS#1を含むPSファイルを「PS#1」と表記し、MPEG2−PS#3を含むPSファイルを「PS#3」と表記する。
まず、PS#1のデータが処理され、次にPS#3のデータが処理されるとする。上から2段目のDTSビデオフレームおよび3段目のPTSビデオフレームは、それぞれ映像フレームに関するタイムスタンプを示す。これらから明らかなように、PSファイル#1および#3は、映像が途切れることなく再生される。しかし、オーディオフレームに関しては、PS#1の再生が終了した後PS#3が再生されるまでの間、一定区間データが存在しない無音区間が発生する。これでは、シームレス再生を実現できない。
そこで、新たにPS#2を設け、シームレス接続のための音声フレームを含むPSファイルを設けて、付属情報ファイルから参照するようにした。この音声フレームは、無音区間を埋める音声データを含み、例えばPS#1末尾の動画に同期して記録されている音声データがコピーされる。図29に示すように、オーディオフレームの段にはシームレス接続用オーディオフレームがPS#1の次に挿入されている。PS#2の音声フレームは、PS#3の開始前1フレーム以内になるまで設けられる。これに伴って、付属情報13に新たなPS#2を参照する参照情報(図28のdref)を設け、PS#1の次に参照されるように設定する。
なお、図29には「オーディオギャップ」として示される1音声フレーム分以下の無データ区間(無音区間)が存在しているが、PS#2内にあと1音声フレーム相当分のデータを余分に含め、無音区間が発生しないようにしてもよい。この場合には、例えばPS#2とPS#3に同じ音声データサンプルを含む部分、すなわちオーディオフレームがオーバーラップする部分が含まれることになる。しかし、特に問題は生じない。オーバーラップする部分はいずれのデータを再生しても同じ音声が出力されるからである。
以上の処理により、不連続な複数のPSファイルを再生する際には、時間的に連続して復号し再生することができる。
なお、図29では参照情報(dref)を用いてPSファイルを参照するとして説明したが、PS#2ファイルに限っては他のアトム(例えば独自に定義した専用アトム)、または第2のPSトラックからPS#2を参照してもよい。換言すれば、DVDビデオレコーディング規格に準拠するPSファイルのみ、“drer”アトムから参照するようにしてもよい。または、PS#2ファイル内の音声フレームをエレメンタリストリームの独立ファイルとして記録し、付属情報ファイルに設けた独立した音声トラックアトムより参照し、さらに、PS#1の末尾に並列して再生するように付属情報ファイルに記述してもよい。PS#1と音声のエレメンタリストリームの同時再生のタイミングは、付属情報のエディットリストアトム(例えば図15)によって指定可能である。
これまでは、動画ストリームはMPEG2プログラムストリームであるとして説明した。しかし、MPEG2システム規格で規定されたMPEG2−トランスポートストリーム(以下、「MPEG2−TS」)によって動画ストリームを構成することもできる。
図30は、本発明の他の例によるMP4ストリーム12のデータ構造を示す。MP4ストリーム12は、付属情報13を含む付属情報ファイル(”MOV001.MP4”)と、MPEG2−TS14のデータファイル(“MOV001.M2T”)(以下「TSファイル」と称する)とを備えている。
MP4ストリーム12において、TSファイルが付属情報13内の参照情報(dref)によって参照される点は、図12のMP4ストリームと同様である。
MPEG2−TS14にはタイムスタンプが付加されている。より詳しく説明すると、MPEG2−TS14には、送出時に参照される4バイトのタイムスタンプが188バイトのトランスポートパケット(以下「TSパケット」)の前に付加されている。その結果、映像を含むTSパケット(V_TSP)および音声を含むTSパケット(A_TSP)は192バイトで構成されている。なおタイムスタンプはTSパケットの後ろに付加されていてもよい。
図30に示すMP4ストリーム12では、図12におけるVOBUと同様、映像にして約0.4〜1秒に相当する映像データを含むTSパケットを1サンプルとして付属情報13に属性情報を記述することができる。さらに図13と同様、1フレームの音声データのデータサイズ、データアドレスおよび再生タイミング等を付属情報13に記述してもよい。
また、1フレームを1サンプルに対応させ複数のフレームを1チャンクに対応させてもよい。図31は、本発明のさらに他の例によるMP4ストリーム12のデータ構造を示す。このとき、図23と同様、映像にして約0.4〜1秒に相当する映像データを含む複数のTSパケットを1チャンクに対応させ、1チャンク毎にアクセス情報を設定することにより、図12に示す構成のMP4ストリーム12と全く同様の利点が得られる。
なお、上述の図30および31のデータ構造を利用するときの各ファイルの構成およびデータ構造に基づく処理は、図12、13および23に関連して説明した処理と類似する。それらの説明は、図12、13および23における映像パックおよび音声パックに関する説明を、それぞれ図30に示すタイムスタンプを含めた映像用TSパケット(V_TSP)および音声用TSパケット(A_TSP)に置き換えて読めばよい。
次に、図32を参照しながら、これまで説明したデータ処理を適用可能な他のデータフォーマットのファイル構造を説明する。図32は、MTFファイル32のデータ構造を示す。MTF32は、動画の記録および編集結果の格納に用いられるファイルである。MTFファイル32は複数の連続したMPEG2−PS14を含んでおり、また、一方、各MPEG2−PS14は、複数のサンプル(“P2Sample”)を含む。サンプル(“P2Sample”)はひとつの連続したストリームである。例えば、図12に関連して説明したように、サンプル単位で属性情報を設けることができる。これまでの説明では、このサンプル(“P2Sample”)がVOBUに相当する。各サンプルは、各々が一定のデータ量(2048バイト)で構成された複数の映像パックおよび音声パックを含む。また、例えば、2つのMTFをひとつにまとめると、MTFは2つのP2streamから構成される。
MTF32内で前後するMPEG2−PS14が連続したプログラムストリームのときは、連続する範囲において1つの参照情報を設け、1つのMP4ストリームを構成できる。前後するMPEG2−PS14が不連続のプログラムストリームであるときは、図27に示すように不連続点のデータアドレスを属性情報に設けてMP4ストリーム12を構成できる。よってMTF32においても、これまで説明したデータ処理を適用できる。
これまでは、2001年に標準化されたMP4ファイルフォーマットを拡張してMPEG2システムストリームを取り扱う例を説明したが、本発明は、QuickTimeファイルフォーマットおよびISO Base Mediaファイルフォーマットを同様に拡張してもMPEG2システムストリームを取り扱うことができる。MP4ファイルフォーマットおよびISO Base Mediaファイルフォーマットの大部分の仕様はQuickTimeファイルフォーマットをベースとして規定されており、その仕様の内容も同じだからである。図33は、各種のファイルフォーマット規格の相互関係を示す。「本発明」と、「MP4(2001)」と、「QuickTime」とが重複するアトム種別(moov,mdat)では、上述した本発明によるデータ構造を適用することができる。これまでにも説明しているように、アトム種別“moov”は付属情報の最上位階層の“Movie Atom”として図15等において示しているとおりである。
図34は、QuickTimeストリームのデータ構造を示す。QuickTimeストリームもまた、付属情報13を記述したファイル(“MOV001.MOV”)と、MPEG2−PS14を含むPSファイル(“MOV001.MPG“)とによって構成される。図15に示すMP4ストリーム12と比較すると、QuickTimeストリームの付属情報13に規定されている“Movie Atom”の一部が変更される。具体的には、ヌルメディアヘッダアトム(”Null Media Header Atom”)に代えて、ベースメディアヘッダアトム(“Base Media Header Atom”)36が新たに設けられていること、および、図15の3段目に記載されているオブジェクト記述アトム(“Object Descriptor Atom”)が図34の付属情報13では削除されていることである。図35は、QuickTimeストリームの付属情報13における各アトムの内容を示す。追加されたベースメディアヘッダアトム(“Base Media Header Atom”)36は、各サンプル(VOBU)内のデータが、映像フレームおよび音声フレームのいずれでもない場合に、このアトムによりその旨が示される。図35に示す他のアトム構造およびその内容は、上述のMP4ストリーム12を用いて説明した例と同じであるので、それらの説明は省略する。
以上、本発明の実施形態を説明した。図12のMPEG2−PS14は0.4〜1秒分の動画データ(VOBU)から構成されるとしたが、時間の範囲は異なっていてもよい。また、MPEG2−PS14は、DVDビデオレコーディング規格のVOBUから構成されるとしたが、他のMPEG2システム規格に準拠したプログラムストリームや、DVDビデオ規格に準拠したプログラムストリームであってもよい。
図11に示すデータ処理装置10では、記録媒体131をDVD−RAMディスクであるとして説明したが、特にこれに限定されることはない。例えば記録媒体131は、MO、DVD−R、DVD−RW、DVD+RW、CD−R、CD−RW等の光記録媒体やハードディスク等の磁性記録媒体である。また、記録媒体131は、半導体メモリ等の半導体記録媒体であってもよい。
データ処理装置10は、コンピュータプログラムに基づいてデータストリームの生成、記録および再生処理を行う。例えば、データストリームを生成し、記録する処理は、図21に示すフローチャートに基づいて記述されたコンピュータプログラムを実行することによって実現される。コンピュータプログラムは、光ディスクに代表される光記録媒体、SDメモリカード、EEPROMに代表される半導体記録媒体、フレキシブルディスクに代表される磁気記録媒体等の記録媒体に記録することができる。なお、光ディスク装置100は、記録媒体を介してのみならず、インターネット等の電気通信回線を介してもコンピュータプログラムを取得できる。
本発明によれば、付属情報のデータ構造をISO規格に準拠させて現在の最新の規格に適合しつつ、従来のフォーマットと同等のデータストリームのデータ構造およびそのようなデータ構造に基づいて動作するデータ処理装置が提供される。データストリームは従来のフォーマットにも対応するので、既存のアプリケーション等もデータストリームを利用できる。よって既存のソフトウェアおよびハードウェアを有効に活用できる。
本発明は、光ディスク等の記録媒体に動画ストリームのストリームデータを記録するデータ処理装置および方法等に関する。
映像データを低いビットレートで圧縮し符号化する種々のデータストリームが規格化されている。そのようなデータストリームの例として、MPEG2システム規格(ISO/IEC 13818−1)のシステムストリームが知られている。システムストリームは、プログラムストリーム(PS)、トランスポートストリーム(TS)、およびPESストリームの3種類を包含する。
近年、新たにMPEG4システム規格(ISO/IEC 14496−1)のデータストリームを規定する動きが進んでいる。MPEG4システム規格のフォーマットでは、MPEG2映像ストリームまたはMPEG4映像ストリームを含む映像ストリーム、および、各種音声ストリームが多重化され、動画ストリームのデータとして生成される。さらにMPEG4システム規格のフォーマットでは付属情報が規定される。付属情報と動画ストリームとは1つのファイル(MP4ファイル)として規定される。MP4ファイルのデータ構造は、Apple(登録商標)社のクイックタイム(QuickTime)ファイルフォーマットをベースにして、そのフォーマットを拡張して規定されている。なお、MPEG2システム規格のシステムストリームには、付属情報(アクセス情報、特殊再生情報、記録日時等)を記録するデータ構造は規定されていない。MPEG2システム規格では、付属情報はシステムストリーム内に設けられているからである。
映像データおよび音声データは、従来、磁気テープに記録されることが多かった。しかし、近年は磁気テープに代わる記録媒体として、DVD−RAM、MO等に代表される光ディスクが注目を浴びている。
図1は、従来のデータ処理装置350の構成を示す。データ処理装置350は、DVD−RAMディスクにデータストリームを記録し、DVD−RAMディスクに記録されたデータストリームを再生することができる。データ処理装置350は、映像信号入力部300および音声信号入力部302において映像データ信号および音声データ信号を受け取り、それぞれMPEG2圧縮部301に送る。MPEG2圧縮部301は、映像データおよび音声データを、MPEG2規格および/またはMPEG4規格に基づいて圧縮符号化し、MP4ファイルを生成する。より具体的に説明すると、MPEG2圧縮部301は、映像データおよび音声データをMPEG2ビデオ規格に基づいて圧縮符号化して映像ストリームおよび音声ストリームを生成した後で、さらにMPEG4システム規格に基づいてそれらのストリームを多重化してMP4ストリームを生成する。このとき、記録制御部341は記録部320の動作を制御する。連続データ領域検出部340は、記録制御部341の指示によって、論理ブロック管理部343で管理されるセクタの使用状況を調べ、物理的に連続する空き領域を検出する。そして記録部320は、ピックアップ330を介してMP4ファイルをDVD−RAMディスク331に書き込む。
図2は、MP4ファイル20のデータ構造を示す。MP4ファイル20は、付属情報21および動画ストリーム22を有する。付属情報21は、映像データ、音声データ等の属性を規定するアトム構造23に基づいて記述されている。図3は、アトム構造23の具体例を示す。アトム構造23は、映像データおよび音声データの各々について、独立してフレーム単位のデータサイズ、データの格納先アドレス、再生タイミングを示すタイムスタンプ等の情報が記述されている。これは映像データおよび音声データが、それぞれ別個のトラックアトムとして管理されていることを意味する。
図2に示すMP4ファイルの動画ストリーム22には、映像データおよび音声データがそれぞれ1つ以上のフレーム単位で配置され、ストリームを構成している。例えば動画ストリームがMPEG2規格の圧縮符号化方式を利用して得られたとすると、動画ストリームには、複数のGOPが規定されている。GOPは、単独で再生され得る映像フレームであるIピクチャと、次のIピクチャまでのPピクチャおよびBピクチャを含む複数の映像フレームをまとめた単位である。動画ストリーム22の任意の映像フレームを再生するとき、まず動画ストリーム22内のその映像フレームを含むGOPが特定される。
なお、以下では、図2のMP4ファイルのデータ構造に示すように、動画ストリームと付属情報とを有する構造のデータストリームを「MP4ストリーム」と称する。
図4は、動画ストリーム22のデータ構造を示す。動画ストリーム22は、映像トラックと音声トラックとを含み、各トラックには識別子(TrackID)が付されている。トラックは各1つ存在するとは限らず、途中でトラックが切り替わる場合もある。図5は、途中でトラックが切り替わった動画ストリーム22を示す。
図6は、動画ストリーム22とDVD−RAMディスク331の記録単位(セクタ)との対応を示す。記録部320は、動画ストリーム22をDVD−RAMディスクにリアルタイムで記録する。より具体的には、記録部320は、最大記録レート換算で11秒分以上の物理的に連続する論理ブロックを1つの連続データ領域として確保し、この領域へ映像フレームおよび音声フレームを順に記録する。連続データ領域は、各々が32kバイトの複数の論理ブロックから構成され、論理ブロックごとに誤り訂正符号が付与される。論理ブロックはさらに、各々が2kバイトの複数のセクタから構成される。なお、データ処理装置350の連続データ領域検出部340は、1つの連続データ領域の残りが最大記録レート換算で3秒分を切った時点で、次の連続データ領域を再び検出する。そして、1つの連続データ領域が一杯になると、次の連続データ領域に動画ストリームを書き込む。MP4ファイル20の付属情報21も、同様にして確保された連続データ領域に書き込まれる。
図7は、記録されたデータがDVD−RAMのファイルシステムにおいて管理されている状態を示す。例えばUDF(Universal Disk Format)ファイルシステム、またはISO/IEC 13346(Volume and file structure of write-once and rewritable media using non-sequential recording for information interchange)ファイルシステムが利用される。図7では、連続して記録された1つのMP4ファイルがファイル名MOV0001.MP4として記録されている。このファイルは、ファイル名およびファイルエントリの位置が、FID(File Identifier Descriptor)で管理されている。そして、ファイル名はファイル・アイデンティファイア欄にMOV0001.MP4として設定され、ファイルエントリの位置は、ICB欄にファイルエントリの先頭セクタ番号として設定される。
なお、UDF規格はISO/IEC 13346規格の実装規約に相当する。また、DVD−RAMドライブを1394インタフェースおよびSBP−2(Serial Bus Protocol)プロトコルを介してコンピュータ(PC等)へ接続することにより、UDFに準拠した形態で書きこんだファイルをPCからも1つのファイルとして扱うことができる。
ファイルエントリは、アロケーションディスクリプタを使ってデータが格納されている連続データ領域(CDA:Contiguous Data Area)a、b、cおよびデータ領域dを管理する。具体的には、記録制御部341は、MP4ファイルを連続データ領域aへ記録している最中に不良論理ブロックを発見すると、その不良論理ブロックをスキップして連続データ領域bの先頭から書き込みを継続する。次に、記録制御部341がMP4ファイルを連続データ領域bへ記録している最中に、書き込みができないPCファイルの記録領域の存在を検出したときには、連続データ領域cの先頭から書き込みを継続する。そして、記録が終了した時点でデータ領域dに付属情報21を記録する。この結果、ファイルVR_MOVIE.VROは連続データ領域a、b、c、dから構成される。
図7に示すように、アロケーションディスクリプタa、b、c、dが参照するデータの開始位置は、セクタの先頭に一致する。そして、最後尾のアロケーションディスクリプタd以外のアロケーションディスクリプタa、b、cが参照するデータのデータサイズは1セクタの整数倍である。このような記述規則は予め規定されている。
MP4ファイルを再生するとき、データ処理装置350は、ピックアップ330および再生部321を経由して受け取った動画ストリームを取り出し、MPEG2復号部311で復号して映像信号と音声信号を生成し、映像信号出力部310および音声信号出力部312から出力する。DVD-RAMディスクからのデータの読み出しと読み出したデータのMPEG2復号部311への出力は同時に行われる。このとき、データの出力速度よりもデータの読出速度を大きくし、再生すべきデータが不足しないように制御する。したがって、連続してデータを読み出し、出力を続けると、データ読み出し速度とデータ出力速度との差分だけ出力すべきデータを余分に確保できることになる。余分に確保できるデータをピックアップのジャンプによりデータ読み出しが途絶える間の出力データとして使うことにより、連続再生を実現することができる。
具体的には、DVD−RAMディスク331からのデータ読み出し速度が11Mbps、MPEG2復号部311へのデータ出力速度が最大8Mbps、ピックアップの最大移動時間が3秒とすると、ピックアップ移動中にMPEG2復号部311へ出力するデータ量に相当する24Mビットのデータが余分な出力データとして必要になる。このデータ量を確保するためには、8秒間の連続読み出しが必要になる。すなわち、24Mビットをデータ読み出し速度11Mbpsとデータ出力速度8Mbpsの差で除算した時間だけ連続読み出しする必要がある。
したがって、8秒間の連続読み出しの間に88Mビット分、すなわち11秒分の出力データを読み出すことになるので、11秒分以上の連続データ領域を確保することで、連続データ再生を保証することが可能となる。
なお、連続データ領域の途中には、数個の不良論理ブロックが存在していてもよい。ただし、この場合には、再生時にかかる不良論理ブロックを読み込むのに必要な読み出し時間を見越して、連続データ領域を11秒分よりも少し多めに確保する必要がある。
記録されたMP4ファイルを削除する処理を行う際には、記録制御部341は記録部320および再生部321を制御して所定の削除処理を実行する。MP4ファイルは、付属情報部分に全フレームに対する表示タイミング(タイムスタンプ)が含まれる。したがって、例えば動画ストリーム部分の途中を部分的に削除する際には、タイムスタンプに関しては付属情報部分のタイムスタンプのみを削除すればよい。なお、MPEG2システムストリームでは、部分削除位置において連続性を持たせるために動画ストリームを解析する必要がある。タイムスタンプがストリーム中に分散しているからである。
MP4ファイルフォーマットの特徴は、映像・音声ストリームの映像フレームまたは音声フレームを、ひとつの集合として記録する点にある。同時に、国際標準としては初めて、各フレームへのランダムアクセスを可能とするアクセス情報を規定している。アクセス情報はフレーム単位で設けられ、例えばフレームサイズ、フレーム周期、フレームに対するアドレス情報を含む。すなわち、映像フレームに対しては表示時間にして1/30秒ごと、音声フレームに対しては、例えば、AC−3音声の場合であれば合計1536個のサンプルを1単位(すなわち1音声フレーム)とし、単位ごとにアクセス情報が格納される。これにより、例えば、ある映像フレームの表示タイミングを変更したい場合には、アクセス情報の変更のみで対応でき、映像・音声ストリームを必ずしも変更する必要がない。このようなアクセス情報の情報量は1時間当り約1Mバイトである。
アクセス情報の情報量に関連して、例えば「リライタブル/再記録可能なディスクのためのDVD規格パート3 ビデオレコーディング規格 バージョン1.1」,DVDフォーラム発行,VR4,p.31〜35 によれば、DVDビデオレコーディング規格のアクセス情報に必要な情報量は1時間当り70キロバイトである。DVDビデオレコーディング規格のアクセス情報の情報量は、MP4ファイルの付属情報に含まれるアクセス情報の情報量の10分の1以下である。図8はDVDビデオレコーディング規格のアクセス情報として利用されるフィールド名と、フィールド名が表すピクチャ等との対応関係を模式的に示す。図9は、図8に記載されたアクセス情報のデータ構造、データ構造に規定されるフィールド名、その設定内容およびデータサイズを示す。
また、例えば特開2001−94933号公報(第3図)に記載されている光ディスク装置は、映像フレームを1フレーム単位ではなく1GOP単位で記録し、同時に音声フレームを1GOPに相当する時間長で連続的に記録する。そして、GOP単位でアクセス情報を規定する。これによりアクセス情報に必要な情報量を低減している。
MP4ファイルは、MPEG2ビデオ規格に基づいて動画ストリームを記述しているものの、MPEG2システム規格のシステムストリームと互換性がないため、現在PC等で用いられているアプリケーションの動画編集機能を利用して、MP4ファイルを編集することはできない。多くのアプリケーションの編集機能は、MPEG2システム規格の動画ストリームを編集の対象としているからである。また、MP4ファイルの規格には、動画ストリーム部分の再生互換性を確保するためのデコーダモデルの規定も存在しない。これでは、現在極めて広く普及しているMPEG2システム規格に対応したソフトウェアおよびハードウェアを全く活用できない。
本発明の目的は、アクセス情報の情報量が小さく、かつ、従来のフォーマットに対応するアプリケーション等でも利用可能なデータ構造を提供すること、および、そのデータ構造に基づく処理が可能なデータ処理装置等を提供することである。
本発明によるデータ処理装置は、映像データおよび音声データを受け取る受信部と、受け取った前記映像データおよび前記音声データを符号化して、MPEG2システム規格の符号化データを生成する圧縮部と、前記符号化データを参照する参照情報、および、前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位とし、前記サンプル単位の属性を記述した属性情報を含む付属情報を生成する付属情報生成部と、前記符号化データをデータファイルとして記録媒体に記録し、前記付属情報を付属情報ファイルとして前記記録媒体に記録する記録部とを備えている。前記符号化データは、前記付属情報ファイルおよび前記MPEG2システム規格のいずれに基づいても復号化することが可能である。
ある好ましい実施形態において、前記参照情報は、前記記録媒体に記録された前記データファイルのファイル名および格納位置を示している。
ある好ましい実施形態において、前記圧縮部は、複数の符号化データを生成し、前記付属情報生成部は、前記複数の符号化データの各々を参照する前記参照情報を生成する。
ある好ましい実施形態において、前記圧縮部は、複数の符号化データを生成し、前記付属情報生成部は、前記複数の符号化データを連続的に配列して1つのストリームデータを生成し、再生タイミングごとの符号化データのデータサイズが一定でない場合の符号化データの記録位置を特定する位置情報をさらに記述した付属情報を生成する。
ある好ましい実施形態において、前記圧縮部は、MPEG2プログラムストリームおよびMPEG2トランスポートストリームの一方に準拠した符号化データを生成する。
ある好ましい実施形態において、前記付属情報生成部は、前記符号化データのうち、前記音声データに対応する符号化音声データの音声フレームを、さらに他のサンプル単位として前記属性情報に記述する。
ある好ましい実施形態において、前記圧縮部は、第1〜第3のデータファイルを生成し、前記第2のデータファイルは、前記第1のデータファイルの符号化データと前記第3のデータファイルの符号化データとを時間的に連続して復号するために必要なフレームデータを含む。
ある好ましい実施形態において、付属情報生成部は、MP4フォーマットにしたがって記述された付属情報ファイルを生成する。
ある好ましい実施形態において、付属情報生成部は、QuickTimeフォーマットにしたがって記述された付属情報ファイルを生成する。
本発明のストリームデータは、データファイルに含まれる符号化データと、付属情報ファイルに含まれる付属情報とによって構成される。前記符号化データは、映像データおよび音声データがMPEG2システム規格にしたがって符号化され、かつ、前記付属情報および前記MPEG2システム規格のいずれに基づいても復号化することが可能である。前記付属情報は、前記符号化データを参照する参照情報および前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位として前記サンプル単位の属性を記述した属性情報を含む。本発明の記録媒体には、上述のストリームデータが記録されている。
本発明の他のデータ処理装置は、上述のストリームデータから前記付属情報ファイルを読み出し、さらに制御信号に基づいて前記データファイルを読み出す再生部と、前記付属情報ファイルの前記付属情報に規定される前記参照情報に基づいて、前記データファイルの読み出しを指示する信号を前記制御信号として生成する再生制御部と、読み出された前記データファイルの符号化データおよび前記付属情報を受け取り、前記付属情報に含まれる前記属性情報に基づいて、前記符号化データから前記映像データおよび前記音声データを復号する復号部と、復号された前記映像データおよび前記音声データを出力する出力部とを備えている。
本発明のデータ記録方法は、映像データおよび音声データを受け取るステップと、受け取った前記映像データおよび前記音声データを符号化して、MPEG2システム規格の符号化データを生成するステップと、前記符号化データを参照する参照情報、および、前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位とし、前記サンプル単位の属性を記述した属性情報 を含む付属情報を生成するステップと、前記符号化データをデータファイルとして記録媒体に記録し、前記付属情報を付属情報ファイルとして前記記録媒体に記録するステップと、を包含する。前記符号化データは、前記付属情報ファイルおよび前記MPEG2システム規格のいずれに基づいても復号化することが可能である。
本発明のデータ記録プログラムは、データ処理装置において実行可能なコンピュータプログラムである。データ記録プログラムは、映像データおよび音声データを受け取るステップと、受け取った前記映像データおよび前記音声データを符号化して、MPEG2システム規格の符号化データを生成するステップと、前記符号化データを参照する参照情報、および、前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位とし、前記サンプル単位の属性を記述した属性情報 を含む付属情報を生成するステップと、前記符号化データをデータファイルとして記録媒体に記録し、前記付属情報を付属情報ファイルとして前記記録媒体に記録するステップと、を包含する。前記符号化データは、前記付属情報ファイルおよび前記MPEG2システム規格のいずれに基づいても復号化することが可能である。
本発明のデータ再生方法は、上述のストリームデータから前記付属情報ファイルを読み出すステップと、前記付属情報ファイルの前記付属情報に規定される前記参照情報に基づいて、前記データファイルの読み出しを指示する制御信号を生成するステップと、前記制御信号に基づいて前記データファイルを読み出すステップと、読み出された前記データファイルの符号化データおよび前記付属情報を受け取り、前記付属情報に含まれる前記属性情報に基づいて、前記符号化データから前記映像データおよび前記音声データを復号するステップと、復号された前記映像データおよび前記音声データを出力するステップとを包含する。
本発明のデータ再生プログラムは、データ処理装置において実行可能なコンピュータプログラムである。データ再生プログラムは、上述のストリームデータから前記付属情報ファイルを読み出すステップと、前記付属情報ファイルの前記付属情報に規定される前記参照情報に基づいて、前記データファイルの読み出しを指示する制御信号を生成するステップと、前記制御信号に基づいて前記データファイルを読み出すステップと、読み出された前記データファイルの符号化データおよび前記付属情報を受け取り、前記付属情報に含まれる前記属性情報に基づいて、前記符号化データから前記映像データおよび前記音声データを復号するステップと、復号された前記映像データおよび前記音声データを出力するステップとを包含する。
本発明のさらに他のデータ処理装置は、映像データおよび音声データを受け取る受信部と、受け取った前記映像データおよび前記音声データを所定の符号化形式で符号化して、前記映像データに対応するデータと前記音声データに対応するデータとがインターリーブされた符号化データを生成する圧縮部と、付属情報を生成する付属情報生成部であって、前記付属情報は、符号化データを参照する参照情報およびサンプル単位の属性を記述した属性情報を含む付属情報生成部とを備えている。前記サンプルは、前記映像データの再生時間に基づいて構成された前記符号化データの集合であり、前記符号化データは、前記付属情報に基づく復号化、および、前記所定の符号化方式に対応する復号化方式のいずれに基づいても復号化することが可能である。
本発明によれば、付属情報のデータ構造をISO規格に準拠させて現在の最新の規格に適合しつつ、従来のフォーマットと同等のデータストリームのデータ構造およびそのようなデータ構造に基づいて動作するデータ処理装置が提供される。データストリームは従来のフォーマットにも対応するので、既存のアプリケーション等もデータストリームを利用できる。よって既存のソフトウェアおよびハードウェアを有効に活用できる。
以下、添付の図面を参照しながら、本発明の実施形態を説明する。
図10は、本発明によるデータ処理を行うポータブルビデオコーダ10−1、ムービーレコーダ10−2およびPC10−3の接続関係を示す。
ポータブルビデオコーダ10−1は、付属のアンテナを利用して放送番組を受信し、放送番組を動画圧縮してMP4ストリームを生成する。ムービーレコーダ10−2は、映像を録画するとともに、映像に付随する音声を録音し、MP4ストリームを生成する。MP4ストリームでは、映像・音声データは、所定の圧縮符号化方式によって符号化され、本発明によるデータ構造にしたがって記述されている。ポータブルビデオコーダ10−1およびムービーレコーダ10−2は、生成したMP4ストリームをDVD−RAM等の記録媒体131に記録し、またはIEEE1394、USB等のディジタルインターフェースを介して出力する。なお、ポータブルビデオコーダ10−1、ムービーレコーダ10−2等はより小型化が必要とされているため、記録媒体131は直径8cmの光ディスクに限られず、それよりも小径の光ディスク等であってもよい。
PC10−3は、記録媒体または伝送媒体を介してMP4ストリームを受け取る。各機器がディジタルインターフェースを介して接続されていると、PC10−3は、ムービーレコーダ10−2等を外部記憶装置として制御して、各機器からMP4ストリームを受け取ることができる。
PC10−3が本発明によるMP4ストリームの処理に対応したアプリケーションソフトウェア、ハードウェアを有する場合には、PC10−3は、MP4ファイル規格に基づくMP4ストリームとしてMP4ストリームを再生することができる。一方、本発明によるMP4ストリームの処理に対応していない場合には、PC10−3は、MPEG2システム規格に基づいて動画ストリーム部分を再生することができる。なお、PC10−3はMP4ストリームの部分削除等の編集に関する処理を行うこともできる。本明細書においては「再生」という語は編集に関する処理を含む。以下では、図10のポータブルビデオコーダ10−1、ムービーレコーダ10−2およびPC10−3を「データ処理装置」と称して説明する。
図11は、データ処理装置10における機能ブロックの構成を示す。以下では、本明細書では、データ処理装置10は、MP4ストリームの記録機能と再生機能の両方を有するとして説明する。具体的には、データ処理装置10は、MP4ストリームを生成して記録媒体131に書き込むことができ、かつ、記録媒体131に書き込まれたMP4ストリームを再生することができる。記録媒体131は例えばDVD−RAMディスクであり、以下、「DVD−RAMディスク131」と称する。
まず、データ処理装置10のMP4ストリーム記録機能を説明する。この機能に関連する構成要素として、データ処理装置10は、映像信号入力部100と、MPEG2−PS圧縮部101と、音声信号入力部102と、付属情報生成部103と、記録部120と、光ピックアップ130と、記録制御部141とを備えている。
映像信号入力部100は映像信号入力端子であり、映像データを表す映像信号を受け取る。音声信号入力部102は音声信号入力端子であり、音声データを表す音声信号を受け取る。例えば、ポータブルビデオコーダ10−1(図10)の映像信号入力部100および音声信号入力部102は、それぞれチューナ部(図示せず)の映像出力部および音声出力部と接続され、それぞれから映像信号および音声信号を受け取る。また、ムービーレコーダ10−2(図10)の映像信号入力部100および音声信号入力部102は、それぞれカメラのCCD(図示せず)出力およびマイク出力から映像信号および音声信号を受け取る。
MPEG2−PS圧縮部(以下「圧縮部」と称する)101は、映像信号および音声信号を受け取ってMPEG2システム規格のMPEG2プログラムストリーム(以下、「MPEG2−PS」と称する)を生成する。生成されたMPEG2−PSは、MPEG2システム規格に基づいて、ストリームのみに基づいて復号することができる。MPEG2−PSの詳細は後述する。
付属情報生成部103は、MP4ストリームの付属情報を生成する。付属情報は、参照情報および属性情報を含む。参照情報は、圧縮部101により生成されたMPEG2−PSを特定する情報であって、例えばMPEG2−PSが記録される際のファイル名およびDVD−RAMディスク131上の格納位置である。一方、属性情報は、MPEG2−PSのサンプル単位の属性を記述した情報である。「サンプル」とは、MP4ファイル規格の付属情報に規定されるサンプル記述アトム(Sample Description Atom;後述)における最小管理単位であり、サンプルごとのデータサイズ、再生時間等を記録している。1サンプルは、例えばランダムにアクセスすることが可能なデータ単位である。換言すれば、属性情報とはサンプルを再生するために必要な情報である。特に後述のサンプル記述アトム(Sample Description Atom)は、アクセス情報とも称される。
属性情報は、具体的には、データの格納先アドレス、再生タイミングを示すタイムスタンプ、符号化ビットレート、コーデック等の情報である。属性情報は、各サンプル内の映像データおよび音声データの各々に対して設けられ、以下に明示的に説明するフィールドの記述を除いては、従来のMP4ストリーム20の付属情報の内容に準拠している。
後述のように、本発明の1サンプルは、MPEG2−PSの1ビデオオブジェクトユニット(VOBU)である。なお、VOBUはDVDビデオレコーディング規格の同名のビデオオブジェクトユニットを意味する。付属情報の詳細は後述する。
記録部120は、記録制御部141からの指示に基づいてピックアップ130を制御し、DVD-RAMディスク131の特定の位置(アドレス)にデータを記録する。より具体的には、記録部120は、圧縮部101において生成されたMPEG2−PSおよび付属情報生成部103において生成された付属情報を、それぞれ別個のファイルとしてDVD−RAMディスク131上に記録する。
なお、データ処理装置10は、データの記録に際して動作する連続データ領域検出部(以下、「検出部」)140および論理ブロック管理部(以下、「管理部」)143を有している。連続データ領域検出部140は、記録制御部141からの指示に応じて論理ブロック管理部143において管理されるセクタの使用状況を調べ、物理的に連続する空き領域を検出する。記録制御部141は、この空き領域に対して記録部120にデータの記録を指示する。データの具体的な記録方法は、図7を参照しながら説明した記録方法と同様であり特に差異はないので、その詳細な説明は省略する。なお、MPEG2−PSおよび付属情報は、それぞれ別個のファイルとして記録されるので、図7におけるファイル・アイデンティファイア欄には、それぞれのファイル名が記述される。
次に、図12を参照しながらMP4ストリームのデータ構造を説明する。図12は、本発明によるMP4ストリーム12のデータ構造を示す。MP4ストリーム12は、付属情報13を含む付属情報ファイル("MOV001.MP4")と、MPEG2−PS14のデータファイル(”MOV001.MPG”)(以下「PSファイル」と称する)とを備えている。これら2つのファイル内のデータによって、1つのMP4ストリームを構成する。本明細書では、同じMP4ストリームに属することを明確にするため、付属情報ファイルおよびPSファイルに同じ名(”MOV001“)を付し、拡張子を異ならせている。具体的には、付属情報ファイルの拡張子は従来のMP4ファイルの拡張子と同じ“MP4”を採用し、PSファイルの拡張子は従来のプログラムストリームの一般的な拡張子“MPG”を採用する。
付属情報13は、MPEG2−PS14を参照するための参照情報("dref")を有する。さらに、付属情報13はMPEG2−PS14のビデオオブジェクトユニット(VOBU)ごとの属性を記述した属性情報を含む。属性情報はVOBUごとの属性を記述しているので、データ処理装置10はVOBU単位でMPEG2−PS14に含まれるVOBUの任意の位置を特定して再生・編集等をすることができる。
MPEG2−PS14は、映像パック、音声パック等がインターリーブされて構成されたMPEG2システム規格に基づく動画ストリームである。映像パックは、パックヘッダと符号化された映像データとを含む。音声パックは、パックヘッダと符号化された音声データとを含む。MPEG2−PS14では、映像の再生時間に換算して0.4〜1秒に相当する動画データを単位とするビデオオブジェクトユニット(VOBU)によりデータが管理されている。動画データは、複数の映像パックおよび音声パックを含む。データ処理装置10は、付属情報13において記述されている情報に基づいて、任意のVOBUの位置を特定しそのVOBUを再生することができる。なお、VOBUは1以上のGOPを含む。
本発明によるMP4ストリーム12の特徴の一つは、MPEG2−PS14は、MPEG4システム規格で規定されるMP4ストリームのデータ構造に従った属性情報13に基づいて復号化することが可能であるとともに、MPEG2システム規格に基づいても復号化することが可能な点にある。付属情報ファイルおよびPSファイルが別々に記録されているため、データ処理装置10がそれぞれを独立して解析、処理等することが可能だからである。例えば、本発明のデータ処理を実施可能なMP4ストリーム再生装置等は、属性情報13に基づいてMP4ストリーム12の再生時間等を調整し、MPEG2−PS14の符号化方式を特定して、対応する復号化方式によって復号化できる。また、MPEG2−PSを復号化することができる従来の装置等においては、はMPEG2システム規格にしたがって復号化できる。これにより、現在広く普及しているMPEG2システム規格にのみ対応したソフトウェアおよびハードウェアであっても、MP4ストリームに含まれる動画ストリームを再生することができる。
なお、VOBU単位のサンプル記述アトム(Sample Description Atom)を設けると同時に、図13に示すように、MPEG2−PS14の音声データの所定時間のフレーム分を管理単位としたサンプル記述アトム(Sample Description Atom)を設けてもよい。所定時間とは、例えば0.1秒である。図中「V」は図12の映像パックを示し、「A」は音声パックを示す。0.1秒分の音声フレームは1個以上の複数のパックから構成される。1音声フレームは、例えばAC−3の場合、サンプリング周波数を48kHzとしたとき、サンプリング個数にして1536サンプルの音声データを含む。このとき、サンプル記述アトムは、トラックアトム内のユーザデータアトム内に設けるか、または独立したトラックのサンプル記述アトムとして設けてもよい。また、他の実施例としては、付属情報13は、VOBUに同期する0.4〜1秒分の音声フレームを単位として、その単位毎の合計データサイズ、先頭パックのデータアドレス、および出力タイミングを示すタイムスタンプ等の属性を保持してもよい。
次に、MPEG2−PS14のビデオオブジェクトユニット(VOBU)のデータ構造を説明する。図14は、プログラムストリームとエレメンタリストリームとの関係を示す。MPEG2−PS14のVOBUは、複数の映像パック(V_PCK)および音声パック(A_PCK)を含む。なお、より厳密には、VOBUはシーケンスヘッダ(図中のSEQヘッダ)から、次のシーケンスヘッダの直前のパックまでによって構成される。すなわち、シーケンスヘッダはVOBUの先頭に配置される。一方、エレメンタリストリーム(Video)は、N個のGOPを含む。GOPは、各種のヘッダ(シーケンス(SEQ)ヘッダおよびGOPヘッダ)および映像データ(Iピクチャ、Pピクチャ、Bピクチャ)を含む。エレメンタリストリーム(Audio)は、複数の音声フレームを含む。
MPEG2−PS14のVOBUに含まれる映像パックおよび音声パックは、それぞれエレメンタリストリーム(Video)/(Audio)の各データを用いて構成されており、それぞれのデータ量が2キロバイトになるように構成されている。なお、上述のように各パックにはパックヘッダが設けられる。
なお、字幕データ等の副映像データに関するエレメンタリストリーム(図示せず)が存在するときは、MPEG2−PS14のVOBUはさらにその副映像データのパックも含む。
次に、図15および図16を参照しながら、MP4ストリーム12における付属情報13のデータ構造を説明する。図15は、付属情報13のデータ構造を示す。このデータ構造は「アトム構造」とも呼ばれ、階層化されている。例えば、“Movie Atom”は、“Movie Header Atom”、“Object Descriptor Atom”および“Track Atom”を含む。さらに“Track Atom”は、“Track Header Atom”、“Edit List Atom”、“Media Atom”および“User Data Atom”を含む。図示された他のAtomも同様である。
本発明では、特にデータ参照アトム(“Data Reference Atom";dref)15およびサンプルテーブルアトム(“Sample Table Atom”;stbl)16を利用して、サンプル単位の属性を記述する。上述のように、1サンプルはMPEG2−PSの1ビデオオブジェクトユニット(VOBU)に対応する。サンプルテーブルアトム16は、図示される6つの下位アトムを含む。
図16は、アトム構造を構成する各アトムの内容を示す。データ参照アトム(“Data Reference Atom")は、動画ストリーム(MPEG2−PS)14のファイルを特定する情報をURL形式で格納する。一方、サンプルテーブルアトム(“Sample Table Atom”)は、下位のアトムによってVOBU毎の属性を記述する。例えば、“Decoding Time to Sample Atom”においてVOBU毎の再生時間を格納し、“Sample Size Atom”においてVOBU毎のデータサイズを格納する。また“Sample Description Atom”は、MP4ストリーム12を構成するPSファイルのデータがMPEG2−PS14であることを示すとともに、MPEG2−PS14の詳細な仕様を示す。以下では、データ参照アトム(“Data Reference Atom)によって記述される情報を「参照情報」と称し、サンプルテーブルアトム(“Sample Table Atom”)において記述される情報を「属性情報」と称する。
図17は、データ参照アトム15の記述形式の具体例を示す。ファイルを特定する情報は、データ参照アトム15を記述するフィールドの一部(ここでは“DataEntryUrlAtom”)において記述される。ここでは、URL形式により、MPEG2−PS14のファイル名およびファイルの格納位置が記述されている。データ参照アトム15を参照することにより、その付属情報13とともにMP4ストリーム12を構成するMPEG2−PS14を特定できる。なお、MPEG2−PS14がDVD−RAMディスク131に記録される前であっても、図11の付属情報生成部103は、MPEG2−PS14のファイル名およびファイルの格納位置を特定することができる。ファイル名は予め決定でき、かつ、ファイルの格納位置もファイルシステムの階層構造の表記によって論理的に特定できるからである。
図18は、サンプルテーブルアトム16に含まれる各アトムの記述内容の具体例を示す。各アトムは、フィールド名、繰り返しの可否およびデータサイズを規定する。例えば、サンプルサイズアトム(Sample Size Atom”)は、3つのフィールド(“sample-size”、“sample count”および“entry-size”)を有する。このうち、サンプルサイズ(“sample-size”)フィールドには、VOBUのデフォルトのデータサイズが格納され、エントリサイズ(“entry-size”)フィールドには、VOBUのデフォルト値とは異なる個別のデータサイズが格納される。なお、図中の「設定値」欄のパラメータ(“VOBU_ENT”等)にはDVDビデオレコーディング規格の同名のアクセスデータと同じ値が設定される。
図18に示すサンプル記述アトム(“Sample Description Atom”)17は、サンプル単位の属性情報を記述する。以下、サンプル記述アトム17に記述される情報の内容を説明する。
図19は、サンプル記述アトム17の記述形式の具体例を示す。サンプル記述アトム17は、そのデータサイズ、各VOBUを1サンプルとするサンプル単位の属性情報等を記述する。属性情報は、サンプル記述アトム17の“sample_description_entry”18に記述される。
図20は、“sample_description_entry”18の各フィールドの内容を示す。エントリ18は、対応するMPEG2−PS14の符号化形式を指定するデータフォーマット(“data-format”)を含む。図中の“p2sm”は、MPEG2−PS14がMPEG2 Videoを含むMPEG2プログラムストリームであることを示す。
エントリ18は、そのサンプルの表示開始時刻(“開始Presentation Time”)および表示終了時刻(“終了Presentation Time”)を含む。これらは、最初および最後の映像フレームのタイミング情報を格納する。また、エントリ18は、そのサンプル内の映像ストリームの属性情報(“映像ES属性”)および音声ストリームの属性情報(“音声ES属性”)を含む。図19に示すように、映像データの属性情報は、映像のCODEC種別(例えば、MPEG2ビデオ)、映像データの幅(“Width”)、高さ(“height”)等を特定する。同様に、音声データの属性情報は、音声のCODEC種別(例えば、AC−3)、音声データのチャネル数(“channel count”)、音声サンプルのサイズ(“samplesize”)、サンプリングレート(“samplerate”)等を特定する。
さらにエントリ18は、不連続点開始フラグおよびシームレス情報を含む。これらの情報は、後述のように、1つのMP4ストリーム12内に複数のPSストリームが存在するときに記述される。例えば、不連続点開始フラグの値が“0”のときは、前の動画ストリームと現在の動画ストリームとが完全に連続したプログラムストリームであることを示し、値が“1”のときは、それらの動画ストリームは不連続のプログラムストリームであることを示す。そして不連続の場合には、動画や音声等の不連続点においても途切れ無く動画、音声等を再生するためのシームレス情報の記述が可能である。シームレス情報は、再生時に音声不連続情報およびSCR不連続情報を含む。音声不連続情報の無音声区間(すなわち図31のオーディオギャップ)の有無、開始タイミングおよび時間長を含む。SCR不連続情報には不連続点の直前と直後のパックのSCR値を含む。
不連続点開始フラグを設けることにより、Sample Description Entry の切り替えと動画ストリームの連続性の切り替え箇所を独立して指定できる。図36に示すように、例えば、記録画素数が途中で変化する際にはSample Description を変化させるが、このとき、動画ストリーム自体が連続しているのであれば不連続点開始フラグを0に設定してもよい。不連続点開始フラグが0であることにより、情報ストリームを直接編集する場合に、PC等は、2つの動画ストリームの接続点を再編集しなくてもシームレスな再生が可能であることを把握することができる。なお、図36では水平画素数が変化した場合を例にしているが、その他の属性情報が変化した場合であってもよい。例えば、アスペクト情報に関して4:3のアスペクト比が16:9に変化した場合や、音声のビットレートが変化した場合等である。
以上、図12に示すMP4ストリーム12の付属情報13およびMPEG2−PS14のデータ構造を説明した。上述のデータ構造においては、MPEG2−PS14の部分削除を行う際には、付属情報13内のタイムスタンプ等の属性情報を変更するだけでよく、MPEG2−PS14に設けられているタイムスタンプを変更する必要がない。よって従来のMP4ストリームの利点を活かした編集処理が可能である。さらに、上述のデータ構造によれば、MPEG2システム規格のストリームに対応したアプリケーションやハードウェアを用いてPC上で動画編集するときは、PSファイルのみをPCにインポートすればよい。PSファイルのMPEG2−PS14は、MPEG2システム規格の動画ストリームだからである。このようなアプリケーションやハードウェアは広く普及しているので、既存のソフトウェアおよびハードウェアを有効に活用できる。同時に、付属情報をISO規格に準拠したデータ構造で記録できる。
次に、図11および図21を参照しながら、データ処理装置10がMP4ストリームを生成し、DVD−RAMディスク131上に記録する処理を説明する。図21は、MP4ストリームの生成処理の手順を示すフローチャートである。まずステップ210において、データ処理装置10は、映像信号入力部100を介して映像データを受け取り、音声信号入力部102を介して音声データを受け取る。そしてステップ211において、圧縮部101は受け取った映像データおよび音声データをMPEG2システム規格に基づいて符号化する。続いて圧縮部101は、ステップ212において映像および音声の符号化ストリームを利用して、MPEG2−PSを構成する(図14)。
ステップ213において、記録部120は、MPEG2−PSをDVD−RAMディスク131に記録する際のファイル名および記録位置を決定する。ステップ214において、付属情報生成部103は、PSファイルのファイル名および記録位置を取得して参照情報(Data Reference Atom;図17)として記述すべき内容を特定する。図17に示すように、本明細書では、ファイル名と記録位置とを同時に指定できる記述方式を採用した。
次に、ステップ215において、付属情報生成部103はMPEG2−PS14に規定されるVOBU毎に、再生時間、データサイズ等を表すデータを取得して属性情報(Sample Table Atom;図18〜20)として記述すべき内容を特定する。属性情報をVOBU単位で設けることにより、任意のVOBUの読み出しおよび復号化が可能になる。これは、1VOBUを1サンプルとして取り扱うことを意味する。
次に、ステップ216において、付属情報生成部103は参照情報(Data Reference Atom)および属性情報(Sample Table Atom)等に基づいて、付属情報を生成する。
ステップ217において、記録部120は、付属情報13およびMPEG2−PS14をMP4ストリーム12として出力し、DVD−RAMディスク131上にそれぞれ付属情報ファイルおよびPSファイルとして別々に記録する。以上の手順にしたがって、MP4ストリームが生成され、DVD−RAMディスク131に記録される。
次に、再び図11および図12を参照しながら、データ処理装置10のMP4ストリーム再生機能を説明する。DVD−RAMディスク131には、上述のデータ構造を有する付属情報13およびMPEG2−PS14を有するMP4ストリーム12が記録されているとする。データ処理装置10は、ユーザの選択によりDVD−RAMディスク131に記録されたMPEG2−PS14を再生および復号化する。再生機能に関連する構成要素として、データ処理装置10は、映像信号出力部110と、MPEG2−PS復号部111と、音声信号出力部112と、再生部121と、ピックアップ130と、再生制御部142とを備えている。
まず、再生部121は、再生制御部142からの指示に基づいてピックアップ130を制御し、DVD-RAMディスク131からMP4ファイルを読み出して付属情報13を取得する。再生部121は、取得した付属情報13を再生制御部142に出力する。また、再生部121は、後述の再生制御部142から出力された制御信号に基づいて、DVD−RAMディスク131からPSファイルを読み出す。制御信号は、読み出すべきPSファイル(“MOV001.MPG”)を指定する信号である。
再生制御部142は、再生部121から付属情報13を受け取り、そのデータ構造を解析することにより、付属情報13に含まれる参照情報15(図17)を取得する。再生制御部142は、参照情報15において指定されたPSファイル(“MOV001.MPG”)を、指定された位置(“./”:ルートディレクトリ)から読み出すことを指示する制御信号を出力する。
MPEG2−PS復号部111は、MPEG2−PS14および付属情報13を受け取り、付属情報13に含まれる属性情報に基づいて、MPEG2−PS14から映像データおよび音声データを復号する。より具体的に説明すると、MPEG2−PS復号部111は、サンプル記述アトム17(図19)のデータフォーマット(“data-format”)、映像ストリームの属性情報(“映像ES属性”)、音声ストリームの属性情報(“音声ES属性”)等を読み出し、それらの情報に指定された符号化形式、映像データの表示サイズ、サンプリング周波数等に基づいて、映像データおよび音声データを復号する。
映像信号出力部110は映像信号出力端子であり、復号化された映像データを映像信号として出力する。音声信号出力部112は音声信号出力端子であり、復号化された音声データを音声信号として出力する。
データ処理装置10がMP4ストリームを再生する処理は、従来のMP4ストリームファイルの再生処理と同様、まず拡張子が“MP4”のファイル(“MOV001.MP4”)の読み出しから開始される。具体的には以下のとおりである。まず再生部121は付属情報ファイル(“MOV001.MP4”)を読み出す。次に、再生制御部142は付属情報13を解析して参照情報(Data Reference Atom)を抽出する。再生制御部142は、抽出された参照情報に基づいて、同じMP4ストリームを構成するPSファイルの読み出しを指示する制御信号を出力する。本明細書では、再生制御部142から出力された制御信号は、PSファイル(“MOV001.MPG”)の読み出しを指示している。
次に、再生部121は、制御信号に基づいて、指定されたPSファイルを読み出す。次に、MPEG2−PS復号部111は、読み出されたデータファイルに含まれるMPEG2−PS14および付属情報13を受け取り、付属情報13を解析して属性情報を抽出する。そしてMPEG2−PS復号部111は、属性情報に含まれるサンプル記述アトム17(図19)に基づいて、MPEG2−PS14のデータフォーマット(“data-format”)、MPEG2−PS14に含まれる映像ストリームの属性情報(“映像ES属性”)、音声ストリームの属性情報(“音声ES属性”)等を特定して、映像データおよび音声データを復号する。以上の処理により、付属情報13に基づいてMPEG2−PS14が再生される。
なお、MPEG2システム規格のストリームを再生可能な従来の再生装置、再生ソフトウェア等であれば、PSファイルのみを再生することによってMPEG2−PS14を再生することができる。このとき、再生装置等はMP4ストリーム12の再生に対応していなくてもよい。MP4ストリーム12は付属情報13およびMPEG2−PS14を別個のファイルによって構成されているので、例えば拡張子に基づいてMPEG2−PS14が格納されているPSファイルを容易に識別し、再生することができる。
図22は、本発明による処理に基づいて生成されたMPEG2−PSと、従来のMPEG2 Video(エレメンタリストリーム)との相違点を示す表である。図において、本発明(1)のカラムがこれまで説明した1VOBUを1サンプルとする例に相当する。従来例では、1映像フレーム(Video frame)を1サンプルとして各サンプルにサンプルテーブルアトム(Sample Table Atom)等の属性情報(アクセス情報)を設けていた。本発明によれば、映像フレームを複数含むVOBUをサンプル単位としてサンプル毎にアクセス情報を設けたので、属性情報の情報量を大幅に低減できる。したがって本発明による1VOBUを1サンプルとすることが好適である。
図22の本発明(2)のカラムは、本発明(1)に示すデータ構造の変形例を示す。本発明(2)と本発明(1)との相違点は、本発明(2)の変形例では1チャンク(chunk)に1VOBUを対応させてチャンク毎にアクセス情報を構成する点である。ここで、「チャンク」とは、複数のサンプルによって構成された単位である。このとき、MPEG2−PS14のパックヘッダを含む映像フレームが、1サンプルに対応する。図23は、1チャンクに1VOBUを対応させたときのMP4ストリーム12のデータ構造を示す。図12の1サンプルを1チャンクに置き換えた点が相違する。なお、従来例では1サンプルに1映像フレームを対応させ、1チャンクに1GOPを対応させている。
図24は、1チャンクに1VOBUを対応させたときのデータ構造を示す図である。図15に示す1サンプルに1VOBUを対応させたときのデータ構造と比較すると、付属情報13の属性情報に含まれるサンプルテーブルアトム19に規定される内容が異なっている。図25は、1チャンクに1VOBUを対応させたときの、サンプルテーブルアトム19に含まれる各アトムの記述内容の具体例を示す。
次に、MP4ストリーム12を構成するPSファイルに関する変形例を説明する。図26は、1つの付属情報ファイル(“MOV001.MP4”)に対して2つのPSファイル(”MOV001.MPG”および”MOV002.MPG”)が存在するMP4ストリーム12の例を示す。2つのPSファイルには、別個の動画シーンを表すMPEG2−PS14のデータが別々に記録されている。各PSファイル内では動画ストリームは連続し、MPEG2システム規格に基づくSCR(System Clock Reference)、PTS(Presentation Time Stamp)およびDTS(Decoding Time Stamp)は連続している。しかし、PSファイル相互間(各PSファイルに含まれるMPEG−PS#1の末尾とMPEG−PS#2の先頭の間)には、SCR、PTSおよびDTSはそれぞれ連続していないとする。2つのPSファイルは別々のトラック(図)として取り扱われる。
付属情報ファイルには、各PSファイルのファイル名および記録位置を特定する参照情報(dref;図17)が記述されている。例えば、参照情報は参照すべき順序に基づいて記述されている。図では、参照#1により特定されたPSファイル”MOV001.MPG”が再生され、その後、参照#2により特定されたPSファイル”MOV002.MPG”が再生される。このように複数のPSファイルが存在していても、付属情報ファイル内に各PSファイルの参照情報を設けることにより、各PSファイルを実質的に接続して再生することができる。
図27は、1つのPSファイル内に不連続のMPEG2−PSが複数存在する例を示す。PSファイルには、別個の動画シーンを表すMPEG2−PS#1および#2のデータが連続的に配列されている。「不連続のMPEG2−PS」とは、2つのMPEG2−PS間(MPEG−PS#1の末尾とMPEG−PS#2の先頭の間)では、SCR、PTSおよびDTSはそれぞれ連続していないことを意味する。すなわち、再生タイミングに連続性がないことを意味する。不連続点は、2つのMPEG2−PSの境界に存在する。なお各MPEG2−PS内では動画ストリームは連続し、MPEG2システム規格に基づくSCR、PTSおよびDTSは連続している。
付属情報ファイルには、PSファイルのファイル名および記録位置を特定する参照情報(dref;図17)が記述されている。付属情報ファイルにはそのPSファイルを指定する参照情報が1つ存在する。しかしPSファイルを順に再生すると、MPEG2−PS#1と#2との不連続点においては再生できなくなる。SCR、PTS、DTS等が不連続になるからである。そこで、この不連続点に関する情報(不連続点の位置情報(アドレス)等)を付属情報ファイルに記述する。具体的には、不連続点の位置情報は、図19における「不連続点開始フラグ」として記録する。例えば、再生時には再生制御部142は不連続点の位置情報を算出して、不連続点の後に存在するMPEG2−PS#2の映像データを先読み等することにより、少なくとも映像データの連続的な再生が途切れないように再生を制御する。
図26を参照しながら、互いに不連続なMPEG2−PSを含む2つのPSファイルに対して、2つの参照情報を設けて再生する手順を説明した。しかし、図28に示すように、2つのPSファイルに対してシームレス接続用のMPEG2−PSを含むPSファイルを新たに挿入し、シームレスに当初の2つのPSファイルを再生することができる。図28は、シームレス接続用のMPEG2−PSを含むPSファイル(“MOV002.MPG”)を設けたMP4ストリーム12を示す。PSファイル(“MOV002.MPG”)は、MPEG2−PS#1とMPEG2−PS#3との不連続点において不足する音声フレームを含む。以下、図29を参照しながらより詳しく説明する。
図29は、不連続点において不足する音声(オーディオ)フレームを示す。図では、MPEG2−PS#1を含むPSファイルを「PS#1」と表記し、MPEG2−PS#3を含むPSファイルを「PS#3」と表記する。
まず、PS#1のデータが処理され、次にPS#3のデータが処理されるとする。上から2段目のDTSビデオフレームおよび3段目のPTSビデオフレームは、それぞれ映像フレームに関するタイムスタンプを示す。これらから明らかなように、PSファイル#1および#3は、映像が途切れることなく再生される。しかし、オーディオフレームに関しては、PS#1の再生が終了した後PS#3が再生されるまでの間、一定区間データが存在しない無音区間が発生する。これでは、シームレス再生を実現できない。
そこで、新たにPS#2を設け、シームレス接続のための音声フレームを含むPSファイルを設けて、付属情報ファイルから参照するようにした。この音声フレームは、無音区間を埋める音声データを含み、例えばPS#1末尾の動画に同期して記録されている音声データがコピーされる。図29に示すように、オーディオフレームの段にはシームレス接続用オーディオフレームがPS#1の次に挿入されている。PS#2の音声フレームは、PS#3の開始前1フレーム以内になるまで設けられる。これに伴って、付属情報13に新たなPS#2を参照する参照情報(図28のdref)を設け、PS#1の次に参照されるように設定する。
なお、図29には「オーディオギャップ」として示される1音声フレーム分以下の無データ区間(無音区間)が存在しているが、PS#2内にあと1音声フレーム相当分のデータを余分に含め、無音区間が発生しないようにしてもよい。この場合には、例えばPS#2とPS#3に同じ音声データサンプルを含む部分、すなわちオーディオフレームがオーバーラップする部分が含まれることになる。しかし、特に問題は生じない。オーバーラップする部分はいずれのデータを再生しても同じ音声が出力されるからである。
以上の処理により、不連続な複数のPSファイルを再生する際には、時間的に連続して復号し再生することができる。
なお、図29では参照情報(dref)を用いてPSファイルを参照するとして説明したが、PS#2ファイルに限っては他のアトム(例えば独自に定義した専用アトム)、または第2のPSトラックからPS#2を参照してもよい。換言すれば、DVDビデオレコーディング規格に準拠するPSファイルのみ、“dref”アトムから参照するようにしてもよい。または、PS#2ファイル内の音声フレームをエレメンタリストリームの独立ファイルとして記録し、付属情報ファイルに設けた独立した音声トラックアトムより参照し、さらに、PS#1の末尾に並列して再生するように付属情報ファイルに記述してもよい。PS#1と音声のエレメンタリストリームの同時再生のタイミングは、付属情報のエディットリストアトム(例えば図15)によって指定可能である。
これまでは、動画ストリームはMPEG2プログラムストリームであるとして説明した。しかし、MPEG2システム規格で規定されたMPEG2−トランスポートストリーム(以下、「MPEG2−TS」)によって動画ストリームを構成することもできる。
図30は、本発明の他の例によるMP4ストリーム12のデータ構造を示す。MP4ストリーム12は、付属情報13を含む付属情報ファイル("MOV001.MP4")と、MPEG2−TS14のデータファイル(“MOV001.M2T”)(以下「TSファイル」と称する)とを備えている。
MP4ストリーム12において、TSファイルが付属情報13内の参照情報(dref)によって参照される点は、図12のMP4ストリームと同様である。
MPEG2−TS14にはタイムスタンプが付加されている。より詳しく説明すると、MPEG2−TS14には、送出時に参照される4バイトのタイムスタンプが188バイトのトランスポートパケット(以下「TSパケット」)の前に付加されている。その結果、映像を含むTSパケット(V_TSP)および音声を含むTSパケット(A_TSP)は192バイトで構成されている。なおタイムスタンプはTSパケットの後ろに付加されていてもよい。
図30に示すMP4ストリーム12では、図12におけるVOBUと同様、映像にして約0.4〜1秒に相当する映像データを含むTSパケットを1サンプルとして付属情報13に属性情報を記述することができる。さらに図13と同様、1フレームの音声データのデータサイズ、データアドレスおよび再生タイミング等を付属情報13に記述してもよい。
また、1フレームを1サンプルに対応させ複数のフレームを1チャンクに対応させてもよい。図31は、本発明のさらに他の例によるMP4ストリーム12のデータ構造を示す。このとき、図23と同様、映像にして約0.4〜1秒に相当する映像データを含む複数のTSパケットを1チャンクに対応させ、1チャンク毎にアクセス情報を設定することにより、図12に示す構成のMP4ストリーム12と全く同様の利点が得られる。
なお、上述の図30および31のデータ構造を利用するときの各ファイルの構成およびデータ構造に基づく処理は、図12、13および23に関連して説明した処理と類似する。それらの説明は、図12、13および23における映像パックおよび音声パックに関する説明を、それぞれ図30に示すタイムスタンプを含めた映像用TSパケット(V_TSP)および音声用TSパケット(A_TSP)に置き換えて読めばよい。
次に、図32を参照しながら、これまで説明したデータ処理を適用可能な他のデータフォーマットのファイル構造を説明する。図32は、MTFファイル32のデータ構造を示す。MTF32は、動画の記録および編集結果の格納に用いられるファイルである。MTFファイル32は複数の連続したMPEG2−PS14を含んでおり、また、一方、各MPEG2−PS14は、複数のサンプル(“P2Sample”)を含む。サンプル(“P2Sample”)はひとつの連続したストリームである。例えば、図12に関連して説明したように、サンプル単位で属性情報を設けることができる。これまでの説明では、このサンプル(“P2Sample”)がVOBUに相当する。各サンプルは、各々が一定のデータ量(2048バイト)で構成された複数の映像パックおよび音声パックを含む。また、例えば、2つのMTFをひとつにまとめると、MTFは2つのP2streamから構成される。
MTF32内で前後するMPEG2−PS14が連続したプログラムストリームのときは、連続する範囲において1つの参照情報を設け、1つのMP4ストリームを構成できる。前後するMPEG2−PS14が不連続のプログラムストリームであるときは、図27に示すように不連続点のデータアドレスを属性情報に設けてMP4ストリーム12を構成できる。よってMTF32においても、これまで説明したデータ処理を適用できる。
これまでは、2001年に標準化されたMP4ファイルフォーマットを拡張してMPEG2システムストリームを取り扱う例を説明したが、本発明は、QuickTimeファイルフォーマットおよびISO Base Mediaファイルフォーマットを同様に拡張してもMPEG2システムストリームを取り扱うことができる。MP4ファイルフォーマットおよびISO Base Mediaファイルフォーマットの大部分の仕様はQuickTimeファイルフォーマットをベースとして規定されており、その仕様の内容も同じだからである。図33は、各種のファイルフォーマット規格の相互関係を示す。「本発明」と、「MP4(2001)」と、「QuickTime」とが重複するアトム種別(moov, mdat)では、上述した本発明によるデータ構造を適用することができる。これまでにも説明しているように、アトム種別“moov”は付属情報の最上位階層の“Movie Atom”として図15等において示しているとおりである。
図34は、QuickTimeストリームのデータ構造を示す。QuickTimeストリームもまた、付属情報13を記述したファイル(“MOV001.MOV”)と、MPEG2−PS14を含むPSファイル(“MOV001.MPG“)とによって構成される。図15に示すMP4ストリーム12と比較すると、QuickTimeストリームの付属情報13に規定されている“Movie Atom”の一部が変更される。具体的には、ヌルメディアヘッダアトム("Null Media Header Atom")に代えて、ベースメディアヘッダアトム(“Base Media Header Atom”)36が新たに設けられていること、および、図15の3段目に記載されているオブジェクト記述アトム(“Object Descriptor Atom”)が図34の付属情報13では削除されていることである。図35は、QuickTimeストリームの付属情報13における各アトムの内容を示す。追加されたベースメディアヘッダアトム(“Base Media Header Atom”)36は、各サンプル(VOBU)内のデータが、映像フレームおよび音声フレームのいずれでもない場合に、このアトムによりその旨が示される。図35に示す他のアトム構造およびその内容は、上述のMP4ストリーム12を用いて説明した例と同じであるので、それらの説明は省略する。
以上、本発明の実施形態を説明した。図12のMPEG2−PS14は0.4〜1秒分の動画データ(VOBU)から構成されるとしたが、時間の範囲は異なっていてもよい。また、MPEG2−PS14は、DVDビデオレコーディング規格のVOBUから構成されるとしたが、他のMPEG2システム規格に準拠したプログラムストリームや、DVDビデオ規格に準拠したプログラムストリームであってもよい。
図11に示すデータ処理装置10では、記録媒体131をDVD−RAMディスクであるとして説明したが、特にこれに限定されることはない。例えば記録媒体131は、MO、DVD−R、DVD−RW、DVD+RW、CD−R、CD−RW等の光記録媒体やハードディスク等の磁性記録媒体である。また、記録媒体131は、半導体メモリ等の半導体記録媒体であってもよい。
データ処理装置10は、コンピュータプログラムに基づいてデータストリームの生成、記録および再生処理を行う。例えば、データストリームを生成し、記録する処理は、図21に示すフローチャートに基づいて記述されたコンピュータプログラムを実行することによって実現される。コンピュータプログラムは、光ディスクに代表される光記録媒体、SDメモリカード、EEPROMに代表される半導体記録媒体、フレキシブルディスクに代表される磁気記録媒体等の記録媒体に記録することができる。なお、光ディスク装置100は、記録媒体を介してのみならず、インターネット等の電気通信回線を介してもコンピュータプログラムを取得できる。
本発明によれば、付属情報のデータ構造をISO規格に準拠させて現在の最新の規格に適合しつつ、従来のフォーマットと同等のデータストリームのデータ構造およびそのようなデータ構造に基づいて動作するデータ処理装置が提供される。データストリームは従来のフォーマットにも対応するので、既存のアプリケーション等もデータストリームを利用できる。よって既存のソフトウェアおよびハードウェアを有効に活用できる。
従来のデータ処理装置350の構成を示す図である。 MP4ファイル20のデータ構造を示す図である。 アトム構造23の具体例を示す図である。 動画ストリーム22のデータ構造を示す図である。 途中でトラックが切り替わった動画ストリーム22を示す図である。 動画ストリーム22とDVD−RAMディスク331のセクタとの対応を示す図である。 記録されたデータがDVD−RAMのファイルシステムにおいて管理されている状態を示す図である。 DVDビデオレコーディング規格のアクセス情報として利用されるフィールド名と、フィールド名が表すピクチャ等との対応関係を模式的に示す図である。 図8に記載されたアクセス情報のデータ構造、データ構造に規定されるフィールド名、その設定内容およびデータサイズを示す図である。 本発明によるデータ処理を行うポータブルビデオコーダ10−1、ムービーレコーダ10−2およびPC10−3の接続環境を示す図である。 データ処理装置10における機能ブロックの構成を示す図である。 本発明によるMP4ストリーム12のデータ構造を示す図である。 MPEG2−PS14の音声データの管理単位を示す図である。 プログラムストリームとエレメンタリストリームとの関係を示す図である。 付属情報13のデータ構造を示す図である。 アトム構造を構成する各アトムの内容を示す図である。 データ参照アトム15の記述形式の具体例を示す図である。 サンプルテーブルアトム16に含まれる各アトムの記述内容の具体例を示す図である。 サンプル記述アトム17の記述形式の具体例を示す図である。 サンプル記述エントリ18の各フィールドの内容を示す図である。 MP4ストリームの生成処理の手順を示すフローチャートである。 本発明による処理に基づいて生成されたMPEG2−PSと、従来のMPEG2 Video(エレメンタリストリーム)との相違点を示す表である。 1チャンクに1VOBUを対応させたときのMP4ストリーム12のデータ構造を示す図である。 1チャンクに1VOBUを対応させたときのデータ構造を示す図である。 1チャンクに1VOBUを対応させたときの、サンプルテーブルアトム19に含まれる各アトムの記述内容の具体例を示す図である。 1つの付属情報ファイルに対して2つのPSファイルが存在するMP4ストリーム12の例を示す図である。 1つのPSファイル内に不連続なMPEG2−PSが複数存在する例を示す図である。 シームレス接続用のMPEG2−PSを含むPSファイルを設けたMP4ストリーム12を示す図である。 不連続点において不足する音声(オーディオ)フレームを示す図である。 本発明の他の例によるMP4ストリーム12のデータ構造を示す図である。 本発明のさらに他の例によるMP4ストリーム12のデータ構造を示す図である。 MTFファイル32のデータ構造を示す図である。 各種のファイルフォーマット規格の相互関係を示す図である。 QuickTimeストリームのデータ構造を示す図である。 QuickTimeストリームの付属情報13における各アトムの内容を示す図である。 記録画素数が変化する場合の動画ストリームのフラグ設定内容を説明する図である。

Claims (17)

  1. 映像データおよび音声データを受け取る受信部と、
    受け取った前記映像データおよび前記音声データを符号化して、MPEG2システム規格の符号化データを生成する圧縮部と、
    前記符号化データを参照する参照情報、および、前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位とし、前記サンプル単位の属性を記述した属性情報を含む付属情報を生成する付属情報生成部と、
    前記符号化データをデータファイルとして記録媒体に記録し、前記付属情報を付属情報ファイルとして前記記録媒体に記録する記録部と
    を備え、前記符号化データは、前記付属情報ファイルおよび前記MPEG2システム規格のいずれに基づいても復号化することが可能であるデータ処理装置。
  2. 前記参照情報は、前記記録媒体に記録された前記データファイルのファイル名および格納位置を示す、請求項1に記載のデータ処理装置。
  3. 前記圧縮部は、複数の符号化データを生成し、
    前記付属情報生成部は、前記複数の符号化データの各々を参照する前記参照情報を生成する、請求項1に記載のデータ処理装置。
  4. 前記圧縮部は、複数の符号化データを生成し、
    前記付属情報生成部は、前記複数の符号化データを連続的に配列して1つのストリームデータを生成し、再生タイミングごとの符号化データのデータサイズが一定でない場合に、前記符号化データの記録位置を特定する位置情報をさらに記述した付属情報を生成する、請求項1に記載のデータ処理装置。
  5. 前記圧縮部は、MPEG2プログラムストリームおよびMPEG2トランスポートストリームの一方に準拠した符号化データを生成する、請求項1に記載のデータ処理装置。
  6. 前記付属情報生成部は、前記符号化データのうち、前記音声データに対応する符号化音声データの音声フレームを、さらに他のサンプル単位として前記属性情報に記述する、請求項1に記載のデータ処理装置。
  7. 前記圧縮部は、第1〜第3のデータファイルを生成し、前記第2のデータファイルは、前記第1のデータファイルの符号化データと前記第3のデータファイルの符号化データとを時間的に連続して復号するために必要なフレームデータを含む、請求項3に記載のデータ処理装置。
  8. 付属情報生成部は、MP4フォーマットにしたがって記述された付属情報ファイルを生成する、請求項1に記載のデータ処理装置。
  9. 付属情報生成部は、QuickTimeフォーマットにしたがって記述された付属情報ファイルを生成する、請求項1に記載のデータ処理装置。
  10. データファイルに含まれる符号化データと、付属情報ファイルに含まれる付属情報とによって構成されるストリームデータであって、
    前記符号化データは、映像データおよび音声データがMPEG2システム規格にしたがって符号化され、かつ、前記付属情報および前記MPEG2システム規格のいずれに基づいても復号化することが可能であり、
    前記付属情報は、前記符号化データを参照する参照情報および前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位として前記サンプル単位の属性を記述した属性情報を含む、ストリームデータ。
  11. 請求項10に記載のストリームデータが記録された記録媒体。
  12. 請求項10に記載のストリームデータから前記付属情報ファイルを読み出し、さらに制御信号に基づいて前記データファイルを読み出す再生部と、
    前記付属情報ファイルの前記付属情報に規定される前記参照情報に基づいて、前記データファイルの読み出しを指示する信号を前記制御信号として生成する再生制御部と、
    読み出された前記データファイルの符号化データおよび前記付属情報を受け取り、前記付属情報に含まれる前記属性情報に基づいて、前記符号化データから前記映像データおよび前記音声データを復号する復号部と、
    復号された前記映像データおよび前記音声データを出力する出力部と
    を備えたデータ処理装置。
  13. 映像データおよび音声データを受け取るステップと、
    受け取った前記映像データおよび前記音声データを符号化して、MPEG2システム規格の符号化データを生成するステップと、
    前記符号化データを参照する参照情報、および、前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位とし、前記サンプル単位の属性を記述した属性情報を含む付属情報を生成するステップと、
    前記符号化データをデータファイルとして記録媒体に記録し、前記付属情報を付属情報ファイルとして前記記録媒体に記録するステップと、
    を包含するデータ記録方法であって、前記符号化データは、前記付属情報ファイルおよび前記MPEG2システム規格のいずれに基づいても復号化することが可能である、データ記録方法。
  14. データ処理装置において実行可能なコンピュータプログラムであって、
    映像データおよび音声データを受け取るステップと、
    受け取った前記映像データおよび前記音声データを符号化して、MPEG2システム規格の符号化データを生成するステップと、
    前記符号化データを参照する参照情報、および、前記符号化データのビデオオブジェクトユニット(VOBU)をサンプル単位とし、前記サンプル単位の属性を記述した属性情報を含む付属情報を生成するステップと、
    前記符号化データをデータファイルとして記録媒体に記録し、前記付属情報を付属情報ファイルとして前記記録媒体に記録するステップと、
    を包含し、前記符号化データは、前記付属情報ファイルおよび前記MPEG2システム規格のいずれに基づいても復号化することが可能である、データ記録プログラム。
  15. 請求項10に記載のストリームデータから前記付属情報ファイルを読み出すステップと、
    前記付属情報ファイルの前記付属情報に規定される前記参照情報に基づいて、前記データファイルの読み出しを指示する制御信号を生成するステップと、
    前記制御信号に基づいて前記データファイルを読み出すステップと、
    読み出された前記データファイルの符号化データおよび前記付属情報を受け取り、前記付属情報に含まれる前記属性情報に基づいて、前記符号化データから前記映像データおよび前記音声データを復号するステップと、
    復号された前記映像データおよび前記音声データを出力するステップと
    を包含するデータ再生方法。
  16. データ処理装置において実行可能なコンピュータプログラムであって、
    請求項10に記載のストリームデータから前記付属情報ファイルを読み出すステップと、
    前記付属情報ファイルの前記付属情報に規定される前記参照情報に基づいて、前記データファイルの読み出しを指示する制御信号を生成するステップと、
    前記制御信号に基づいて前記データファイルを読み出すステップと、
    読み出された前記データファイルの符号化データおよび前記付属情報を受け取り、前記付属情報に含まれる前記属性情報に基づいて、前記符号化データから前記映像データおよび前記音声データを復号するステップと、
    復号された前記映像データおよび前記音声データを出力するステップと
    を包含するデータ再生プログラム。
  17. 映像データおよび音声データを受け取る受信部と、
    受け取った前記映像データおよび前記音声データを所定の符号化形式で符号化して、前記映像データに対応するデータと前記音声データに対応するデータとがインターリーブされた符号化データを生成する圧縮部と、
    付属情報を生成する付属情報生成部であって、前記付属情報は、符号化データを参照する参照情報およびサンプル単位の属性を記述した属性情報を含む付属情報生成部と
    を備え、前記サンプルは、前記映像データの再生時間に基づいて構成された前記符号化データの集合であり、
    前記符号化データは、前記付属情報に基づく復号化、および、前記所定の符号化方式に対応する復号化方式のいずれに基づいても復号化することが可能である、データ処理装置。
JP2005505097A 2002-07-12 2003-07-11 データ処理装置 Expired - Fee Related JP4299836B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2002203837 2002-07-12
JP2002203837 2002-07-12
JP2002256752 2002-09-02
JP2002256752 2002-09-02
PCT/JP2003/008872 WO2004008759A1 (ja) 2002-07-12 2003-07-11 データ処理装置

Publications (2)

Publication Number Publication Date
JPWO2004008759A1 true JPWO2004008759A1 (ja) 2005-11-17
JP4299836B2 JP4299836B2 (ja) 2009-07-22

Family

ID=30117438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005505097A Expired - Fee Related JP4299836B2 (ja) 2002-07-12 2003-07-11 データ処理装置

Country Status (5)

Country Link
US (1) US20050254498A1 (ja)
JP (1) JP4299836B2 (ja)
CN (1) CN100452857C (ja)
AU (1) AU2003248055A1 (ja)
WO (1) WO2004008759A1 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1833439A (zh) * 2003-08-08 2006-09-13 松下电器产业株式会社 数据处理装置和数据处理方法
EP1622382B1 (en) * 2004-07-22 2007-10-17 Harman Becker Automotive Systems GmbH Data transmission synchronization scheme
US20060051071A1 (en) * 2004-09-01 2006-03-09 Trek 2000 International Ltd. Portable apparatus for enabling reproduction of television
SG127771A1 (en) * 2005-06-01 2006-12-29 Trek 2000 Int Ltd Dual television tuner
US8788933B2 (en) * 2005-12-01 2014-07-22 Nokia Corporation Time-shifted presentation of media streams
US8269763B2 (en) * 2006-11-03 2012-09-18 Apple Inc. Continuous random access points
US8875199B2 (en) 2006-11-13 2014-10-28 Cisco Technology, Inc. Indicating picture usefulness for playback optimization
US8155207B2 (en) 2008-01-09 2012-04-10 Cisco Technology, Inc. Processing and managing pictures at the concatenation of two video streams
US8416859B2 (en) 2006-11-13 2013-04-09 Cisco Technology, Inc. Signalling and extraction in compressed video of pictures belonging to interdependency tiers
US20090028142A1 (en) * 2007-07-25 2009-01-29 Schmidt Brian K Streaming data content in a network
US8958486B2 (en) 2007-07-31 2015-02-17 Cisco Technology, Inc. Simultaneous processing of media and redundancy streams for mitigating impairments
US8804845B2 (en) 2007-07-31 2014-08-12 Cisco Technology, Inc. Non-enhancing media redundancy coding for mitigating transmission impairments
US8718388B2 (en) 2007-12-11 2014-05-06 Cisco Technology, Inc. Video processing with tiered interdependencies of pictures
US8416858B2 (en) * 2008-02-29 2013-04-09 Cisco Technology, Inc. Signalling picture encoding schemes and associated picture properties
WO2009152450A1 (en) 2008-06-12 2009-12-17 Cisco Technology, Inc. Picture interdependencies signals in context of mmco to assist stream manipulation
US8699578B2 (en) 2008-06-17 2014-04-15 Cisco Technology, Inc. Methods and systems for processing multi-latticed video streams
US8971402B2 (en) 2008-06-17 2015-03-03 Cisco Technology, Inc. Processing of impaired and incomplete multi-latticed video streams
US8705631B2 (en) 2008-06-17 2014-04-22 Cisco Technology, Inc. Time-shifted transport of multi-latticed video for resiliency from burst-error effects
US8259814B2 (en) 2008-11-12 2012-09-04 Cisco Technology, Inc. Processing of a video program having plural processed representations of a single video signal for reconstruction and output
JP2010245754A (ja) * 2009-04-03 2010-10-28 Victor Co Of Japan Ltd 通信ネットワークシステム、コンテンツ再生方法、及びサーバ
JP2010245755A (ja) * 2009-04-03 2010-10-28 Victor Co Of Japan Ltd 通信ネットワークシステム、コンテンツ再生方法、及びサーバ
JP2010245756A (ja) * 2009-04-03 2010-10-28 Victor Co Of Japan Ltd 通信ネットワークシステム、コンテンツ再生方法、及びサーバ
US8949883B2 (en) 2009-05-12 2015-02-03 Cisco Technology, Inc. Signalling buffer characteristics for splicing operations of video streams
US8279926B2 (en) 2009-06-18 2012-10-02 Cisco Technology, Inc. Dynamic streaming with latticed representations of video
JP2013534101A (ja) * 2010-06-14 2013-08-29 トムソン ライセンシング 符号化マルチコンポーネント・ビデオをカプセル化する方法および装置
EP2580920A1 (en) * 2010-06-14 2013-04-17 Thomson Licensing Method and apparatus for encapsulating coded multi-component video
US8843803B2 (en) * 2011-04-01 2014-09-23 Cleversafe, Inc. Utilizing local memory and dispersed storage memory to access encoded data slices
RU2655744C2 (ru) 2013-07-17 2018-05-30 Сони Корпорейшн Устройство подачи содержания, способ подачи содержания, программа, оконечное устройство и система подачи содержания
CN110046483A (zh) * 2019-04-23 2019-07-23 北京恒冠网络数据处理有限公司 基于大数据的电子信息技术的数据处理方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1079175A (ja) * 1996-08-30 1998-03-24 Victor Co Of Japan Ltd ディジタル信号記録方法及び記録装置
US6442333B1 (en) * 1997-12-25 2002-08-27 Pioneer Electronic Corporation Information reproducing apparatus
JP2000138897A (ja) * 1998-10-30 2000-05-16 Sony Corp データ処理装置およびデータ記録装置
CN1161780C (zh) * 1999-01-07 2004-08-11 日本胜利株式会社 数据记录方法及装置
JP2001067802A (ja) * 1999-08-27 2001-03-16 Toshiba Corp マルチチャンネル記録装置及び記録方法
JP4211153B2 (ja) * 1999-09-17 2009-01-21 ソニー株式会社 記録装置および方法
EP1236350B1 (en) * 1999-11-10 2004-08-11 Thomson Licensing S.A. Digital video recording with full screen sub-picture and associated transparency control data recording for effecting fading between successive video segments at reproduction
JP2001313903A (ja) * 2000-04-28 2001-11-09 Matsushita Electric Ind Co Ltd データ処理装置、データ処理方法および記録媒体
JP4083957B2 (ja) * 2000-07-10 2008-04-30 パイオニア株式会社 記録媒体、情報記録装置及び方法、情報再生装置及び方法並びに情報記録用プログラム及び情報再生用プログラム
JP2004505519A (ja) * 2000-07-13 2004-02-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Mpeg−4符号器及び斯様な符号器の出力符号化信号
EP1217839A3 (en) * 2000-12-08 2009-09-09 Panasonic Corporation Data conversion apparatus, data coding apparatus, and data recording apparatus
JP2003163889A (ja) * 2001-11-26 2003-06-06 Matsushita Electric Ind Co Ltd ストリーム記録再生システム,及びストリーム記録再生装置
US7251413B2 (en) * 2002-04-26 2007-07-31 Digital Networks North America, Inc. System and method for improved blackfield detection

Also Published As

Publication number Publication date
CN1666514A (zh) 2005-09-07
CN100452857C (zh) 2009-01-14
WO2004008759A1 (ja) 2004-01-22
JP4299836B2 (ja) 2009-07-22
AU2003248055A1 (en) 2004-02-02
US20050254498A1 (en) 2005-11-17

Similar Documents

Publication Publication Date Title
JP4299836B2 (ja) データ処理装置
KR100413176B1 (ko) 오디오 비디오 데이터 기록장치 및 방법, 상기 오디오비디오 데이터 기록장치 또는 방법으로 기록된 디스크,오디오 비디오 데이터 재생장치 및 방법
US20050013583A1 (en) Audio/video information recording/reproducing apparatus and method, and recording medium in which information is recorded by using the audio/video information recording/reproducing apparatus and method
WO2006054590A1 (ja) データ処理装置
JPWO2002023896A1 (ja) 音声/映像情報記録再生装置および方法
JPWO2005015907A1 (ja) データ処理装置
JP2010213286A (ja) データ記録方法、データ編集方法およびデータ復号方法、並びにその装置、及び記録媒体
JPWO2004080071A1 (ja) データ処理装置
JP4284073B2 (ja) Avデータ記録再生装置及び方法、並びに当該avデータ記録再生装置又は方法で記録された記録媒体
JP3986973B2 (ja) Avデータ記録方法、avデータ記録装置、データ記録媒体、及びプログラム
JP2003158714A (ja) 情報記録装置および方法ならびに情報再生装置および方法
KR100625406B1 (ko) 데이터 처리 장치
JP3901555B2 (ja) Avデータ記録装置及び方法、当該avデータ記録装置又は方法で記録されたディスク、並びに当該ディスクを再生するavデータ再生装置及び方法又はavデータ記録再生装置及び方法
JP4481929B2 (ja) データストリームの記録方法および装置
JP4189304B2 (ja) データ処理装置
JP2003224810A (ja) 音声/映像データ記録再生装置および方法、音声/映像データ記録再生装置および方法により記録が行われた記録媒体、音声/映像データ再生装置、音声/映像データ記録再生システムおよび方法、音声/映像データ記録再生システムおよび方法により記録が行われた記録媒体、ならびにデータ構造体
JP4312783B2 (ja) Avデータ再生方法、avデータ再生装置、プログラム、並びに記録媒体
JP3830931B2 (ja) Avデータ記録装置及び方法、当該avデータ記録装置又は方法で記録されたディスク、avデータ再生装置及び方法
KR100633805B1 (ko) 음성/영상 정보 기록 재생 장치 및 방법, 및 음성/영상정보 기록 재생 장치 및 방법을 이용하여 정보가 기록된기록 매체
JP3825025B2 (ja) Avデータ記録装置及び方法、当該avデータ記録装置又は方法で記録されたディスク、avデータ再生装置及び方法
JP2003174622A (ja) 音声/映像情報記録再生装置および方法、および音声/映像情報記録再生装置および方法を用いて情報が記録された記録媒体
JP2004072789A (ja) Avデータ記録装置及び方法、当該avデータ記録装置又は方法で記録されたディスク、avデータ再生装置及び方法
JP2005192239A (ja) データ記録方法、データ編集方法およびデータ復号方法、並びにその装置、及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090324

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090417

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120424

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130424

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees