JPWO2006018993A1 - オーサリング装置、オーサリング方法並びにオーサリングプログラム及びそのプログラムを記録した記録媒体 - Google Patents

オーサリング装置、オーサリング方法並びにオーサリングプログラム及びそのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JPWO2006018993A1
JPWO2006018993A1 JP2006531598A JP2006531598A JPWO2006018993A1 JP WO2006018993 A1 JPWO2006018993 A1 JP WO2006018993A1 JP 2006531598 A JP2006531598 A JP 2006531598A JP 2006531598 A JP2006531598 A JP 2006531598A JP WO2006018993 A1 JPWO2006018993 A1 JP WO2006018993A1
Authority
JP
Japan
Prior art keywords
information
stream
video
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006531598A
Other languages
English (en)
Inventor
宜史 河口
宜史 河口
秀樹 谷口
秀樹 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2006018993A1 publication Critical patent/JPWO2006018993A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • G11B20/1217Formatting, e.g. arrangement of data block or words on the record carriers on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/913Television signal processing therefor for scrambling ; for copy protection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

オーサリング装置(10)は、入力ストリームをビデオストリームとオーディオストリームに分離する分離部(310)と、ビデオストリームとオーディオストリームとを多重化してコンテンツ情報(318)を生成し、さらにストリームの再生を管理するコントロール情報(319)を生成し、コンテンツ情報とコントロール情報から、所定フォーマットに基本的に準拠した一連のデータであって所定フォーマットに規定される再生制御情報の一部が欠如した不完全なディスクイメージデータ(320a)を生成し、さらに欠如した再生制御情報の一部を生成するために必要な解析情報(315)を生成する多重化部(314)と、不完全なディスクイメージデータの生成終了後に解析情報を参照して不完全なディスクイメージデータを完成させるディスクイメージ完成処理部(316)とを備える。

Description

本発明は、映像情報等のコンテンツを記録媒体に記録するオーサリング装置及びオーサリング方法に関する。
近年、光ディスクの分野における高記録容量化の傾向が顕著であり、これに伴って一本の映画等を圧縮した上で記録する光ディスクとして例えば、DVD(Digital Versatile Disk)が一般的に普及しつつある。
このような高記録容量のDVDに映画等の映像情報(以下「コンテンツ」という)を記録する際に準拠する記録方式は、基本的にMPEG方式に準拠するが、さらにDVD特有の規格を有する。その記録方式の代表的なものにDVDビデオ(DVD−Video)方式とDVDビデオレコーディング(DVD−Video Recording)方式とがある。
DVDビデオ方式は再生専用DVDフォーマットと互換性がある方式である。DVDビデオレコーディング方式は、再生専用のDVDフォーマットとの互換性はないが、記録されたコンテンツ情報の編集を容易に行うことが可能であり、実時間に沿って光ディスク上に記録するのに適した方式である。ビデオ方式では、一般的にコンテンツは実時間と無関係に記録されるオーサリング方式によって記録される。
図8を用いて従来のオーサリング方式について説明する。なお、以下ではMPEG2規格以外のフォーマットのコンテンツをDVDビデオ規格のストリームに変換し記録する場合を説明する。以下の各処理部の処理は制御部212により制御される。
入力されたコンテンツは分離部200によりオーディオストリームとビデオストリームに分離され、復号部201で復号され、MPEG2規格に準拠するよう符号化部202でエンコードされる。多重化部203によりオーディオストリームとビデオストリームが多重化され、ビデオ互換ファイル205として出力される。ここで、ビデオ互換ファイル205は、MPEG2方式のストリームで、ビットレート、GOP構成、オーディオ形式等がDVDビデオ規格に準拠したストリームのことである。
但し、ビデオ互換ファイル205は、DVDビデオ規格を完全に満たすものではなく、一部の再生制御情報が欠落している。なお、再生制御情報とは、ストリーム中の再生態様を制御するための情報であり、例えば、DVDの規格においてはナビゲーション情報のことである。
このため、解析部206は、ストリームとは別途入力したシナリオ情報204を元に、ビデオ互換ファイル205において全ストリームの解析を行う。この解析により、最終的なディスクイメージ209を作成する上で必要な再生制御情報を含む解析情報ファイル207を作成する。
そして、ディスクイメージ完成処理部208は、その解析情報ファイル207と、これに対応するビデオ互換ファイル205とをまとめてタイトルデータを構築し、ディスクイメージ209(コントロール情報210及びVOB211)を完成する。
最後に、上記手順で作成されたディスクイメージ209を光ディスクにディスクアットワンス方式(追記記録不可)で記録する。
特開平10−155135号公報
上記従来方式では、作業に必要な領域として、ビデオ互換ファイル205を格納する領域と、ディスクイメージ209を格納する領域とが必要である。つまり、ストリーム全体の容量の2倍の容量の作業領域が必要である。よって、パソコン上でDVDビデオ方式を用いてDVDを作成する場合、ハードディスク容量を大量に消費するという問題がある。
また、入力ストリームからビデオ互換ファイル205を生成し(第1回目の走査)、その後に、ビデオ互換ファイル205全体を解析して解析情報ファイル207を作成し(第2回目の走査)、さらに、その後、ビデオ互換ファイル205と解析情報ファイル207を参照してディスクイメージ209を生成する(第3回目の走査)。このように、ストリーム全体を3回走査するため、I/O処理が頻繁に発生し、結果としてDVDを作成するのに処理時間がかかるという問題がある。
解決しようとする問題点は、オーサリング時に膨大な作業領域が必要である点を改善し、変換処理を効率化することでオーサリング時間を短縮することである。
本発明の第1の態様において、入力ストリームを所定フォーマットのストリームとして記録媒体に記録するオーサリング方法が提供される。オーサリング方法によれば、入力ストリームをビデオストリームとオーディオストリームに分離する。ビデオストリームとオーディオストリームとを多重化してコンテンツ情報を生成し、さらにストリームの再生を管理するコントロール情報を生成し、コンテンツ情報とコントロール情報とから、所定フォーマットに基本的に準拠した一連のデータであって所定フォーマットに規定される再生制御情報の一部が欠如した不完全なディスクイメージデータを生成する。不完全なディスクイメージデータの生成と同時に、欠如した再生制御情報の一部を生成するために必要な解析情報を生成する。不完全なディスクイメージデータの生成終了後に、解析情報を参照して欠如した再生制御情報の一部を書替えて、不完全なディスクイメージデータを完成させる。
本発明の第2の態様において、入力ストリームを所定フォーマットのストリームとして記録媒体に記録するオーサリング装置が提供される。オーサリング装置において、分離手段は、入力ストリームをビデオストリームとオーディオストリームに分離する。多重化手段は、ビデオストリームとオーディオストリームとを多重化してコンテンツ情報を生成し、さらにストリームの再生を管理するコントロール情報を生成し、コンテンツ情報とコントロール情報とから所定フォーマットに基本的に準拠した一連のデータであって所定フォーマットに規定される再生制御情報の一部が欠如した不完全なディスクイメージデータを生成し、さらに、不完全なディスクイメージデータの生成と同時に、欠如した再生制御情報の一部を生成するために必要な解析情報を生成する。ディスクイメージ完成処理部は、不完全なディスクイメージデータの生成終了後に、解析情報を参照して欠如した再生制御情報の一部を書替えて、不完全なディスクイメージデータを完成させる。
本発明によれば、入力したストリームの第1回目の走査でハードディスク上に不完全なディスクイメージを作成し、次に不完全なディスクイメージを走査(第2回目の走査)してディスクイメージを完成する。このようにストリーム全体の走査を2回しか行わないことにより、中間的なファイルを格納するための作業領域を必要とせず、また、I/O回数を低減できる。よって、オーサリング処理に要する記録容量や処理時間を低減できるため、一般的なパソコンでの操作性を向上すると共に高速なオーサリングを実現できる。
以下、本発明に好適な実施の形態について添付の図面を参照して説明する。
なお、以下では、記録媒体としてDVD―R/RW(DVD−Recordable/ReWritable)を用い、その記録媒体に対して、映画等のビデオ情報の記録フォーマット規格の1つであるDVDビデオ(DVD−Video)規格に準拠してコンテンツを記録する例を説明する。
1.オーサリング装置の構成
以下に述べる本実施形態のオーサリング装置は、DVDビデオ規格に準拠し、一時的な作業領域をほとんど必要とせずに入力ストリームをメモリ上で効果的に分割処理しながら、最終ディスクイメージを構築する。オーサリング装置は、入力したストリームをとりあえずDVDビデオ規格に準拠した形式に変換し、ダミー情報を含む不完全なディスクイメージを生成する。その後、オーサリング装置は、不完全なディスクイメージのダミー情報を正当な情報に書き替えることで、最終的なすなわち完全なディスクイメージを生成する。このようにオーサリング装置は2回のストリームの走査の処理(以下「2パス処理」という。)でオーサリングを完結することを可能とする。これにより、オーサリング処理に必要な処理時間及び作業領域の容量を低減できる。
図1に、本発明に係るオーサリング装置の構成を示す。オーサリング装置10はオーサリング機能のための構成として、入力ストリームを音声ストリームとビデオストリームに分離する分離部310と、ストリームを解析するストリーム解析部322と、ストリームを復号する復号部312と、ストリームをエンコードする符号化部313と、音声ストリームとビデオストリームとを多重化する多重化部314とを有する。多重化部314はバッファメモリ314aを含む。
さらに、オーサリング装置10は、多重化部314からの出力を受けて不完全なディスクイメージを生成するディスクイメージ制御部317と、不完全なディスクイメージを完成させるための処理を行うディスクイメージ完成処理部316と、シナリオ情報311からビデオマネージャ324を生成するビデオマネージャ生成部323と、ディスクイメージを格納するデータ格納部320とを有する。データ格納部320は例えばハードディスク装置である。ここで、シナリオ情報311は、DVDビデオ規格で規定されるエントリ・ポイントの設定のための情報、すなわち、セル20を分割するための配置位置を示す情報等を含む。ビデオマネージャ324は最終的にDVD100に記録されるファイルに対するメニュー情報である。
オーサリング装置10はさらに光ディスク100に情報を記録するための手段としてディスク記録部330及び光ヘッド331を有する。ディスク記録部330は完成したディスクイメージをデータ格納部320から読み出し、光ヘッドを介して光ディスク100に記録する。
オーサリング装置10はさらに、分離部310、復号部312等、オーサリング装置10を構成する各処理部の動作を制御し、オーサリング装置10の諸機能を実現する制御部321を備える。
なお、分離部310、ストリーム解析部322、復号部312、符号化部313、多重化部314、ディスクイメージ完成処理部316、ディスクイメージ制御部317及び制御部321により実現される以下に説明するオーサリング装置10の機能はコンピュータ上でソフトウェアを実行することで実現できる。但し、オーサリング装置10の機能をハードウェアで実現してもよい。
2.記録フォーマット概要
オーサリング装置10の具体的な動作を説明する前に、オーサリング装置10が対応すべき記録フォーマットであるDVDビデオ規格について図2から図5を参照してその概要を説明する。
(物理フォーマット)
図2に示すように、DVDビデオ規格に則って記録情報が記録されているDVD(一回のみ記録可能なDVD―R又は複数回の書き換えが可能なDVD―RW等を含む)100は、その最内周部にリードインエリアLIを、その最外周部にリードアウトエリアLOを有する。リードインエリアLIとリードアウトエリアLOの間に、映像情報及び音声情報が、夫々ID(識別)番号を有する複数のVTS(Video Title Set)3(VTS#1〜VTS#n)に分割されて記録されている。
VTS3は、関連するタイトルを一まとめにしたセットである。タイトルとは、映画等の、製作者が視聴者に提示しようとする一つの作品を意味する。関連するタイトルとは、それらに含まれる音声情報及び副映像情報(映画における字幕等の副映像の情報)の数や、仕様、対応言語等の属性が同じタイトルを意味する。例えば、VTS3には、一本の同じ映画について、異なる言語のセリフ等を有する複数の映画が夫々のタイトルとして記録されている。または、同じ映画であっても劇場版と特別版とが夫々別のタイトルとして記録されている。したがって、VTS3(ビデオタイトルセット)はタイトルとメニューの集合体であり、より詳細には図7に示すように、VTS3内のタイトルとメニューを制御するためのコントロールデータ511、メニュー用VOBS512、タイトル用VOBS513及びバックアップ用コントロールデータ514とで構成される。
VTS3が記録されている領域の直前の領域には、ビデオマネージャ2が記録される。ビデオマネージャ2として記録される情報には、VMGI(Video Maneger Information)があり、例えば、このVMGIの情報には、各タイトルの名前を示すメニューや、違法コピー防止のための情報、又は夫々のタイトルにアクセスするためのアクセステーブル並びにこれらの情報のバックアップ情報等、DVD100に記録される映像情報及び音声情報の全体に係わる情報が含まれる。
また、ビデオマネージャ2とリードインエリアLIの間には、DVD100に記録されている情報全体を識別するためのボリューム情報4と、ビデオマネージャ2及び各VTS3におけるデータのファイル構造を示すファイルシステム情報5とが記録される。
VTS3は、先頭にあるコントロールデータ11と、コンテンツ情報である複数のオブジェクト(本実施形態では、ビデオ情報であるのでビデオオブジェクト(以下「VOB」という))10とから構成される。各VOB10には、制御情報の他に、映像情報及び音声情報の実体部分(制御情報以外の映像又は音声そのもの)が記録される。つまり、コンテンツ情報は複数のVOB10に分割されて記録される。各VOB10には夫々ID番号が付与される。
複数のVOB10により構成されている部分をVOBセット(VOBS)という。このVOBセットは、VTS3を構成するコントロールデータ11と、映像情報及び音声情報の実体である複数のVOB10の部分とを区別するために、その実体部分について識別するためのものである。
各VTS3の先頭に記録されるコントロールデータ11には、後述する複数のセルを組み合わせた論理的区分であるプログラムチェインに関する種々の情報であるPGCI(Program Chain Information)等の情報、及びそれらのバックアップ情報であるVTSI(Video Title Set Information)が記録される。
さらに、各VOB10は、夫々にID番号を有する複数のセル20により構成される。各VOB10は複数のセル20により完結するように構成されている。つまり、各セル20は二つのVOB10に跨がることはない。
各セル20は、夫々にID番号を有する複数のVOBユニット(VOBU)30により構成されている。VOBユニット30は、映像情報、音声情報及び副映像情報の夫々を含む単位情報である。各VOBユニット30は、それが含むデータ等に対する制御情報を格納するナビゲーション情報を示すパック(以下、「ナビパック」という)41と、映像情報としてのビデオデータ(ビデオパック)42と、音声情報としてのオーディオデータ(オーディオパック)43と、副映像情報としてのサブピクチャデータ(サブピクチャパック)44とにより構成されている。ビデオデータ42としては映像データのみが記録され、オーディオデータ43としては音声データのみが記録される。また、サブピクチャデータ44としては副映像としての文字や図形等のグラフィックデータのみが記録される。
また、各VOBユニット30は、それが含むデータの再生時間(1つのナビパックとそのナビパックの前後にあるナビパックとの間に記録されているデータに対する再生時間)が0.4秒以上かつ1秒以下となるように記録される。このため、再生時に、ナビパック41は、0.4秒乃至1秒に1回は必ず検出される。
さらに、各VOBユニット30では、ナビパック41が必ずその先頭に配されるとともに、その後にビデオデータ42、オーディオデータ43及びサブピクチャデータ44の夫々データが配置される。ただし、ビデオデータ42、オーディオデータ43及びサブピクチャデータ44の夫々データは、必ずしもVOBユニット30中に存在する必要はなく、また、存在する場合にもその数や順序は任意に設定することができるようになっている。なお、DVD100に記録可能な音声は8種類であり、記録可能な副映像の種類は32種類であることが規格上定められている。
ビデオデータ42、オーディオデータ43及びサブピクチャデータ44は夫々「パック」という単位で管理される。すなわち、各VOBユニット30において、ビデオデータ42、オーディオデータ43及びサブピクチャデータ44は、夫々パックに分割されて記録される。なお、各VOBユニット30に含まれている全てのビデオデータ42は、1又は複数のGOP(Group Of Picture)により構成される。
このGOPは、本実施の形態におけるDVD100に映像情報を記録する際に採用されている画像圧縮方式であるMPEG2方式の規格において定められている単独で再生可能な最小の画像単位であり、各GOPの先頭には、GOPに含まれるビデオデータ42を表示すべき再生時間軸上の再生時刻を示すPTS(Presentation Time Stamp)と呼ばれる再生表示時刻情報が記録されるようになっている。このMPEG2方式については後述する。
また、ビデオデータ42が記録されているパックを「ビデオパック」、オーディオデータ43が記録されているパックを「オーディオパック」、サブピクチャデータ44が記録されているパックを「サブピクチャーパック」という。さらに、各パックの先頭に記録されるパックヘッダには、SCR(System Clock Reference)という時間情報が記録されている。SCRは、夫々のパックに含まれているデータを、DVD100に記録されている情報を再生する情報再生装置におけるトラックバッファから読み出して、夫々のバッファへの入力を開始すべき再生時間軸上の読み出し開始時刻を示す。
ナビパック41は、それが含まれるVOBユニットに含まれる映像及び音声情報に対する再生制御情報である。ナビパック41は再生表示させたい映像又は音声等を検索するための検索情報であるDSIデータと、DSIデータに基づいて検索したときに映像又は音声を再生する際の再生表示制御に関する情報であるPCIデータとを含む。DSIデータは例えば再生表示させたい映像又は音声等が記録されているDVD100上のアドレスである。
PCIデータには、ユーザによって選択される選択項目に対して、その項目が選択されたときの表示や動作を定義したハイライト情報が含まれる。このハイライト情報によって、例えば、ユーザが選択すべき項目を表示した画像(いわゆるメニュー画面)における、項目選択に対する画面表示の変更や、その選択に対応して変化すべき表示位置及び選択された項目に対するコマンド(選択された項目に対して実行される動作を示す命令)等の設定が行われる。メニュー画面を構成して表示するために必要な、枠や選択ボタン等を表示するための画像情報は、上記の副映像情報であるサブピクチャデータ44として記録される。なお、このDSIデータ及びPCIデータの詳細にいては後述する。
本実施形態で採用するビデオデータを圧縮するMPEG2方式についてその概要を説明する。
一般に、連続したフレーム画像において、一枚のフレーム画像の前後にあるフレーム画像は互いに類似し相互関係を有している場合が多い。MPEG2方式はこの点に着目し、数フレームを隔てて転送される複数のフレーム画像に基づき、それらの複数のフレーム画像間に存在する別のフレーム画像を、原画像の動きベクトル等に基づく補間演算にて生成する方式である。
別のフレーム画像を記録する場合には、複数のフレーム画像との間における差分及び動きベクトルに関する情報を記録するだけで、再生時には、それらを参照して上記複数のフレーム画像から予測して当該別のフレーム画像を再生することが可能となる。これにより、画像の圧縮記録が可能となるのである。
(GOPの概要)
次に、GOPについて図3を用いてその概要を説明する。なお、図3は、各GOPを構成する複数のフレーム画像の例を示している。図3では、各GOPが12枚のフレーム画像から構成されている場合(MPEG2方式では、各GOPに含まれるフレーム画像数は一定ではない)を示している。図中、「I」で示されるフレーム画像は、Iピクチャ(intra−coded picture:イントラ符号化画像)と呼ばれ、自らの画像のみで完全なフレーム画像を再生することができるフレーム画像である。「P」で示されるフレーム画像は、Pピクチャ(Predictive−codedpicture:前方予測符号化画像)と呼ばれ、既に復号化されたIピクチャ又は他のPピクチャに基づいて補償再生された予測画像との差を復号化する等して生成する予測画像である。「B」で示されるフレーム画像は、Bピクチャ(Bidirectionally predictive−coded picture:両方向予測符号化画像)といい、既に復号化されたIピクチャ又はPピクチャのみでなく、光ディスク等に記録されている時間的に未来のIピクチャ又はPピクチャも予測に用いて再生される予測画像をいう。なお、図3において、各ピクチャ間の予測関係(補間関係)を矢印で示している。
本実施形態のDVD100に対して用いる一般のMPEG2方式においては、夫々のGOPに含まれるデータ量が一定でない可変レート方式を採用している。すなわち、1つのGOPに含まれる各ピクチャが、動きの速い動画に対応しており、各ピクチャ間の相関関係が小さい場合には、各ピクチャを構成するためのデータ量が多くなり、従って、1つのGOPに含まれるデータ量も多くなる。一方、各GOPに含まれる各ピクチャが、あまり動きのない動画に対応しており、各ピクチャ間の相関関係が大きい場合には、各ピクチャを構成するためのデータ量も少なくなり、各GOPに含まれるデータ量も少なくなることとなる。
(PCIデータ及びDSIデータのデータ構造)
次に、図4を用いて上記PCIデータ及びDSIデータの物理的なデータ構造について説明する。図4はDVDビデオ規格における物理的記録フォーマットを、特に、ナビパックのデータ構造を示す図である。ナビパック41に含まれるPCIデータ及びDSIデータは、PCIデータの実データを有するPCIパケットデータ50及びDSIデータの実データを有するDSIパケットデータ51と、当該パックが記録されている物理的アドレス(Pack Start Code)及びSCRなどの情報を有するパックヘッダ52と、当該パックのシステムヘッダが記録されている物理的アドレス(System HeaderStart Code)及びデータストリームの属性情報を有するシステムヘッダ53と、各パケットヘッダ54とから構成される。
PCIパケットデータ50は、図4に示すように、PCIデータ本体としての一般情報55と、マルチアングル用の情報を格納するアングル情報56と、マルチアングル表示の選択のために表示されるメニュー表示情報を格納するハイライト情報57と、ISO(International Standardization organization)3901に準拠するISRC(International Standard Recording Code)としての記録情報58と、により構成される。なお、このISRCとは、CD(CompactDisc)等において使用されるサブコード内にある国コード、コンテンツホルダーコードなどの情報を示す。
一般情報55は、ナビパック41のVOB10の先頭から予め設定されている論理ブロックの番号を示す論理アドレス情報70と、コピープロテクションに関する情報、すなわち著作権情報を示す著作権情報71と、VOBユニット30におけるユーザの操作制御を示すユーザ制御情報72と、そのナビパック41が含まれているVOBユニット30の再生時間軸上における再生開始時刻を示すVOBU開始時刻情報73と、当該VOBユニット30の再生時間軸上における再生終了時刻を示すVOBU終了時刻情報74と、VOBユニット30におけるVOBU終了時刻情報とは別の再生時間軸上における再生制限終了時刻を示すVOBU終了時刻制限情報75と、セルの最初のビデオフレームからVOBユニット30の最初のフレームまでの相対的な記録アドレス情報であるナビパック相対位置情報76と、により構成されている。
DSIパケットデータ51は、DSIデータ本体としての一般情報80と、ナビパック41が属するVOB10に関する情報であるVOB情報81と、マルチアングル用の情報を格納するアングル情報82と、そのナビパック41が属しているVOBユニット30の前後に再生されるべき他のVOBユニット30のDVD1上の記録位置を示すVOBUサーチ情報83と、ビデオデータとオーディオデータの同期再生用のアドレス情報を示す同期再生用アドレス情報84と、により構成されている。
一般情報80は、論理アドレス情報70と同様のナビパック相対位置情報88と、そのナビパック41が属しているVOBユニット30を識別するためのVOBU識別番号89と、その他の情報90と、により構成されている。
VOB情報81は、ナビパック41を含むVOBユニット30が属するVOB10の再生時間軸上における再生開始時刻を示すVOB開始時刻情報85と、VOB10の再生時間軸上における再生終了時刻を示すVOB終了時刻情報86と、その他の情報87とにより構成されている。
VOBUサーチ情報83は、そのナビパック41が属しているVOBユニット30の次のVOBユニット及び一つ前のVOBユニットのDVD1上の記録位置を示す位置情報、及び、そのナビパック41が属しているVOBユニット30の開始時刻から120秒前から120秒後の範囲で再生されるべき他のVOBユニット30のDVD1上の記録位置を示す位置情報を有している。
以上説明した図4に示す階層構造の記録フォーマットにおいて、夫々の区分は、製作者がその意図に応じて自在に区分設定をして記録させるものである。これらの区分毎に後述の論理構造に基づいて再生することにより、変化に富んだ種々の再生ができるようになっている。
(論理フォーマット)
次に、図5を用いて、図2又は図4に示す物理的な区分により記録された情報を組み合わせた論理フォーマット(論理構造)について説明する。なお、図5に示す論理構造は、実際にDVD100上に情報が記録されている構造(物理構造)ではない点に留意すべきである。図5に示す論理構造で図2に示す各データ(特にセル20)を組み合わせて再生するための情報(アクセス情報又は時間情報等)が、DVD100上のコントロールデータ11中に記録されている。
説明の簡単化のために、図5の下位の階層から説明していく。製作者が図2に示す複数のセル20を選択して組み合わせることにより、1つのプログラム60が製作者の意図に基づいて論理上構成される。このプログラム60は、オーサリング装置10における制御部321が区分を識別してコマンドによってアクセスできる最小の論理的単位でもある。
なお、製作者は、プログラム60を1つ又は複数個まとめたものをユーザが自由に選択して視聴することができる最小単位として定義することもできる。その最小単位をPTT(Part of Title)という。また、1つのプログラム60が複数のセル20を選択して論理的に構成されることから、複数のプログラム60で1つのセル20を用いる、すなわち、1つのセル20を異なった複数のプログラム60において再生させる、いわゆるセル20の使い回しを製作者が行うことも可能である。
セル20を図2に示す物理フォーマットにおいて取り扱う際には、各セルの番号はセルID番号として扱われ(図1中、セルID#と示す。)る。一方、図5に示す論理フォーマットにおいて取り扱う際には、各セルの番号は後述のPGCI中の記述順にセル番号として扱われる。
DVDビデオ規格では、製作者の意図に基づき、複数のプログラム60を組み合わせて1つのPGC(Program Chain)61が論理上構成される。このPGC61の単位で、前述したPGCIが定義される。そのPGCIには、夫々のプログラム60を再生する際のプログラム毎のセル20の再生順序、夫々のセル20のDVD100上の記録位置であるアドレス、1つのプログラム60における再生すべき先頭セル20の番号、各プログラム60の再生方式、及び各種コマンドが含まれている。
なお、再生順序により、プログラム60毎に固有のプログラム番号が割当てられている。また、各種コマンドには、PGC61又はセル20毎に製作者が指定可能なコマンドが含まれる。また、各プログラム60の再生方式については、本実施形態のDVD100に情報を記録する際に、製作者が通常再生、ランダム再生及びシャッフル再生のうちいずれか一つを選択してPGC61毎に設定できるようになっている。ランダム再生とは、乱数により再生順が決まる再生方法であり、同じプログラム60が複数回再生されることがある。シャッフル再生とは、ランダム再生と同様の乱数により再生順が決まる再生方法であるが、同じプログラムは一度しか再生されず、同じプログラムが複数回再生されることはない。
なお、PGCIのDVD100上の記録位置は、上述の通りコントロールデータ11(図2参照)内であるが、PGCIがビデオマネージャ2内のメニューに関するPGCIである場合には、PGCIの記録位置はビデオマネージャ2に含まれるコントロールデータ(図示を省略する)内となる。
また、各PGC61には、上記PGCIの他に、実体的な映像及び音声等のデータが、プログラム60の組み合わせとして(言い換えると、セル20の組み合わせとして)含まれる。
各PGC61において、上記のプログラム60に関する説明において示したセル20の使い回し(すなわち、異なるPGC61により同1のセル20を用いること。)も可能である。使用するセル20については、DVD100に記録されている順番にセル20を再生する方法(連続配置セルの再生)の他に、DVD100に記録されている順序に関係なく再生する(例えば、後に記録されているセル20を先に再生する等)方法(非連続配置セルの再生)を、製作者が選択することができるようになっている。
DVDビデオ規格では、1つのタイトル62が1又は複数のPGC61により論理上構成される。タイトル62は、例えば、1つの動画に相当する単位であり、製作者がDVD100のユーザに対して提供したい、完結した情報である。1又は複数のタイトル62により、1つのVTS63が論理上構成される。VTS63に含まれる各タイトル62は夫々に共通の属性を有する。例えば、一本の同じ映画に対して違う言語の映画が夫々のタイトル62に相当する。また、図5に示す1つのVTS63に相当する情報は、図2に示す1のVTS3に含まれている情報に対応する。すなわち、DVD100には、図5に示すVTS63内に論理上含まれる全ての情報が、図2に示す1つのVTS3として記録される。
以上説明した論理フォーマットに基づいて、物理構造において区分された情報を製作者が指定することにより、ユーザが見るべきタイトル(動画等)が形成される。
3.オーサリング装置の動作
以下、オーサリング装置10の動作を説明する。
分離部310は、入力したストリームをビデオエレメンタリーストリームと、オーディオエレメンタリーストリームに分離する。
次にストリーム解析部322は、分離部310から出力されたストリームを解析し、入力ストリームがDVDビデオ規格に準拠したストリームか否かを判断する。例えばビデオストリームについて以下の項目をチェックする。
<DVDビデオ規格に関するチェック項目>
−属性情報(水平サイズ、垂直サイズ、アスペクト比、表示周期、ビットレート等)が途中から変化してないか否か。
−ビットレートが、10.8Mbpsを超えてないか否か。
−解像度が以下の範囲にあるか否か。
水平サイズ:720,704,352
垂直サイズ:480,240,576,288
−アスペクト比が4:3または16:9であるか否か。
−GOPに含まれるフレーム画像数以下の範囲にあるか否か。
NTSC:18以下
PAL :15以下
−ピクチャ構成
Iピクチャ、Pピクチャ、Bピクチャ、Dピクチャ以外のピクチャが含まれていないか否か。
分離されたビデオエレメンタリーストリーム及びオーディオエレメンタリーストリームがDVDビデオ規格に準拠しない場合、復号化部312と符号化部313は、それらのエレメンタリーストリームをDVDビデオ規格に準拠したエレメンタリーストリームに変換する。変換されたストリームは多重化部314に入力される。分離されたビデオエレメンタリーストリーム及びオーディオエレメンタリーストリームがDVDビデオ規格に準拠する場合、各エレメンタリストリームは直接、多重化部314に送られる。
多重化部314はビデオエレメンタリーストリーム、オーディオエレメンタリーストリーム及びシナリオ情報311を入力し、不完全なVOB318と、ストリームの解析情報315と、コントロール情報319とを構築する。さらに多重化部314は、ビデオエレメンタリストリーム、オーディオエレメンタリストリームを内部のバッファ314a内で多重化し、VOBユニット30を構築する。その際、多重化部314は、ビデオエレメンタリストリーム及びオーディオエレメンタリストリームの内容を解析し、DVDビデオ規格に則したナビパック41を生成し、VOBユニット30に組み込む。
但し、未だ処理していないストリーム(すなわちVOBU)に関するナビパックの情報を構築することは不可能である。そこで、多重化部314はナビパック41が不完全な状態のVOBユニット30が連続したストリームを出力する。よって、多重化部314から出力されるVOB318は不完全なVOBとなる。その際、多重化部314はVOB318の不完全なナビパックの部分にはダミー情報を挿入する。ダミー情報は例えばnullデータである。
ここで、多重化部314にて構築できない、未だ処理していないストリームに関するナビパック41の情報に関して説明する。多重化部314で構築できないナビパック41の情報には、VOBUサーチ情報83、同期再生用アドレス情報84及びVOB終了時刻情報86が含まれる。
VOBUサーチ情報83は、ナビパック41が属しているVOBユニット30の次のVOBユニット、及び、一つ前のVOBユニットのDVD100上の記録位置を示す情報、及び、当該VOBユニット30の開始時刻から120秒後乃至120秒前の範囲で再生されるべき他のVOBユニットのDVD1上の記録位置を示す位置情報を含む必要がある。しかし、当該VOBユニット30の開始時刻から120秒後のVOBユニットについて、当該VOBユニット30の処理時点では未だ処理されていないため、その位置情報は未確定である。このため、VOBUサーチ情報83は多重化部314での多重化時には構築されない。
同期再生用アドレス情報84はナビパック41が属しているVOBユニット30のビデオデータ42と同期して再生されるオーディオデータ43とサブピクチャー44の位置情報を含む必要がある。しかし当該VOBユニット30以降のVOBユニットについて、当該VOBユニット30の処理時点では処理されていないため、その位置情報は未確定である。このため、同期再生用アドレス情報84は多重化部314での多重化時には構築されない。
VOB終了時刻情報86は当該VOB10の再生時間軸上における再生終了であるためストリームをすべて処理するまで情報を確定することができない。
多重化部314で構築できないVOBUサーチ情報83、同期再生用アドレス情報84及びVOB終了時刻情報86は、ディスクイメージ完成処理部316により、未完成のVOBの生成後に補充される。このために、多重化部314は、不完全なVOB318の構築と同時に、ビデオエレメンタリストリーム及びオーディオエレメンタリストリームの内容に基づきストリームの解析情報315を構築する。解析情報315は所定のメモリに格納される。
図6にストリームの解析情報315の構造を示す。解析情報315は、全VOBユニット30に関して、VOBU識別番号399、位置情報400、VOBU開始時刻情報401、オーディオパックPTS402及びオーディオパック位置情報403を含む。さらに、ストリームの解析情報は、最終ビデオフレームの再生終了時刻を格納するVOB終了時刻情報404を含む。なお、各VOBユニットには複数のオーディオパックが含まれるので、オーディオパックPTS402及びオーディオパック位置情報403は複数含まれる。
ここで、VOBU識別番号399はVOBユニット毎の識別番号であり、解析情報315内の情報の管理に使用される。位置情報400は各VOBUの位置に関する情報であり、VOBUサーチ情報83の構築に使用される。VOBU開始時刻情報401は、VOBユニット内の先頭ビデオパックのPTMである。オーディオパックPTS402は、VOBユニット内のオーディオパックのPTSである。オーディオパック位置情報403は、VOBユニット内のオーディオパックの位置情報である。VOBU開始時刻情報401、オーディオパックPTS402及びオーディオパック位置情報403は、同期再生用アドレス情報84の構築に使用される。
また、多重化部314は、シナリオ情報311及び生成したVOB318の情報から、PTTをサーチするための情報、メニューを再生するための情報、及びタイトルの管理情報を含むコントロール情報319を構築する。
多重化部314は、ディスクイメージ制御部317を介して、構築したVOB318及びコントロール情報319をディスクイメージ320aとしてデータ格納部320に記録する。ディスクイメージ320aは、DVD規格に準拠して形成されたDVD100上に最終的に記録される一連のデータであり、VOB318、コントロール情報319及びビデオマネージャ324を含む。ビデオマネージャ324はビデオマネージャ生成部323によりシナリオ情報311から生成される。
以上のようにして、多重化部314は入力した一連のストリームをDVDビデオ規格に変換しながら、不完全なディスクイメージとして記録し、同時に解析情報315を記録する。
多重化部314による不完全なディスクイメージの記録が終了すると、ディスクイメージ完成処理部316によりディスクイメージが完成される。すなわち、ディスクイメージ完成処理部316は、解析情報315を参照してVOBUサーチ情報83、同期再生用アドレス情報84及びVOB終了時刻情報86を生成し、データ格納部320に格納された不完全なVOB318のナビパック41内のダミー情報をそれらの情報83、84、86で書き換えることでディスクイメージ320aを完成させる。
ディスクイメージ制御部317の処理の詳細について説明する。ディスクイメージ制御部317はディスクイメージ320aへのアクセスを管理し、ファイルとして作成されているVOB318及びコントロール情報319を仮想的なDVDディスクとしてアクセスすることを可能とする。ディスクイメージ制御部317が仮想的なディスクを提供することで、多重化部314はVOBユニット30の構築中にVOBユニット30が次に配置される位置情報を把握することが可能となる。
DVDビデオ規格では、VOBは1GB未満のファイルで、VOBSは最大9ファイルのVOBから構成しなければならない。従来方式では、一度ハードディスク上にVOBを出力して、1GB未満になるように最終処理でファイルを分割してVOBSとしていた。そのため、最終的なディスクのイメージ以外に、中間データとしてのVOBファイルを作業領域上に作成する必要があった。ディスクイメージ制御部317は、多重化部314から出力されるストリームを1GB以上にならないようにハードディスク上でファイルを分割し、各VOBファイルを連続したVOBSとして管理を行う。しかし、このように連続したストリームを複数のVOBファイルに分割してしまうと、位置情報を取得するのに演算処理が必要になりデータ変換処理が複雑になる。また、ナビパック41で管理する位置情報は、実際のDVD100に配置した場合の位置情報である。そのため、ディスクイメージ制御部317は図7に示すようにディスクイメージに配置されたファイル500を仮想ディスクとして、アクセスすることを可能とする。これにより、多重化部314はファイルシステムを意識することなく、ディスクイメージ中にデータを配置することが可能になる。図7では、VTS_01_1.VOB〜VTS_01_4.VOBはディスクイメージ制御部317によりサイズの制限により分割されたものである。VIDEO_TS.IFO、VIDEO_TS.BUP、VIDEO_TS.VOBのセットがビデオマネージャに相当する。
以上のように、本実施形態のオーサリング装置では、入力したストリームをDVDビデオ規格に変換しながら、最初に不完全なディスクイメージを生成し、記録する(第1回目の走査)。不完全なディスクイメージにおいて、不完全な再生制御情報にはダミー情報(例えばnullデータ)を記録する。その後、不完全なディスクイメージ全体を走査して(第2回目の走査)、ダミー情報を正当な情報に書替えることで完全なディスクイメージを生成する。以上のように、本実施形態では、ストリーム全体を2回だけ走査することで(2パス処理)、完全なディスクイメージが生成されるため、ディスクイメージのサイズの1倍分の作業領域しか必要せず、従来に比して処理時間及び作業領域を低減できる。
なお、本発明は、特定の実施形態について説明されてきたが、当業者にとっては他の多くの変形例、修正、他の利用が明らかである。それゆえ、本発明は、ここでの特定の開示に限定されず、添付の請求の範囲によってのみ限定され得る。本出願は日本国特許出願、特願2004−237159号(2004年8月17日提出)に関連し、それらの内容は参照することにより本文中に組み入れられる。
本発明は、あるフォーマットのストリームを、別のフォーマット形式に変換して記録するオーサリング装置に適用できる。
本発明に係るオーサリング装置の構成を示す図 DVDビデオ規格における物理的記録フォーマットを示す図 DVDビデオ規格におけるGOPの構成を示す図 DVDビデオ規格における物理的記録フォーマット(特に、ナビパックのデータ構造)を示す図 DVDビデオ規格における論理フォーマットを示す図 オーサリング装置の多重化部で構築される解析情報の内容を示す図 DVDビデオディスクのボリューム空間と論理データ構造の関係を示す図 従来のオーサリング装置の構成を示す図
符号の説明
10 オーサリング装置
41 ナビパック
100 DVD
310 分離部
311 シナリオ情報
312 復号部
313 符号化部
314 多重化部
315 解析情報
316 ディスクイメージ完成処理部
317 ディスクイメージ制御部
318 VOB
319 コントロール情報
320 データ格納部
320a ディスクイメージ
321 制御部
本発明は、映像情報等のコンテンツを記録媒体に記録するオーサリング装置及びオーサリング方法に関する。
近年、光ディスクの分野における高記録容量化の傾向が顕著であり、これに伴って一本の映画等を圧縮した上で記録する光ディスクとして例えば、DVD(Digital Versatile Disk)が一般的に普及しつつある。
このような高記録容量のDVDに映画等の映像情報(以下「コンテンツ」という)を記録する際に準拠する記録方式は、基本的にMPEG方式に準拠するが、さらにDVD特有の規格を有する。その記録方式の代表的なものにDVDビデオ(DVD-Video)方式とDVDビデオレコーディング(DVD-Video Recording)方式とがある。
DVDビデオ方式は再生専用DVDフォーマットと互換性がある方式である。DVDビデオレコーディング方式は、再生専用のDVDフォーマットとの互換性はないが、記録されたコンテンツ情報の編集を容易に行うことが可能であり、実時間に沿って光ディスク上に記録するのに適した方式である。ビデオ方式では、一般的にコンテンツは実時間と無関係に記録されるオーサリング方式によって記録される。
図8を用いて従来のオーサリング方式について説明する。なお、以下ではMPEG2規格以外のフォーマットのコンテンツをDVDビデオ規格のストリームに変換し記録する場合を説明する。以下の各処理部の処理は制御部212により制御される。
入力されたコンテンツは分離部200によりオーディオストリームとビデオストリームに分離され、復号部201で復号され、MPEG2規格に準拠するよう符号化部202でエンコードされる。多重化部203によりオーディオストリームとビデオストリームが多重化され、ビデオ互換ファイル205として出力される。ここで、ビデオ互換ファイル205は、MPEG2方式のストリームで、ビットレート、GOP構成、オーディオ形式等がDVDビデオ規格に準拠したストリームのことである。
但し、ビデオ互換ファイル205は、DVDビデオ規格を完全に満たすものではなく、一部の再生制御情報が欠落している。なお、再生制御情報とは、ストリーム中の再生態様を制御するための情報であり、例えば、DVDの規格においてはナビゲーション情報のことである。
このため、解析部206は、ストリームとは別途入力したシナリオ情報204を元に、ビデオ互換ファイル205において全ストリームの解析を行う。この解析により、最終的なディスクイメージ209を作成する上で必要な再生制御情報を含む解析情報ファイル207を作成する。
そして、ディスクイメージ完成処理部208は、その解析情報ファイル207と、これに対応するビデオ互換ファイル205とをまとめてタイトルデータを構築し、ディスクイメージ209(コントロール情報210及びVOB211)を完成する。
最後に、上記手順で作成されたディスクイメージ209を光ディスクにディスクアットワンス方式(追記記録不可)で記録する。
特開平10−155135号公報
上記従来方式では、作業に必要な領域として、ビデオ互換ファイル205を格納する領域と、ディスクイメージ209を格納する領域とが必要である。つまり、ストリーム全体の容量の2倍の容量の作業領域が必要である。よって、パソコン上でDVDビデオ方式を用いてDVDを作成する場合、ハードディスク容量を大量に消費するという問題がある。
また、入力ストリームからビデオ互換ファイル205を生成し(第1回目の走査)、その後に、ビデオ互換ファイル205全体を解析して解析情報ファイル207を作成し(第2回目の走査)、さらに、その後、ビデオ互換ファイル205と解析情報ファイル207を参照してディスクイメージ209を生成する(第3回目の走査)。このように、ストリーム全体を3回走査するため、I/O処理が頻繁に発生し、結果としてDVDを作成するのに処理時間がかかるという問題がある。
解決しようとする問題点は、オーサリング時に膨大な作業領域が必要である点を改善し、変換処理を効率化することでオーサリング時間を短縮することである。
本発明の第1の態様において、入力ストリームを所定フォーマットのストリームとして記録媒体に記録するオーサリング方法が提供される。オーサリング方法によれば、入力ストリームをビデオストリームとオーディオストリームに分離する。ビデオストリームとオーディオストリームとを多重化してコンテンツ情報を生成し、さらにストリームの再生を管理するコントロール情報を生成し、コンテンツ情報とコントロール情報とから、所定フォーマットに基本的に準拠した一連のデータであって所定フォーマットに規定される再生制御情報の一部が欠如した不完全なディスクイメージデータを生成する。不完全なディスクイメージデータの生成と同時に、欠如した再生制御情報の一部を生成するために必要な解析情報を生成する。不完全なディスクイメージデータの生成終了後に、解析情報を参照して欠如した再生制御情報の一部を書替えて、不完全なディスクイメージデータを完成させる。
本発明の第2の態様において、入力ストリームを所定フォーマットのストリームとして記録媒体に記録するオーサリング装置が提供される。オーサリング装置において、分離手段は、入力ストリームをビデオストリームとオーディオストリームに分離する。多重化手段は、ビデオストリームとオーディオストリームとを多重化してコンテンツ情報を生成し、さらにストリームの再生を管理するコントロール情報を生成し、コンテンツ情報とコントロール情報とから所定フォーマットに基本的に準拠した一連のデータであって所定フォーマットに規定される再生制御情報の一部が欠如した不完全なディスクイメージデータを生成し、さらに、不完全なディスクイメージデータの生成と同時に、欠如した再生制御情報の一部を生成するために必要な解析情報を生成する。ディスクイメージ完成処理部は、不完全なディスクイメージデータの生成終了後に、解析情報を参照して欠如した再生制御情報の一部を書替えて、不完全なディスクイメージデータを完成させる。
本発明によれば、入力したストリームの第1回目の走査でハードディスク上に不完全なディスクイメージを作成し、次に不完全なディスクイメージを走査(第2回目の走査)してディスクイメージを完成する。このようにストリーム全体の走査を2回しか行わないことにより、中間的なファイルを格納するための作業領域を必要とせず、また、I/O回数を低減できる。よって、オーサリング処理に要する記録容量や処理時間を低減できるため、一般的なパソコンでの操作性を向上すると共に高速なオーサリングを実現できる。
以下、本発明に好適な実施の形態について添付の図面を参照して説明する。
なお、以下では、記録媒体としてDVD―R/RW(DVD-Recordable/ReWritable)を用い、その記録媒体に対して、映画等のビデオ情報の記録フォーマット規格の1つであるDVDビデオ(DVD-Video)規格に準拠してコンテンツを記録する例を説明する。
1.オーサリング装置の構成
以下に述べる本実施形態のオーサリング装置は、DVDビデオ規格に準拠し、一時的な作業領域をほとんど必要とせずに入力ストリームをメモリ上で効果的に分割処理しながら、最終ディスクイメージを構築する。オーサリング装置は、入力したストリームをとりあえずDVDビデオ規格に準拠した形式に変換し、ダミー情報を含む不完全なディスクイメージを生成する。その後、オーサリング装置は、不完全なディスクイメージのダミー情報を正当な情報に書き替えることで、最終的なすなわち完全なディスクイメージを生成する。このようにオーサリング装置は2回のストリームの走査の処理(以下「2パス処理」という。)でオーサリングを完結することを可能とする。これにより、オーサリング処理に必要な処理時間及び作業領域の容量を低減できる。
図1に、本発明に係るオーサリング装置の構成を示す。オーサリング装置10はオーサリング機能のための構成として、入力ストリームを音声ストリームとビデオストリームに分離する分離部310と、ストリームを解析するストリーム解析部322と、ストリームを復号する復号部312と、ストリームをエンコードする符号化部313と、音声ストリームとビデオストリームとを多重化する多重化部314とを有する。多重化部314はバッファメモリ314aを含む。
さらに、オーサリング装置10は、多重化部314からの出力を受けて不完全なディスクイメージを生成するディスクイメージ制御部317と、不完全なディスクイメージを完成させるための処理を行うディスクイメージ完成処理部316と、シナリオ情報311からビデオマネージャ324を生成するビデオマネージャ生成部323と、ディスクイメージを格納するデータ格納部320とを有する。データ格納部320は例えばハードディスク装置である。ここで、シナリオ情報311は、DVDビデオ規格で規定されるエントリ・ポイントの設定のための情報、すなわち、セル20を分割するための配置位置を示す情報等を含む。ビデオマネージャ324は最終的にDVD100に記録されるファイルに対するメニュー情報である。
オーサリング装置10はさらに光ディスク100に情報を記録するための手段としてディスク記録部330及び光ヘッド331を有する。ディスク記録部330は完成したディスクイメージをデータ格納部320から読み出し、光ヘッドを介して光ディスク100に記録する。
オーサリング装置10はさらに、分離部310、復号部312等、オーサリング装置10を構成する各処理部の動作を制御し、オーサリング装置10の諸機能を実現する制御部321を備える。
なお、分離部310、ストリーム解析部322、復号部312、符号化部313、多重化部314、ディスクイメージ完成処理部316、ディスクイメージ制御部317及び制御部321により実現される以下に説明するオーサリング装置10の機能はコンピュータ上でソフトウェアを実行することで実現できる。但し、オーサリング装置10の機能をハードウェアで実現してもよい。
2.記録フォーマット概要
オーサリング装置10の具体的な動作を説明する前に、オーサリング装置10が対応すべき記録フォーマットであるDVDビデオ規格について図2から図5を参照してその概要を説明する。
(物理フォーマット)
図2に示すように、DVDビデオ規格に則って記録情報が記録されているDVD(一回のみ記録可能なDVD―R又は複数回の書き換えが可能なDVD―RW等を含む)100は、その最内周部にリードインエリアLIを、その最外周部にリードアウトエリアLOを有する。リードインエリアLIとリードアウトエリアLOの間に、映像情報及び音声情報が、夫々ID(識別)番号を有する複数のVTS(Video Title Set)3(VTS#1〜VTS#n)に分割されて記録されている。
VTS3は、関連するタイトルを一まとめにしたセットである。タイトルとは、映画等の、製作者が視聴者に提示しようとする一つの作品を意味する。関連するタイトルとは、それらに含まれる音声情報及び副映像情報(映画における字幕等の副映像の情報)の数や、仕様、対応言語等の属性が同じタイトルを意味する。例えば、VTS3には、一本の同じ映画について、異なる言語のセリフ等を有する複数の映画が夫々のタイトルとして記録されている。または、同じ映画であっても劇場版と特別版とが夫々別のタイトルとして記録されている。したがって、VTS3(ビデオタイトルセット)はタイトルとメニューの集合体であり、より詳細には図7に示すように、VTS3内のタイトルとメニューを制御するためのコントロールデータ511、メニュー用VOBS512、タイトル用VOBS513及びバックアップ用コントロールデータ514とで構成される。
VTS3が記録されている領域の直前の領域には、ビデオマネージャ2が記録される。ビデオマネージャ2として記録される情報には、VMGI(Video Maneger Information)があり、例えば、このVMGIの情報には、各タイトルの名前を示すメニューや、違法コピー防止のための情報、又は夫々のタイトルにアクセスするためのアクセステーブル並びにこれらの情報のバックアップ情報等、DVD100に記録される映像情報及び音声情報の全体に係わる情報が含まれる。
また、ビデオマネージャ2とリードインエリアLIの間には、DVD100に記録されている情報全体を識別するためのボリューム情報4と、ビデオマネージャ2及び各VTS3におけるデータのファイル構造を示すファイルシステム情報5とが記録される。
VTS3は、先頭にあるコントロールデータ11と、コンテンツ情報である複数のオブジェクト(本実施形態では、ビデオ情報であるのでビデオオブジェクト(以下「VOB」という))10とから構成される。各VOB10には、制御情報の他に、映像情報及び音声情報の実体部分(制御情報以外の映像又は音声そのもの)が記録される。つまり、コンテンツ情報は複数のVOB10に分割されて記録される。各VOB10には夫々ID番号が付与される。
複数のVOB10により構成されている部分をVOBセット(VOBS)という。このVOBセットは、VTS3を構成するコントロールデータ11と、映像情報及び音声情報の実体である複数のVOB10の部分とを区別するために、その実体部分について識別するためのものである。
各VTS3の先頭に記録されるコントロールデータ11には、後述する複数のセルを組み合わせた論理的区分であるプログラムチェインに関する種々の情報であるPGCI(Program Chain Information)等の情報、及びそれらのバックアップ情報であるVTSI(Video Title Set Information)が記録される。
さらに、各VOB10は、夫々にID番号を有する複数のセル20により構成される。各VOB10は複数のセル20により完結するように構成されている。つまり、各セル20は二つのVOB10に跨がることはない。
各セル20は、夫々にID番号を有する複数のVOBユニット(VOBU)30により構成されている。VOBユニット30は、映像情報、音声情報及び副映像情報の夫々を含む単位情報である。各VOBユニット30は、それが含むデータ等に対する制御情報を格納するナビゲーション情報を示すパック(以下、「ナビパック」という)41と、映像情報としてのビデオデータ(ビデオパック)42と、音声情報としてのオーディオデータ(オーディオパック)43と、副映像情報としてのサブピクチャデータ(サブピクチャパック)44とにより構成されている。ビデオデータ42としては映像データのみが記録され、オーディオデータ43としては音声データのみが記録される。また、サブピクチャデータ44としては副映像としての文字や図形等のグラフィックデータのみが記録される。
また、各VOBユニット30は、それが含むデータの再生時間(1つのナビパックとそのナビパックの前後にあるナビパックとの間に記録されているデータに対する再生時間)が0.4秒以上かつ1秒以下となるように記録される。このため、再生時に、ナビパック41は、0.4秒乃至1秒に1回は必ず検出される。
さらに、各VOBユニット30では、ナビパック41が必ずその先頭に配されるとともに、その後にビデオデータ42、オーディオデータ43及びサブピクチャデータ44の夫々データが配置される。ただし、ビデオデータ42、オーディオデータ43及びサブピクチャデータ44の夫々データは、必ずしもVOBユニット30中に存在する必要はなく、また、存在する場合にもその数や順序は任意に設定することができるようになっている。なお、DVD100に記録可能な音声は8種類であり、記録可能な副映像の種類は32種類であることが規格上定められている。
ビデオデータ42、オーディオデータ43及びサブピクチャデータ44は夫々「パック」という単位で管理される。すなわち、各VOBユニット30において、ビデオデータ42、オーディオデータ43及びサブピクチャデータ44は、夫々パックに分割されて記録される。なお、各VOBユニット30に含まれている全てのビデオデータ42は、1又は複数のGOP(Group Of Picture)により構成される。
このGOPは、本実施の形態におけるDVD100に映像情報を記録する際に採用されている画像圧縮方式であるMPEG2方式の規格において定められている単独で再生可能な最小の画像単位であり、各GOPの先頭には、GOPに含まれるビデオデータ42を表示すべき再生時間軸上の再生時刻を示すPTS(Presentation Time Stamp)と呼ばれる再生表示時刻情報が記録されるようになっている。このMPEG2方式については後述する。
また、ビデオデータ42が記録されているパックを「ビデオパック」、オーディオデータ43が記録されているパックを「オーディオパック」、サブピクチャデータ44が記録されているパックを「サブピクチャーパック」という。さらに、各パックの先頭に記録されるパックヘッダには、SCR(System Clock Reference)という時間情報が記録されている。SCRは、夫々のパックに含まれているデータを、DVD100に記録されている情報を再生する情報再生装置におけるトラックバッファから読み出して、夫々のバッファへの入力を開始すべき再生時間軸上の読み出し開始時刻を示す。
ナビパック41は、それが含まれるVOBユニットに含まれる映像及び音声情報に対する再生制御情報である。ナビパック41は再生表示させたい映像又は音声等を検索するための検索情報であるDSIデータと、DSIデータに基づいて検索したときに映像又は音声を再生する際の再生表示制御に関する情報であるPCIデータとを含む。DSIデータは例えば再生表示させたい映像又は音声等が記録されているDVD100上のアドレスである。
PCIデータには、ユーザによって選択される選択項目に対して、その項目が選択されたときの表示や動作を定義したハイライト情報が含まれる。このハイライト情報によって、例えば、ユーザが選択すべき項目を表示した画像(いわゆるメニュー画面)における、項目選択に対する画面表示の変更や、その選択に対応して変化すべき表示位置及び選択された項目に対するコマンド(選択された項目に対して実行される動作を示す命令)等の設定が行われる。メニュー画面を構成して表示するために必要な、枠や選択ボタン等を表示するための画像情報は、上記の副映像情報であるサブピクチャデータ44として記録される。なお、このDSIデータ及びPCIデータの詳細にいては後述する。
本実施形態で採用するビデオデータを圧縮するMPEG2方式についてその概要を説明する。
一般に、連続したフレーム画像において、一枚のフレーム画像の前後にあるフレーム画像は互いに類似し相互関係を有している場合が多い。MPEG2方式はこの点に着目し、数フレームを隔てて転送される複数のフレーム画像に基づき、それらの複数のフレーム画像間に存在する別のフレーム画像を、原画像の動きベクトル等に基づく補間演算にて生成する方式である。
別のフレーム画像を記録する場合には、複数のフレーム画像との間における差分及び動きベクトルに関する情報を記録するだけで、再生時には、それらを参照して上記複数のフレーム画像から予測して当該別のフレーム画像を再生することが可能となる。これにより、画像の圧縮記録が可能となるのである。
(GOPの概要)
次に、GOPについて図3を用いてその概要を説明する。なお、図3は、各GOPを構成する複数のフレーム画像の例を示している。図3では、各GOPが12枚のフレーム画像から構成されている場合(MPEG2方式では、各GOPに含まれるフレーム画像数は一定ではない)を示している。図中、「I」で示されるフレーム画像は、Iピクチャ(intra−coded picture :イントラ符号化画像)と呼ばれ、自らの画像のみで完全なフレーム画像を再生することができるフレーム画像である。「P」で示されるフレーム画像は、Pピクチャ(Predictive−codedpicture:前方予測符号化画像)と呼ばれ、既に復号化されたIピクチャ又は他のPピクチャに基づいて補償再生された予測画像との差を復号化する等して生成する予測画像である。「B」で示されるフレーム画像は、Bピクチャ(Bidirectionally predictive−coded picture:両方向予測符号化画像)といい、既に復号化されたIピクチャ又はPピクチャのみでなく、光ディスク等に記録されている時間的に未来のIピクチャ又はPピクチャも予測に用いて再生される予測画像をいう。なお、図3において、各ピクチャ間の予測関係(補間関係)を矢印で示している。
本実施形態のDVD100に対して用いる一般のMPEG2方式においては、夫々のGOPに含まれるデータ量が一定でない可変レート方式を採用している。すなわち、1つのGOPに含まれる各ピクチャが、動きの速い動画に対応しており、各ピクチャ間の相関関係が小さい場合には、各ピクチャを構成するためのデータ量が多くなり、従って、1つのGOPに含まれるデータ量も多くなる。一方、各GOPに含まれる各ピクチャが、あまり動きのない動画に対応しており、各ピクチャ間の相関関係が大きい場合には、各ピクチャを構成するためのデータ量も少なくなり、各GOPに含まれるデータ量も少なくなることとなる。
(PCIデータ及びDSIデータのデータ構造)
次に、図4を用いて上記PCIデータ及びDSIデータの物理的なデータ構造について説明する。図4はDVDビデオ規格における物理的記録フォーマットを、特に、ナビパックのデータ構造を示す図である。ナビパック41に含まれるPCIデータ及びDSIデータは、PCIデータの実データを有するPCIパケットデータ50及びDSIデータの実データを有するDSIパケットデータ51と、当該パックが記録されている物理的アドレス(Pack Start Code)及びSCRなどの情報を有するパックヘッダ52と、当該パックのシステムヘッダが記録されている物理的アドレス(System HeaderStart Code)及びデータストリームの属性情報を有するシステムヘッダ53と、各パケットヘッダ54とから構成される。
PCIパケットデータ50は、図4に示すように、PCIデータ本体としての一般情報55と、マルチアングル用の情報を格納するアングル情報56と、マルチアングル表示の選択のために表示されるメニュー表示情報を格納するハイライト情報57と、ISO(International Standardization organization)3901に準拠するISRC(International Standard Recording Code)としての記録情報58と、により構成される。なお、このISRCとは、CD(CompactDisc)等において使用されるサブコード内にある国コード、コンテンツホルダーコードなどの情報を示す。
一般情報55は、ナビパック41のVOB10の先頭から予め設定されている論理ブロックの番号を示す論理アドレス情報70と、コピープロテクションに関する情報、すなわち著作権情報を示す著作権情報71と、VOBユニット30におけるユーザの操作制御を示すユーザ制御情報72と、そのナビパック41が含まれているVOBユニット30の再生時間軸上における再生開始時刻を示すVOBU開始時刻情報73と、当該VOBユニット30の再生時間軸上における再生終了時刻を示すVOBU終了時刻情報74と、VOBユニット30におけるVOBU終了時刻情報とは別の再生時間軸上における再生制限終了時刻を示すVOBU終了時刻制限情報75と、セルの最初のビデオフレームからVOBユニット30の最初のフレームまでの相対的な記録アドレス情報であるナビパック相対位置情報76と、により構成されている。
DSIパケットデータ51は、DSIデータ本体としての一般情報80と、ナビパック41が属するVOB10に関する情報であるVOB情報81と、マルチアングル用の情報を格納するアングル情報82と、そのナビパック41が属しているVOBユニット30の前後に再生されるべき他のVOBユニット30のDVD1上の記録位置を示すVOBUサーチ情報83と、ビデオデータとオーディオデータの同期再生用のアドレス情報を示す同期再生用アドレス情報84と、により構成されている。
一般情報80は、論理アドレス情報70と同様のナビパック相対位置情報88と、そのナビパック41が属しているVOBユニット30を識別するためのVOBU識別番号89と、その他の情報90と、により構成されている。
VOB情報81は、ナビパック41を含むVOBユニット30が属するVOB10の再生時間軸上における再生開始時刻を示すVOB開始時刻情報85と、VOB10の再生時間軸上における再生終了時刻を示すVOB終了時刻情報86と、その他の情報87とにより構成されている。
VOBUサーチ情報83は、そのナビパック41が属しているVOBユニット30の次のVOBユニット及び一つ前のVOBユニットのDVD1上の記録位置を示す位置情報、及び、そのナビパック41が属しているVOBユニット30の開始時刻から120秒前から120秒後の範囲で再生されるべき他のVOBユニット30のDVD1上の記録位置を示す位置情報を有している。
以上説明した図4に示す階層構造の記録フォーマットにおいて、夫々の区分は、製作者がその意図に応じて自在に区分設定をして記録させるものである。これらの区分毎に後述の論理構造に基づいて再生することにより、変化に富んだ種々の再生ができるようになっている。
(論理フォーマット)
次に、図5を用いて、図2又は図4に示す物理的な区分により記録された情報を組み合わせた論理フォーマット(論理構造)について説明する。なお、図5に示す論理構造は、実際にDVD100上に情報が記録されている構造(物理構造)ではない点に留意すべきである。図5に示す論理構造で図2に示す各データ(特にセル20)を組み合わせて再生するための情報(アクセス情報又は時間情報等)が、DVD100上のコントロールデータ11中に記録されている。
説明の簡単化のために、図5の下位の階層から説明していく。製作者が図2に示す複数のセル20を選択して組み合わせることにより、1つのプログラム60が製作者の意図に基づいて論理上構成される。このプログラム60は、オーサリング装置10における制御部321が区分を識別してコマンドによってアクセスできる最小の論理的単位でもある。
なお、製作者は、プログラム60を1つ又は複数個まとめたものをユーザが自由に選択して視聴することができる最小単位として定義することもできる。その最小単位をPTT(Part of Title)という。また、1つのプログラム60が複数のセル20を選択して論理的に構成されることから、複数のプログラム60で1つのセル20を用いる、すなわち、1つのセル20を異なった複数のプログラム60において再生させる、いわゆるセル20の使い回しを製作者が行うことも可能である。
セル20を図2に示す物理フォーマットにおいて取り扱う際には、各セルの番号はセルID番号として扱われ(図1中、セルID#と示す。)る。一方、図5に示す論理フォーマットにおいて取り扱う際には、各セルの番号は後述のPGCI中の記述順にセル番号として扱われる。
DVDビデオ規格では、製作者の意図に基づき、複数のプログラム60を組み合わせて1つのPGC(Program Chain)61が論理上構成される。このPGC61の単位で、前述したPGCIが定義される。そのPGCIには、夫々のプログラム60を再生する際のプログラム毎のセル20の再生順序、夫々のセル20のDVD100上の記録位置であるアドレス、1つのプログラム60における再生すべき先頭セル20の番号、各プログラム60の再生方式、及び各種コマンドが含まれている。
なお、再生順序により、プログラム60毎に固有のプログラム番号が割当てられている。また、各種コマンドには、PGC61又はセル20毎に製作者が指定可能なコマンドが含まれる。また、各プログラム60の再生方式については、本実施形態のDVD100に情報を記録する際に、製作者が通常再生、ランダム再生及びシャッフル再生のうちいずれか一つを選択してPGC61毎に設定できるようになっている。ランダム再生とは、乱数により再生順が決まる再生方法であり、同じプログラム60が複数回再生されることがある。シャッフル再生とは、ランダム再生と同様の乱数により再生順が決まる再生方法であるが、同じプログラムは一度しか再生されず、同じプログラムが複数回再生されることはない。
なお、PGCIのDVD100上の記録位置は、上述の通りコントロールデータ11(図2参照)内であるが、PGCIがビデオマネージャ2内のメニューに関するPGCIである場合には、PGCIの記録位置はビデオマネージャ2に含まれるコントロールデータ(図示を省略する)内となる。
また、各PGC61には、上記PGCIの他に、実体的な映像及び音声等のデータが、プログラム60の組み合わせとして(言い換えると、セル20の組み合わせとして)含まれる。
各PGC61において、上記のプログラム60に関する説明において示したセル20の使い回し(すなわち、異なるPGC61により同1のセル20を用いること。)も可能である。使用するセル20については、DVD100に記録されている順番にセル20を再生する方法(連続配置セルの再生)の他に、DVD100に記録されている順序に関係なく再生する(例えば、後に記録されているセル20を先に再生する等)方法(非連続配置セルの再生)を、製作者が選択することができるようになっている。
DVDビデオ規格では、1つのタイトル62が1又は複数のPGC61により論理上構成される。タイトル62は、例えば、1つの動画に相当する単位であり、製作者がDVD100のユーザに対して提供したい、完結した情報である。1又は複数のタイトル62により、1つのVTS63が論理上構成される。VTS63に含まれる各タイトル62は夫々に共通の属性を有する。例えば、一本の同じ映画に対して違う言語の映画が夫々のタイトル62に相当する。また、図5に示す1つのVTS63に相当する情報は、図2に示す1のVTS3に含まれている情報に対応する。すなわち、DVD100には、図5に示すVTS63内に論理上含まれる全ての情報が、図2に示す1つのVTS3として記録される。
以上説明した論理フォーマットに基づいて、物理構造において区分された情報を製作者が指定することにより、ユーザが見るべきタイトル(動画等)が形成される。
3.オーサリング装置の動作
以下、オーサリング装置10の動作を説明する。
分離部310は、入力したストリームをビデオエレメンタリーストリームと、オーディオエレメンタリーストリームに分離する。
次にストリーム解析部322は、分離部310から出力されたストリームを解析し、入力ストリームがDVDビデオ規格に準拠したストリームか否かを判断する。例えばビデオストリームについて以下の項目をチェックする。
<DVDビデオ規格に関するチェック項目>
−属性情報(水平サイズ、垂直サイズ、アスペクト比、表示周期、ビットレート等)が途中から変化してないか否か。
−ビットレートが、10.8Mbpsを超えてないか否か。
−解像度が以下の範囲にあるか否か。
水平サイズ:720,704,352
垂直サイズ:480,240,576,288
−アスペクト比が4:3または16:9であるか否か。
−GOPに含まれるフレーム画像数以下の範囲にあるか否か。
NTSC:18以下
PAL :15以下
−ピクチャ構成
Iピクチャ、Pピクチャ、Bピクチャ、Dピクチャ以外のピクチャが含まれていないか否か。
分離されたビデオエレメンタリーストリーム及びオーディオエレメンタリーストリームがDVDビデオ規格に準拠しない場合、復号化部312と符号化部313は、それらのエレメンタリーストリームをDVDビデオ規格に準拠したエレメンタリーストリームに変換する。変換されたストリームは多重化部314に入力される。分離されたビデオエレメンタリーストリーム及びオーディオエレメンタリーストリームがDVDビデオ規格に準拠する場合、各エレメンタリストリームは直接、多重化部314に送られる。
多重化部314はビデオエレメンタリーストリーム、オーディオエレメンタリーストリーム及びシナリオ情報311を入力し、不完全なVOB318と、ストリームの解析情報315と、コントロール情報319とを構築する。さらに多重化部314は、ビデオエレメンタリストリーム、オーディオエレメンタリストリームを内部のバッファ314a内で多重化し、VOBユニット30を構築する。その際、多重化部314は、ビデオエレメンタリストリーム及びオーディオエレメンタリストリームの内容を解析し、DVDビデオ規格に則したナビパック41を生成し、VOBユニット30に組み込む。
但し、未だ処理していないストリーム(すなわちVOBU)に関するナビパックの情報を構築することは不可能である。そこで、多重化部314はナビパック41が不完全な状態のVOBユニット30が連続したストリームを出力する。よって、多重化部314から出力されるVOB318は不完全なVOBとなる。その際、多重化部314はVOB318の不完全なナビパックの部分にはダミー情報を挿入する。ダミー情報は例えばnullデータである。
ここで、多重化部314にて構築できない、未だ処理していないストリームに関するナビパック41の情報に関して説明する。多重化部314で構築できないナビパック41の情報には、VOBUサーチ情報83、同期再生用アドレス情報84及びVOB終了時刻情報86が含まれる。
VOBUサーチ情報83は、ナビパック41が属しているVOBユニット30の次のVOBユニット、及び、一つ前のVOBユニットのDVD100上の記録位置を示す情報、及び、当該VOBユニット30の開始時刻から120秒後乃至120秒前の範囲で再生されるべき他のVOBユニットのDVD1上の記録位置を示す位置情報を含む必要がある。しかし、当該VOBユニット30の開始時刻から120秒後のVOBユニットについて、当該VOBユニット30の処理時点では未だ処理されていないため、その位置情報は未確定である。このため、VOBUサーチ情報83は多重化部314での多重化時には構築されない。
同期再生用アドレス情報84はナビパック41が属しているVOBユニット30のビデオデータ42と同期して再生されるオーディオデータ43とサブピクチャー44の位置情報を含む必要がある。しかし当該VOBユニット30以降のVOBユニットについて、当該VOBユニット30の処理時点では処理されていないため、その位置情報は未確定である。このため、同期再生用アドレス情報84は多重化部314での多重化時には構築されない。
VOB終了時刻情報86は当該VOB10の再生時間軸上における再生終了であるためストリームをすべて処理するまで情報を確定することができない。
多重化部314で構築できないVOBUサーチ情報83、同期再生用アドレス情報84及びVOB終了時刻情報86は、ディスクイメージ完成処理部316により、未完成のVOBの生成後に補充される。このために、多重化部314は、不完全なVOB318の構築と同時に、ビデオエレメンタリストリーム及びオーディオエレメンタリストリームの内容に基づきストリームの解析情報315を構築する。解析情報315は所定のメモリに格納される。
図6にストリームの解析情報315の構造を示す。解析情報315は、全VOBユニット30に関して、VOBU識別番号399、位置情報400、VOBU開始時刻情報401、オーディオパックPTS402及びオーディオパック位置情報403を含む。さらに、ストリームの解析情報は、最終ビデオフレームの再生終了時刻を格納するVOB終了時刻情報404を含む。なお、各VOBユニットには複数のオーディオパックが含まれるので、オーディオパックPTS402及びオーディオパック位置情報403は複数含まれる。
ここで、VOBU識別番号399はVOBユニット毎の識別番号であり、解析情報315内の情報の管理に使用される。位置情報400は各VOBUの位置に関する情報であり、VOBUサーチ情報83の構築に使用される。VOBU開始時刻情報401は、VOBユニット内の先頭ビデオパックのPTMである。オーディオパックPTS402は、VOBユニット内のオーディオパックのPTSである。オーディオパック位置情報403は、VOBユニット内のオーディオパックの位置情報である。VOBU開始時刻情報401、オーディオパックPTS402及びオーディオパック位置情報403は、同期再生用アドレス情報84の構築に使用される。
また、多重化部314は、シナリオ情報311及び生成したVOB318の情報から、PTTをサーチするための情報、メニューを再生するための情報、及びタイトルの管理情報を含むコントロール情報319を構築する。
多重化部314は、ディスクイメージ制御部317を介して、構築したVOB318及びコントロール情報319をディスクイメージ320aとしてデータ格納部320に記録する。ディスクイメージ320aは、DVD規格に準拠して形成されたDVD100上に最終的に記録される一連のデータであり、VOB318、コントロール情報319及びビデオマネージャ324を含む。ビデオマネージャ324はビデオマネージャ生成部323によりシナリオ情報311から生成される。
以上のようにして、多重化部314は入力した一連のストリームをDVDビデオ規格に変換しながら、不完全なディスクイメージとして記録し、同時に解析情報315を記録する。
多重化部314による不完全なディスクイメージの記録が終了すると、ディスクイメージ完成処理部316によりディスクイメージが完成される。すなわち、ディスクイメージ完成処理部316は、解析情報315を参照してVOBUサーチ情報83、同期再生用アドレス情報84及びVOB終了時刻情報86を生成し、データ格納部320に格納された不完全なVOB318のナビパック41内のダミー情報をそれらの情報83、84、86で書き換えることでディスクイメージ320aを完成させる。
ディスクイメージ制御部317の処理の詳細について説明する。ディスクイメージ制御部317はディスクイメージ320aへのアクセスを管理し、ファイルとして作成されているVOB318及びコントロール情報319を仮想的なDVDディスクとしてアクセスすることを可能とする。ディスクイメージ制御部317が仮想的なディスクを提供することで、多重化部314はVOBユニット30の構築中にVOBユニット30が次に配置される位置情報を把握することが可能となる。
DVDビデオ規格では、VOBは1GB未満のファイルで、VOBSは最大9ファイルのVOBから構成しなければならない。従来方式では、一度ハードディスク上にVOBを出力して、1GB未満になるように最終処理でファイルを分割してVOBSとしていた。そのため、最終的なディスクのイメージ以外に、中間データとしてのVOBファイルを作業領域上に作成する必要があった。ディスクイメージ制御部317は、多重化部314から出力されるストリームを1GB以上にならないようにハードディスク上でファイルを分割し、各VOBファイルを連続したVOBSとして管理を行う。しかし、このように連続したストリームを複数のVOBファイルに分割してしまうと、位置情報を取得するのに演算処理が必要になりデータ変換処理が複雑になる。また、ナビパック41で管理する位置情報は、実際のDVD100に配置した場合の位置情報である。そのため、ディスクイメージ制御部317は図7に示すようにディスクイメージに配置されたファイル500を仮想ディスクとして、アクセスすることを可能とする。これにより、多重化部314はファイルシステムを意識することなく、ディスクイメージ中にデータを配置することが可能になる。図7では、VTS_01_1.VOB〜VTS_01_4.VOBはディスクイメージ制御部317によりサイズの制限により分割されたものである。VIDEO_TS.IFO、VIDEO_TS.BUP、VIDEO_TS.VOBのセットがビデオマネージャに相当する。
以上のように、本実施形態のオーサリング装置では、入力したストリームをDVDビデオ規格に変換しながら、最初に不完全なディスクイメージを生成し、記録する(第1回目の走査)。不完全なディスクイメージにおいて、不完全な再生制御情報にはダミー情報(例えばnullデータ)を記録する。その後、不完全なディスクイメージ全体を走査して(第2回目の走査)、ダミー情報を正当な情報に書替えることで完全なディスクイメージを生成する。以上のように、本実施形態では、ストリーム全体を2回だけ走査することで(2パス処理)、完全なディスクイメージが生成されるため、ディスクイメージのサイズの1倍分の作業領域しか必要せず、従来に比して処理時間及び作業領域を低減できる。
なお、本発明は、特定の実施形態について説明されてきたが、当業者にとっては他の多くの変形例、修正、他の利用が明らかである。それゆえ、本発明は、ここでの特定の開示に限定されず、添付の請求の範囲によってのみ限定され得る。本出願は日本国特許出願、特願2004−237159号(2004年8月17日提出)に関連し、それらの内容は参照することにより本文中に組み入れられる。
本発明は、あるフォーマットのストリームを、別のフォーマット形式に変換して記録するオーサリング装置に適用できる。
本発明に係るオーサリング装置の構成を示す図 DVDビデオ規格における物理的記録フォーマットを示す図 DVDビデオ規格におけるGOPの構成を示す図 DVDビデオ規格における物理的記録フォーマット(特に、ナビパックのデータ構造)を示す図 DVDビデオ規格における論理フォーマットを示す図 オーサリング装置の多重化部で構築される解析情報の内容を示す図 DVDビデオディスクのボリューム空間と論理データ構造の関係を示す図 従来のオーサリング装置の構成を示す図
符号の説明
10 オーサリング装置
41 ナビパック
100 DVD
310 分離部
311 シナリオ情報
312 復号部
313 符号化部
314 多重化部
315 解析情報
316 ディスクイメージ完成処理部
317 ディスクイメージ制御部
318 VOB
319 コントロール情報
320 データ格納部
320a ディスクイメージ
321 制御部

Claims (10)

  1. 入力ストリームを所定フォーマットのストリームとして記録媒体に記録するオーサリング方法であって、
    入力ストリームをビデオストリームとオーディオストリームに分離し、
    前記ビデオストリームとオーディオストリームとを多重化してコンテンツ情報を生成し、さらにストリームの再生を管理するコントロール情報を生成し、前記コンテンツ情報と前記コントロール情報とから、前記所定フォーマットに基本的に準拠した一連のデータであって前記所定フォーマットに規定される再生制御情報の一部が欠如した不完全なディスクイメージデータを生成し、
    該不完全なディスクイメージデータの生成と同時に、前記欠如した再生制御情報の一部を生成するために必要な解析情報を生成し、
    前記不完全なディスクイメージデータの生成終了後に、前記解析情報を参照して前記欠如した再生制御情報の一部を書替えて、前記不完全なディスクイメージデータを完成させる
    ことを特徴とするオーサリング方法。
  2. 前記入力ストリームが前記所定のフォーマットに準拠してない場合、前記分離されたビデオストリームとオーディオストリームを復号し、該復号後のビデオストリーム及びオーディオストリームを前記所定フォーマットに準拠した符号化方法で符号化し、該符号化したストリームを多重化して前記不完全なディスクイメージデータを生成する、ことを特徴とする請求項1記載のオーサリング方法。
  3. 前記不完全なディスクイメージデータにおける欠如した再生制御情報の一部にダミー情報を記録することを特徴とする請求項1記載のオーサリング方法。
  4. 前記解析情報を参照し、前記ダミー情報を正しい値に書き換えることを特徴とする請求項3記載のオーサリング方法。
  5. 前記所定フォーマットで規定されるデータサイズでストリームを分割しながら前記ディスクイメージを作成する、ことを特徴とする請求項1記載のオーサリング方法。
  6. 前記所定フォーマットはDVDビデオ規格である、ことを特徴とする請求項1記載のオーサリング方法。
  7. 入力ストリームを所定フォーマットのストリームとして記録媒体に記録するオーサリング装置であって、
    入力ストリームをビデオストリームとオーディオストリームに分離する分離手段と、
    前記ビデオストリームとオーディオストリームとを多重化してコンテンツ情報を生成し、さらにストリームの再生を管理するコントロール情報を生成し、前記コンテンツ情報と前記コントロール情報とから、前記所定フォーマットに基本的に準拠した一連のデータであって、前記所定フォーマットに規定される再生制御情報の一部が欠如した不完全なディスクイメージデータを生成し、さらに、該不完全なディスクイメージデータの生成と同時に、前記欠如した再生制御情報の一部を生成するために必要な解析情報を生成する、多重化手段と、
    前記不完全なディスクイメージデータの生成終了後に、前記解析情報を参照して前記欠如した再生制御情報の一部を書替えて、前記不完全なディスクイメージデータを完成させるディスクイメージ完成処理部と
    を備えたことを特徴とするオーサリング装置。
  8. 前記所定フォーマットで規定されるデータサイズでストリームを分割しながら前記ディスクイメージを作成するディスクイメージ制御手段を更に備えたことを特徴とする請求項7記載のオーサリング装置。
  9. 請求項1ないし請求項6のいずれかに記載のオーサリング方法をコンピュータに実行させるプログラム。
  10. 請求項9記載のプログラムを記録した記録媒体。
JP2006531598A 2004-08-17 2005-08-05 オーサリング装置、オーサリング方法並びにオーサリングプログラム及びそのプログラムを記録した記録媒体 Pending JPWO2006018993A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004237159 2004-08-17
JP2004237159 2004-08-17
PCT/JP2005/014435 WO2006018993A1 (ja) 2004-08-17 2005-08-05 オーサリング装置、オーサリング方法並びにオーサリングプログラム及びそのプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPWO2006018993A1 true JPWO2006018993A1 (ja) 2008-05-08

Family

ID=35907383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006531598A Pending JPWO2006018993A1 (ja) 2004-08-17 2005-08-05 オーサリング装置、オーサリング方法並びにオーサリングプログラム及びそのプログラムを記録した記録媒体

Country Status (5)

Country Link
US (1) US8208791B2 (ja)
EP (1) EP1784013A4 (ja)
JP (1) JPWO2006018993A1 (ja)
CN (1) CN101032165B (ja)
WO (1) WO2006018993A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI542206B (zh) 2013-07-30 2016-07-11 杜比實驗室特許公司 用於產生場景穩定的元資料之系統和方法
CN109326307B (zh) * 2018-09-07 2020-12-11 江苏菲利斯通信息科技有限公司 光盘流式刻录方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11288562A (ja) * 1998-03-31 1999-10-19 Sanyo Electric Co Ltd データ処理装置
JP2003153200A (ja) * 2001-11-09 2003-05-23 Toshiba Corp Mpegストリームデータ記録装置、mpegストリームデータ記録方法、及びmpegストリームデータ編集方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3968605B2 (ja) 1996-09-25 2007-08-29 ソニー株式会社 オーサリング装置及びオーサリング方法
DE69721483T2 (de) * 1996-09-27 2004-03-18 Matsushita Electric Industrial Co., Ltd., Kadoma Edier-und Autorensystem für einen Multimedia-Datenstrom mit Überprüfung der Edierbefehle
US6096095A (en) * 1998-06-04 2000-08-01 Microsoft Corporation Producing persistent representations of complex data structures
JP2002328560A (ja) * 2001-04-26 2002-11-15 Minolta Co Ltd 画像形成装置
JP3773805B2 (ja) 2001-04-27 2006-05-10 Necエレクトロニクス株式会社 データストリーム生成方法とそのための装置
CN1427624A (zh) * 2001-12-20 2003-07-02 北京软媒视频技术研究院 一种新型视频压缩机
US6966023B2 (en) 2002-02-21 2005-11-15 Mediatek Incorporation Encoding method for an optical recorder
US7536088B2 (en) 2002-10-03 2009-05-19 Cyberlink Corp. Method of authoring DVD video record on an external storage device
GB2408869B (en) * 2003-11-04 2006-07-26 Zoo Digital Group Plc Data processing system and method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11288562A (ja) * 1998-03-31 1999-10-19 Sanyo Electric Co Ltd データ処理装置
JP2003153200A (ja) * 2001-11-09 2003-05-23 Toshiba Corp Mpegストリームデータ記録装置、mpegストリームデータ記録方法、及びmpegストリームデータ編集方法

Also Published As

Publication number Publication date
CN101032165A (zh) 2007-09-05
EP1784013A4 (en) 2010-03-10
CN101032165B (zh) 2010-06-16
WO2006018993A1 (ja) 2006-02-23
US8208791B2 (en) 2012-06-26
US20080292264A1 (en) 2008-11-27
EP1784013A1 (en) 2007-05-09

Similar Documents

Publication Publication Date Title
JP6501952B2 (ja) 再生装置
JP4197230B2 (ja) フォーマット変換装置、フォーマット変換方法、フォーマット変換処理プログラムおよびフォーマット変換処理プログラムを記録した記録媒体、並びに、情報記録装置、情報記録方法、情報記録処理プログラムおよび情報記録処理プログラムを記録した記録媒体
JP4863990B2 (ja) 情報記録媒体、tsパケット判定装置、及びデータ再生装置
JP4467737B2 (ja) 情報記録装置、情報記録方法及び記録制御プログラムが記録された情報記録媒体
JPWO2004082274A1 (ja) データ処理装置
JP2019079591A (ja) 再生装置、及び、再生方法
US20070041712A1 (en) Method and apparatus for reproducing data, recording medium, and method and apparatus for recording data
JP2002150683A (ja) 複数記録面対応の情報記録装置及び複数記録面対応の情報記録方法
EP1355311A2 (en) Information recording apparatus and information recording method
JP2019075819A (ja) デコーダシステムおよびデコード方法
US20070025696A1 (en) Recording medium, method and apparatus for reproducing data, and method and apparatus for recording data
JP2020119623A (ja) 再生方法及び再生装置
JP6272533B2 (ja) 再生方法、および再生装置
US8208791B2 (en) Authoring device, authoring method, authoring program, and recording medium containing the program
JP2019067481A (ja) 記録媒体
EP1911025A1 (en) Recording medium, method and apparatus for reproducing data, and method and apparatus for recording data
JP2007049461A (ja) 情報記録媒体、情報記録装置およびその方法
JP2005339691A (ja) 記録装置及び記録方法、再生装置及び再生方法、記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110607