JP3991540B2 - Recording apparatus and method, and recording medium - Google Patents

Recording apparatus and method, and recording medium Download PDF

Info

Publication number
JP3991540B2
JP3991540B2 JP35603799A JP35603799A JP3991540B2 JP 3991540 B2 JP3991540 B2 JP 3991540B2 JP 35603799 A JP35603799 A JP 35603799A JP 35603799 A JP35603799 A JP 35603799A JP 3991540 B2 JP3991540 B2 JP 3991540B2
Authority
JP
Japan
Prior art keywords
data
recording
audio
optical disc
file structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP35603799A
Other languages
Japanese (ja)
Other versions
JP2001176195A (en
Inventor
訓 辻井
誠 山田
敏弥 石坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP35603799A priority Critical patent/JP3991540B2/en
Priority to KR1020000056948A priority patent/KR100739357B1/en
Priority to EP00308498A priority patent/EP1089572B1/en
Priority to US09/676,645 priority patent/US7668437B1/en
Priority to CNB00136958XA priority patent/CN1197073C/en
Publication of JP2001176195A publication Critical patent/JP2001176195A/en
Application granted granted Critical
Publication of JP3991540B2 publication Critical patent/JP3991540B2/en
Priority to US12/642,969 priority patent/US20100092158A1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、圧縮符号化例えばMPEGで符号化されたビデオ信号および/またはオーディオ信号を光ディスクに対して記録するのに好適な記録装置および方法、並びに記録媒体に関する。
【0002】
【従来の技術】
近年、マルチメディア対応のシステムソフトウェアとして、QuickTime が知られている。QuickTime は、時系列的に変化するデータ(Movie と称される)を扱うためのソフトウェアである。Movie には、動画、音声および文字データが含まれる。現在、Apple がQuickTime ファイルフォーマットとして、Macintosh プラットフォーム上でのみ対応しているMPEG−1(Moving Picture Experts Group phase1) のプログラムストリーム(ビデオエレメンタリストリームとオーディオエレメンタリストリームを時間で多重化したデータ形式)ファイル格納形式がある。この格納形式では、MPEG−1ファイル全体、すなわち、1つの閉じたシーン全体をその時間の長さと無関係に、QuickTime ファイルフォーマットにおけるSampleに対応させ、且つその巨大なSampleを1つの巨大なChunk として扱っている。
【0003】
また、オーディオとビデオの各データをまとめてQuickTime ファイルフォーマットにおける1つのTrack 、そして、1つのMedia に格納している。このデータを理解するための新たなMedia TypeとしてMPEGMedia を定義し、その中で巨大なSample、Chunk の中に含まれているビデオデータやオーディオデータの理解を行っている。
【0004】
【発明が解決しようとする課題】
しかしながら、巨大なSample中の特定のデータに対するアクセス性が低下し、また、編集性が乏しい問題があった。例えばコンピュータにおいて、QuickTime による再生、編集を可能とするために、携帯形カメラ一体形記録再生装置における記録媒体例えば光ディスクへの映像音声データをQuickTime ファイルフォーマットに準拠して格納することが考えられる。この場合でも、特定のデータへのアクセス性が劣り、編集性が乏しい問題を解決する必要がある。ビデオデータに限らずオーディオデータの記録再生装置においても同様である。
【0005】
したがって、この発明の目的は、QuickTime のようなマルチメディアデータフォーマットに準拠したファイル構造を持つように、データ構造が変換されたデータを記録媒体に記録する時に、アクセス性の低下を防止し、編集性を向上できる記録装置および方法、並びに記録媒体を提供することにある。
【0006】
【課題を解決するための手段】
請求項1の発明は、上述した課題を達成するために、ビデオデータを書き換え可能な光ディスクに記録する記録装置において、
圧縮符号化によってビデオデータを符号化する符号化手段と、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、符号化手段からの符号化ビデオデータのデータ構造を変換する手段と、
ファイル構造を有するデータを光ディスクに記録する手段とからなり、
ファイル構造は、第1のデータ単位と、複数の第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の第2のデータ単位を光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録装置である。
【0007】
請求項2の発明は、オーディオデータを書き換え可能な光ディスクに記録する記録装置において、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、オーディオデータまたは符号化オーディオデータのデータ構造を変換する手段と、
ファイル構造を有するデータを光ディスクに記録する手段とからなり、
ファイル構造は、第1のデータ単位と、複数の第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の第2のデータ単位を光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録装置である。
【0008】
請求項3の発明は、ビデオデータおよびオーディオデータを書き換え可能な光ディスクに記録する記録装置において、
フレーム間予測符号化と動き補償とを組み合わせ、複数フレームのグループ構造を有する圧縮符号化によってビデオデータを符号化するビデオ符号化手段と、
圧縮符号化または非圧縮のオーディオデータを出力するオーディオ出力手段と、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、符号化手段からの符号化ビデオデータとオーディオ出力手段からのオーディオデータのデータ構造をそれぞれ変換し、ファイル構造を有する符号化ビデオデータとオーディオデータを多重化する手段と、
ファイル構造を有し、多重化されたデータを光ディスクに記録する手段とからなり、
ファイル構造は、第1のデータ単位と、複数の第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の第2のデータ単位を光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録装置である。
【0009】
請求項9の発明は、ビデオデータを書き換え可能な光ディスクに記録する記録方法において、
圧縮符号化によってビデオデータを符号化するステップと、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、符号化ビデオデータのデータ構造を変換するステップと、
ファイル構造を有するデータを光ディスクに記録するステップとからなり、
ファイル構造は、第1のデータ単位と、複数の第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の第2のデータ単位を光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録方法である。
【0010】
請求項10の発明は、オーディオデータを書き換え可能な光ディスクに記録する記録方法において、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、オーディオデータまたは符号化オーディオデータのデータ構造を変換するステップと、
ファイル構造を有するデータを光ディスクに記録するステップとからなり、
ファイル構造は、第1のデータ単位と、複数の第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の第2のデータ単位を光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録方法である。
【0011】
請求項11の発明は、ビデオデータおよびオーディオデータを書き換え可能な光ディスクに記録する記録方法において、
フレーム間予測符号化と動き補償とを組み合わせ、複数フレームのグループ構造を有する圧縮符号化によってビデオデータを符号化するビデオ符号化のステップと、
圧縮符号化または非圧縮のオーディオデータを出力するオーディオ出力のステップと、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、符号化ビデオデータと出力されるオーディオデータのデータ構造をそれぞれ変換し、ファイル構造を有する符号化ビデオデータとオーディオデータを多重化するステップと、
ファイル構造を有し、多重化されたデータを光ディスクに記録するステップとからなり、
ファイル構造は、第1のデータ単位と、複数の第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の第2のデータ単位を光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録方法である。
【0012】
請求項12の発明は、ビデオデータを書き換え可能な光ディスクに記録するためのコンピュータ制御可能なプログラムが記録された記録媒体において、
プログラムは、
圧縮符号化によってビデオデータを符号化するステップと、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、符号化ビデオデータのデータ構造を変換するステップと、
ファイル構造を有するデータを光ディスクに記録するステップとからなり、
ファイル構造は、第1のデータ単位と、複数の第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の第2のデータ単位を光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録媒体である。
【0013】
請求項13の発明は、オーディオデータを書き換え可能な光ディスクに記録するためのコンピュータ制御可能なプログラムが記録された記録媒体において、
プログラムは、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、オーディオデータまたは符号化オーディオデータのデータ構造を変換するステップと、
ファイル構造を有するデータを光ディスクに記録するステップとからなり、
ファイル構造は、第1のデータ単位と、複数の第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の第2のデータ単位を光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録媒体である。
【0014】
請求項14の発明は、ビデオデータおよびオーディオデータを書き換え可能な光ディスクに記録するためのコンピュータ制御可能なプログラムが記録された記録媒体において、
プログラムは、
フレーム間予測符号化と動き補償とを組み合わせ、複数フレームのグループ構造を有する圧縮符号化によってビデオデータを符号化するビデオ符号化のステップと、
圧縮符号化または非圧縮のオーディオデータを出力するオーディオ出力のステップと、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、符号化ビデオデータと出力されるオーディオデータのデータ構造をそれぞれ変換し、ファイル構造を有する符号化ビデオデータとオーディオデータを多重化するステップと、
ファイル構造を有し、多重化されたデータを光ディスクに記録するステップとからなり、
ファイル構造は、第1のデータ単位と、複数の第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の第2のデータ単位を光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録媒体である。
【0015】
この発明によれば、光ディスクにファイル構造を有するデータを記録する時に、連続記録長を複数の第2のデータ単位(例えばQuickTime のChunk )に対応させているので、アクセス性、編集性を向上できる。また、符号化ビデオデータとオーディオデータ(圧縮または非圧縮)とのセットの複数個を連続記録長に対応させているので、アクセス性、編集性を向上できる。
【0016】
【発明の実施の形態】
以下、この発明の一実施形態について図面を参照して説明する。図1は、この発明の一実施形態におけるディジタル記録再生装置を示す。図1において、1がビデオ符号器を示す。ビデオ入力がビデオ符号器1に供給され、ビデオ符号器1において、ビデオ信号が圧縮符号化される。また、2がオーディオ符号器を示し、オーディオ入力がオーディオ符号器2においてオーディオ信号が圧縮符号化される。ビデオ信号およびオーディオ信号に対する圧縮符号化としては、例えばMPEGが使用される。ビデオ符号器1およびオーディオ符号器2のそれぞれの出力がエレメンタリストリームと称される。
【0017】
ビデオ符号器1は、MPEGの場合、動きベクトルを検出する動き予測部、ピクチャ順序並び替え部、入力映像信号とローカル復号映像信号間の予測誤差を形成する減算部、減算出力をDCT変換するDCT部、DCT部の出力を量子化する量子化部、量子化出力を可変長符号化する可変長符号化部、一定レートで符号化データを出力するバッファメモリとから構成される。ピクチャ順序並び替え部は、ピクチャの順序を符号化処理に適したものに並び替える。つまり、IおよびPピクチャを先に符号化し、その後、Bピクチャを符号化するのに適した順序にピクチャを並び替える。ローカル復号部は、逆量子化部、逆DCT部、加算部、フレームメモリおよび動き補償部で構成される。動き補償部では、順方向予測、逆方向予測、両方向予測が可能とされている。イントラ符号化の場合では、減算部は、減算処理を行わず、単にデータが通過する。また、オーディオ符号器2は、サブバンド符号化部、適応量子化ビット割り当て部等で構成される。
【0018】
一例として、携帯形カメラ一体ディスク記録再生装置の場合では、ビデオカメラで撮影された画像がビデオ入力とされ、マイクロホンで集音された音声がオーディオ入力とされる。ビデオ符号器1およびオーディオ符号器2では、アナログ信号がディジタル信号へ変換されて処理される。また、この一実施形態では、書き換え可能な光ディスクを記録媒体として使用する。この種の光ディスクとしては、光磁気ディスク、相変化型ディスク等を使用できる。一実施形態では、比較的小径の光磁気ディスクを使用している。
【0019】
ビデオ符号器1およびオーディオ符号器2の出力がファイル生成器5に供給される。ファイル生成器5は、特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、ビデオエレメンタリストリームおよびオーディオエレメンタリストリームのデータ構造を変換する。この一実施形態では、ソフトウェアとして例えばQuickTime を使用する。QuickTime が処理する時系列的に変化する一連のデータ(ビデオデータ、オーディオデータ、テキストデータ)は、QuickTime ムービー(Movie) と称される。また、ファイル生成器5では、符号化ビデオデータおよび符号化オーディオデータが多重化される。QuickTime ムービーファイルの構造を作成するために、システム制御マイコン9によってファイル生成器5が制御される。
【0020】
ファイル生成器5からのQuickTime ムービーファイルがメモリコントローラ8を介してメモリ7に順次書き込まれる。メモリコントローラ8に対して、システム制御マイコン(マイクロコンピュータ)9からディスクへのデータ書き込み要求が入力されると、メモリコントローラ8によって、メモリ7からQuickTime ムービーファイルが読み出される。ここで、QuickTime ムービー符号化の転送レートは、ディスクへの書き込みデータの転送レートより低く、例えば約1/2とされている。したがって、QuickTime ムービーファイルが連続的にメモリ7に書き込まれるのに対して、メモリ7からの読み出しは、メモリ7がオーバーフローまたはアンダーフローしないことをシステム制御マイコン9が監視しながら間欠的に行われる。
【0021】
メモリコントローラ8を介してメモリ7から読み出されたQuickTime ムービーファイルがエラー訂正符号/復号器11に供給される。エラー訂正符号/復号器11は、QuickTime ムービーファイルを一旦メモリ10に書き込み、インターリーブおよびエラー訂正符号の冗長データの生成の処理を行い、冗長データが付加されたデータをメモリ10から読み出す。
【0022】
エラー訂正符号/復号器11の出力がデータ変復調器13に供給される。データ変復調器13は、ディジタルデータをディスクに記録する時に、再生時のクロック抽出を容易とし、符号間干渉のような問題が生じないように、データを変調する。例えばRLL(1,7)を使用できる。
【0023】
データ変復調器13の出力が磁界変調ドライバ14に供給されると共に、光ピックアップ23を駆動するための信号を出力する。磁界変調ドライバ14は、入力された信号に応じて磁界ヘッド22を駆動して光ディスク20に磁界を印加する。光ピックアップ23は、記録用のレーザビームを光ディスク20に照射する。このようにして光ディスク20に対してデータが記録される。光ディスク20は、モータ21によって、CLV(線速度一定),CAV(角速度一定),またはZCAV(ゾーンCLV)で回転される。
【0024】
メモリコントローラ8から読み出される間欠的なデータを光ディスク20へ記録するので、通常は、連続的な記録動作がなされず、一定のデータ量を記録したら記録動作を中断し、次の記録要求まで待機するように、記録動作が間欠的になされる。
【0025】
また、システム制御マイコン9からの要求に応じて、ドライブ制御マイコン12がサーボ回路15に要求を出し、ディスクドライブ全体の制御がなされる。それによって記録動作がなされる。サーボ回路15によって、光ピックアップ23のディスク径方向の移動のサーボ、トラッキングサーボ、フォーカスサーボがなされ、また、モータ21のスピンドルサーボがなされる。図示しないが、システム制御マイコン9と関連してユーザの操作入力部が設けられている。
【0026】
次に、再生のための構成および動作について説明する。再生時には、再生用のレーザビームを光ディスク20に照射し、光ディスク20からの反射光を光ピックアップ23中のディテクタによって再生信号へ変換する。この場合、光ピックアップ23のディテクタの出力信号からトラッキングエラーおよびフォーカスエラーが検出され、読み取りレーザビームがトラック上に位置し、トラック上に合焦するように、サーボ回路15により制御される。また、光ディスク20上の所望の位置のデータを再生するために、光ピックアップ23の径方向の移動が制御される。
【0027】
再生時においても、記録時と同様に、QuickTime ムービーファイルの転送レーザよりも高い、例えば2倍のレートで光ディスク20からデータを再生する。この場合では、通常、連続的な再生が行われず、一定のデータ量を再生したら再生動作を中断し、次の再生要求まで待機するような間欠的な再生動作がなされる。再生時動作において、記録動作と同様に、システム制御マイコン9からの要求に応じて、ドライブ制御マイコン12がサーボ回路15に要求を出して、ディスクドライブ全体の制御がなされる。
【0028】
光ピックアップ23からの再生信号がデータ変復調器13に入力され、復調処理がなされる。復調後のデータがエラー訂正符号/復号器11に供給される。エラー訂正符号/復号器11においては、再生データを一旦メモリ10に書き込み、デインターリーブ処理およびエラー訂正処理がなされる。エラー訂正後のQuickTime ムービーファイルがメモリコントローラ8を介してメモリ7に書き込まれる。
【0029】
メモリ7に書き込まれたQuickTime ムービーファイルは、システム制御マイコン9の要求に応じて、多重化を解く同期のタイミングに合わせてファイル復号器6に出力される。システム制御マイコン9は、ビデオ信号およびオーディオ信号を連続再生するために、光ディスク20から再生されてメモリ7に書き込まれるデータ量とメモリ7から読み出してファイル復号器6に出力されるデータ量を監視し、メモリ7がオーバーフローまたはアンダーフローしないように、メモリコントローラ8およびドライブ制御マイコン12を制御し、光ディスク20からのデータの読み出しを行う。
【0030】
ファイル復号器6では、システム制御マイコン9の制御の下で、QuickTime ムービーファイルをビデオエレメンタリストリームおよびオーディオエレメンタリストリームに分解する。ビデオエレメンタリストリームがビデオ復号器3に供給され、オーディオエレメンタリストリームがオーディオ復号器4に供給される。ファイル復号器6からのビデオエレメンタリストリームおよびオーディオエレメンタリストリームは、両者が同期するように出力される。
【0031】
ビデオ復号器3およびオーディオ復号器4は、圧縮符号化の復号をそれぞれ行い、ビデオ出力およびオーディオ出力を発生する。例えばMPEGがビデオ信号およびオーディオ信号の圧縮符号化として使用される。図示しないが、ビデオ出力が表示ドライブを介してディスプレイ(液晶等)に出力され、表示され、オーディオ出力がオーディオアンプを介してスピーカに対して出力され、再生される。
【0032】
ビデオ復号器3は、バッファメモリ、可変長符号復号部、逆DCT部、逆量子化部、逆量子化部の出力とローカル復号出力を加算する加算部、ピクチャ順序並び替え部並びにフレームメモリおよび動き補償部からなるローカル復号部によって構成されている。イントラ符号化の場合では、加算部での加算処理がなされず、データが加算部を通過する。加算部からの復号データがピクチャ順序並び替え部によって元の画像の順序とされる。
【0033】
なお、上述したようにデータが記録された光ディスク20は、着脱自在のものであるので、他の機器でも再生できる。例えばQuickTime のアプリケーションソフトウェアで動作するパーソナルコンピュータが光ディスク20に記録されているデータを読み取り、パーソナルコンピュータによって記録されているビデオおよびオーディオデータを再生することができる。さらに、この発明は、ビデオデータのみ、またはオーディオデータのみを扱う場合に対しても適用することができる。
【0034】
上述したこの発明の一実施形態についてより詳細に説明する。先ず、QuickTime について、図2を参照して概略的に説明する。QuickTime は、一般的には、特殊なハードウエアを用いずに動画を再生するためのOSの拡張機能である。取り扱い可能なデータ形式は、多様で32Track までの音声、動画、MIDIなどの出力を同期させることができる。
【0035】
QuickTime ムービーファイルは、大きくは、Movie ResourceとMovie Dataの二つの部分に分かれている。Movie Resourceの部分には、そのQuickTime ファイルを再生するのに必要な時間や、実データ参照のための情報が格納されており、Movie Data部分には、ビデオやオーディオの実データが格納されている。
【0036】
一つのQuickTime ムービーファイルには、サウンド、ビデオ、テキストといった異なるタイプのMedia Dataをそれぞれ別のTrack として格納することができ、Sound Track,Video Track , Text Trackと呼ばれ、時間軸で厳密に管理されている。各Track には、それぞれの実データの圧縮方式や格納場所と表示時間を参照するためのMedia を有している。Media の中で、実データをMovie Data部分にどのような単位で格納されているかを示す最小単位のSampleのサイズや、そのSampleを複数個集めてブロック化したChunk の格納場所や、各Sampleの表示時間などの情報を格納している。
【0037】
図2は、オーディオデータと画像データとを扱うQuickTime ムービーファイルの一例を示す。QuickTime ムービーファイルの最も大きな構成部分は、Movie Resource部分とMovie Data部分とである。Movie Resource部分には、そのファイルを再生するために必要な時間や実データ参照のためのデータが格納される。また、Movie Data部分には、ビデオ、オーディオ等の実データが格納される。
【0038】
Movie Resource部分について詳細に説明する。Movie Resource部分50と、ムービーデータに格納した個々のデータに関する情報を記述するトラック部51と、個々のデータに関する情報を記述するメディア部52と、メディアインフォメーション部53と、サンプルテーブル部54との階層構造を有する。このResourceは、一つのVideo Track に関するものであり、図示を省略するが、オーディオトラックに関しても同様の構造のResource55が記述される。
【0039】
Movie Resource部分50には、ファイル全体に係わる情報を記述するムービーヘッダ41が含まれる。トラック部51には、トラック全体に係る情報を記述するTrack ヘッダ42が含まれる。メディア部52には、メディア全体に係る情報を記述するMedia ヘッダ43、Media データの取り扱いに係る情報を記述するMedia ハンドラ44が含まれる。Media インフォメーション部53には、画像メディアに係る情報を記述するMedia ヘッダ45、画像データの取り扱いに係る情報を記述するデータハンドラ46、およびデータについての情報を記述するデータインフォーメーション47が含まれる。サンプルテーブル部54には、各Sampleについての記述を行うサンプルデスクリプション57、Sampleと時間軸の関係を記述するタイム−ツーサンプル、Sampleの大きさを記述するSampleサイズ48、SampleとChunk の関係を記述するサンプル−ツーChunk と、ムービーファイル内でのChunk の開始バイト位置を記述するChunk オフセット49、同期に係る記述を行うシンクサンプル等が格納されている。
【0040】
一方、Movie Data部56には、例えばMPEGオーディオレイヤ2に基づく圧縮符号化方式によって符号化されたオーディオデータ、および例えばMPEG規定に従う圧縮符号化方式によって符号化された画像データがそれぞれ所定数のSampleからなるChunk を単位として格納されている。勿論、符号化方式はこれらに限定されるものではなく、また、圧縮符号化が施されていないリニアデータを格納することも可能である。
【0041】
Movie Resource部分における各Track と、Movie Data部分に格納されているデータとは対応付けられている。すなわち、図2に示した一例は、オーディオデータと画像データとを扱うものなので、Movie Resource部分にビデオデータについてのTrack とオーディオデータについてのTrack とが含まれ、Movie Data部分に、オーディオデータの実データと画像データの実データとが含まれている。他の種類のデータを扱う場合には、Movie Resource部分におけるTrack 、およびMovie Data部分における実データの内容を、扱うべきデータに合わせれば良い。例えばテキスト、MIDI等を扱う場合には、Movie Resource部分にテキスト、MIDI等についてのTrack を含むようにし、Movie Data部分に、テキスト、MIDI等の実データを含むようにすれば良い。
【0042】
図3および図4は、QuickTime におけるMovie Resourceのより詳細なデータ構成を示すものである。図3および図4は、本来は、一つの図であるが、作図スペースの制約から分割してResourceのデータ構成を示すものである。図2を参照して説明したように、Movie Resource部分50は、ムービーデータに格納した個々のデータに関する情報を記述するトラック部51と、個々のデータに関する情報を記述するメディア部52と、メディアインフォメーション部53と、サンプルテーブル部54との階層構造を有する。このResourceは、一つのVideo Track に関するものであり、図示を省略するが、オーディオトラックに関しても同様の構造のResource55が記述される。
【0043】
次に、圧縮符号化復号化方法としてMPEG2を用いた場合、圧縮されたビデオデータ(ビデオエレメンタリストリーム)および圧縮されたオーディオデータ(オーディオエレメンタリストリーム)をQuickTime ファイルフォーマットに変換する方法について説明する。ここで、MPEGについて説明すると、MPEGは、上位から順にシーケンス層、GOP層、ピクチャ層、スライス層、マクロブロック層、ブロック層の6層の階層構造を有している。各層の先頭にヘッダが付加される。例えばシーケンスヘッダは、シーケンス層の先頭に付加されるヘッダであり、シーケンス開始コード、画面の水平および垂直サイズ、アスペクト比、ピクチャレート、ビットレート、VBVバッファサイズ、制約パラメータビット、2つの量子化マトリックスのロードフラグと内容などが含まれている。
【0044】
また、MPEGの場合では、ピクチャタイプとして、I、P、Bの3種類が存在する。Iピクチャ(Intra-coded picture:イントラ符号化画像) は、符号化されるときその画像1枚の中だけで閉じた情報を使用するものである。従って、復号時には、Iピクチャ自身の情報のみで復号できる。Pピクチャ(Predictive-coded picture :順方向予測符号化画像)は、予測画像(差分をとる基準となる画像)として、時間的に前の既に復号されたIピクチャまたはPピクチャを使用するものである。動き補償された予測画像との差を符号化するか、差分を取らずに符号化するか、効率の良い方をマクロブロック単位で選択する。Bピクチャ(Bidirectionally predictive-coded picture :両方向予測符号化画像)は、予測画像(差分をとる基準となる画像)として、時間的に前の既に復号されたIピクチャまたはPピクチャ、時間的に後ろの既に復号されたIピクチャまたはPピクチャ、並びにこの両方から作られた補間画像の3種類を使用する。この3種類のそれぞれの動き補償後の差分の符号化と、イントラ符号化の中で、最も効率の良いものをマクロブロック単位で選択する。
【0045】
従って、マクロブロックタイプとしては、フレーム内符号化(Intra) マクロブロックと、過去から未来を予測する順方向(Foward)フレーム間予測マクロブロックと、未来から過去を予測する逆方向(Backward)フレーム間予測マクロブロックと、前後両方向から予測する両方向マクロブロックとがある。Iピクチャ内の全てのマクロブロックは、フレーム内符号化マクロブロックである。また、Pピクチャ内には、フレーム内符号化マクロブロックと順方向フレーム間予測マクロブロックとが含まれる。Bピクチャ内には、上述した4種類の全てのタイプのマクロブロックが含まれる。
【0046】
そして、MPEGでは、ランダムアクセスを可能とするために、複数枚のピクチャのまとまりであるGOP(Group Of Picture)構造が規定されている。GOPに関するMPEGの規則では、第1にビットストリーム上で、GOPの最初がIピクチャであること、第2に、原画像の順で、GOPの最後がIまたはPピクチャであることが規定されている。また、GOPとしては、以前のGOPの最後のIまたはPピクチャからの予測を必要とする構造も許容されている。以前のGOPの画像を使用しないで復号できるGOPは、クローズドGOPと称される。この一実施形態では、クローズドGOPの構造とし、GOP単位の編集を可能としている。
【0047】
また、MPEGオーディオ(圧縮方式)としては、レイヤ1、レイヤ2およびレイヤ3の3個のモードが規定されている。例えばレイヤ1では、32サブバンド符号化および適応ビット割り当てがなされ、1オーディオ復号単位が384サンプルとされている。1オーディオ復号単位は、オーディオビットストリームの1オーディオフレームのことである。オーディオ復号単位が単独で符号化データをオーディオデータへ復号できる最小単位である。ビデオデータについても、同様に1ビデオフレームに対応するビデオ復号単位が規定されている。1ビデオフレームは、NTSC方式では、1/30秒である。通常、レイヤ1のオーディオのビットレートは、ステレオで256kbpsである。また、レイヤ2では、32サブバンド符号化および適応ビット割り当てがなされ、1オーディオ復号単位が1152サンプルとされている。通常、レイヤ2のオーディオのビットレートは、ステレオで192kbpsである。
【0048】
ファイル生成器5は、上述したQuickTime ファイルフォーマットに準拠したファイル構造へMPEGで圧縮されたビデオおよびオーディオデータを変換する。図5は、ビデオフレームと、GOPと、QuickTime ファイルフォーマットでのSampleとChunk の単位との関係を示す。上述したように、Sampleは、Movie データ中の最小単位であり、Chunk は、複数のSampleを集めてブロック化した単位である。
【0049】
図5Aに示すように、原ビデオ信号の例えば15ビデオフレームがMPEG2で圧縮符号化され、1GOPとされる。15ビデオフレームは、0.5秒の時間である。GOPは、好ましくは、クローズドGOPの構造とされる。各GOPの先頭にシーケンスヘッダ(SH)が付加される。シーケンスヘッダとGOPとを1つのビデオ復号単位とする。シーケンスヘッダをGOPごとに付加することによって、QuickTime で直接Sample単位のアクセスとそのデータの復号とが可能となる。図1中のビデオ符号器1が図5Aに示すMPEGビデオエレメンタリストリームを出力する。
【0050】
図5Bに示すように、ビデオ復号単位の1つをQuickTime ファイルフォーマットの1Sampleとする。時間的に連続する2個のSample(例えばSample#0,Sample#1) を1つのビデオChunk (例えばChunk#0)と対応させる。1ビデオChunk の長さは、1秒であり、3個のビデオChunk の長さが3秒となる。なお、1Sampleに6個のGOPを対応させ、1ビデオChunk に1Sampleを対応させるようにしても良い。その場合でも、1ビデオChunk の時間長が3秒となる。
【0051】
図6は、MPEGオーディオのレイヤ2の符号化(2チャンネルステレオで256kbps)を行う時のオーディオフレームと、オーディオ復号単位と、QuickTime ファイルフォーマットでのSampleとオーディオChunk の単位との関係を示す。レイヤ2においては、オーディオサンプルの1152サンプル/チャンネルが1オーディオフレームとされる。図6Aに示すように、ステレオの場合、1152サンプル×2チャンネルのオーディオデータがレイヤ2で符号化され、1つのオーディオ復号単位とされる。1つのオーディオ復号単位には、圧縮符号化後の384バイト×2チャンネルのデータが含まれる。オーディオ復号単位中には、ヘッダおよび復号に必要な情報(アロケーション、スケールファクタ等)が含まれる。
【0052】
図6Bに示すように、オーディオ復号単位の1つをQuickTime ファイルフォーマットの1Sampleとする。したがって、QuickTime でSample単位でオーディオの復号が可能となる。時間的に連続する41個のSample(例えばSample#0〜Sample#40 ) を1つのオーディオChunk (例えばChunk #0) と対応させ、時間的に連続する42個のSample(例えばSample#41 〜Sample#82 ) を1つのオーディオChunk (例えばChunk #1) と対応させ、時間的に連続する42個のSample(例えばSample#83 〜Sample#124) を1つのオーディオChunk (例えばChunk #2) と対応させる。1オーディオChunk の長さは、オーディオのサンプリング周波数を48kHzとするときに、約1秒である。したがって、3個の連続するオーディオChunk は、3秒の長さとなる。
【0053】
図5および図6は、ビデオデータの構造とオーディオデータの構造とを別々に示しているが、ファイル生成器5では、これらを一つのデータストリームとして多重化(インターリーブとも称される)し、QuickTime ムービーファイルを形成する。QuickTime ムービーファイルでは、ビデオChunk とオーディオChunk とがMovie データ内で交互に存在する。この場合、同じ時間に同期させて再生するオーディオChunk と、ビデオChunk (例えば図5BのビデオChunk#0 と図6BのオーディオChunk#0 )とが対応したものとなるように、関連するビデオおよびオーディオChunk が隣接して配される。上述したように、1つのビデオChunk に含まれるビデオデータの時間長と、1つのオーディオChunk に含まれるオーディオデータの時間長とが等しく、例えば1秒に選ばれている。1個のオーディオChunk の時間長は、厳密には1秒ではないが、3個のビデオChunk の時間長と3個のオーディオChunk の時間長とは、等しく3秒となる。
【0054】
オーディオの圧縮符号化の他の例として、ミニディスクで採用されているATRAC(Adaptive Transform Acoustic Coding)を使用しても良い。ATRACでは、44.1kHzでサンプリングした1サンプル16ビットのオーディオデータを処理する。ATRACでオーディオデータを処理する時の最小のデータ単位がサウンドユニットである。ステレオの場合、1サウンドユニットは、512サンプル×16ビット×2チャンネルである。
【0055】
ATRACをオーディオ圧縮符号化として採用する場合には、図7Aに示すように、1サウンドユニットが212バイト×2チャンネルのオーディオ復号単位に圧縮される。図7Bに示すように、1オーディオ復号単位をQuickTime ファイルフォーマットの1Sampleに対応させる。また、64個のSampleをQuickTime ファイルフォーマットの1オーディオChunk に対応させる。
【0056】
また、オーディオ圧縮符号化としては、MPEGオーディオレイヤー3、ATRACの圧縮率をより高めたATRAC3等も使用できる。さらに、この発明は、オーディオデータを圧縮しないで記録するようにしても良い。圧縮しない方式をリニアPCMと称する。リニアPCMにおいても、512個のオーディオサンプルを1個のオーディオ復号単位とし、1個のオーディオ復号単位をQuickTime ファイルフォーマットの1Sampleに対応させる。
【0057】
図8は、ビデオとオーディオを多重化した場合における、ビデオに関してのQuickTime ファイルフォーマットを示す。図8Aに示すように、ビデオフレームの周期をt0秒とし、1GOPに含まれるフレーム数をf0としている。原ビデオデータがMPEG2で符号化されることによって、図8Bに示すMPEGビデオエレメンタリストリームが形成される。上述したように、GOPごとにシーケンスヘッダ(SH)が付加されている。
【0058】
そして、図8Cに示すように、シーケンスヘッダが付加されたGOPがQuickTime ファイルフォーマットの1Sampleに対応付けられる。1Sampleの大きさは、Sampleサイズと称される。複数Sample例えば上述した6個のSampleによってQuickTime ファイルフォーマットの1Chunk が構成される。図8Dに示すように、ビデオChunk とオーディオChunk とがMovie データ内に交互に配されることによって多重化され、QuickTime ムービーファイルが構成される。QuickTime ムービーファイル上で各ビデオChunk の先頭の位置がビデオChunk オフセットと称される。ビデオChunk オフセットは、ファイルの先頭からそのビデオChunk の先頭の位置までのバイト数で表される。
【0059】
図9は、ビデオとオーディオを多重化した場合における、オーディオに関してのQuickTime ファイルフォーマットを示す。図9では、信号処理の順番に沿って図の下側から上側に向かってA、B、C、Dの分図記号が付されている。図9Aに示すように、原オーディオ信号がディジタル化され、1オーディオフレーム内にf0音声サンプル×nチャンネルが含まれる。原オーディオデータがMPEGオーディオで圧縮符号化されることによって、図9Bに示すMPEGオーディオエレメンタリストリームが形成される。
【0060】
そして、図9Cに示すように、例えば1個のオーディオ復号単位がQuickTime ファイルフォーマットの1Sampleに対応付けられる。1Sampleの大きさは、Sampleサイズと称される。複数Sample例えば上述した125個のSampleによってQuickTime ファイルフォーマットの1オーディオChunk が構成される。図9Dに示すように、ビデオChunk とオーディオChunk とが時間軸上に交互に配されることによって多重化され、QuickTime ムービーファイルが構成される。QuickTime ムービーファイル上で各オーディオChunk の先頭の位置がオーディオChunk オフセットと称される。オーディオChunk オフセットは、ファイルの先頭からそのオーディオChunk の先頭の位置までのバイト数で表される。ビデオChunk およびオーディオChunk の時間長は、互いに等しく、1秒または3秒とされる。
【0061】
ビデオSampleのSampleサイズ、オーディオSampleのSampleサイズ、ビデオChunk オフセットの値、オーディオChunk オフセットの値は、そのQuickTime ムービーファイルのResource中に記述される。それによって、各Chunk 中の各Sampleを特定することが可能となり、Sample単位(復号単位)で編集を行うことができる。
【0062】
上述したように、ビデオChunk とオーディオChunk とが多重化(インターリーブ)されたQuickTime ムービーファイルを光ディスク20に対して記録する時の記録方法について説明する。上述したように、QuickTime ムービーファイルは、大きくは、Movie ResourceとMovie Dataの二つの部分に分かれている。QuickTime ムービーファイルを光ディスク20に記録する時には、Movie Resourceと、Movie Data(実データ)のChunk (ビデオChunk またはオーディオChunk )の複数個をディスク上の連続記録長に対応させる。連続記録長とは、1回のアクセス、すなわち、光ピックアップ23のジャンプ動作を伴わないで、連続したアドレスに書き込み可能な長さのことである。
【0063】
また、ビデオChunk とオーディオChunk とが多重化されている場合には、Movie Data中の互いに対応する(隣接している)オーディオChunk とビデオChunk のセットの複数個を連続記録長に対応させる。図10に示すように、同期して再生されるべき、図5Bに示す1秒分のビデオChunk #iと、図6Bに示す約1秒分のオーディオChunk #iとからなるセットを3個集めた3秒分のデータが光ディスク上の連続記録長に対応される。例えば(オーディオChunk #1,ビデオChunk #1,〜オーディオChunk #3,ビデオChunk #3)の3秒分のデータが1個の連続記録長と対応するように、記録される。
【0064】
図10に示すように、光ディスク20上の連続記録長の位置は、物理的には不連続である。したがって、Movie Resourceを最初に再生し、次に最初のオーディオChunk およびビデオChunk を再生するまでの間のように、二つの連続記録長を再生する間では、トラックジャンプが生じる。しかしながら、上述したように、書き込み/読み出しデータの転送レートがQuickTime ムービーファイルの転送レートより高いもの、例えば2倍に選定されているので、間欠的な読み出しがなされても、連続したQuickTime ムービーファイルを再生することができる。
【0065】
このように、QuickTime ムービーファイルの転送レート、光ディスクの読み出しレート、連続記録長の時間、ディスクドライブのシークタイム(あるトラックから異なるトラックにジャンプして再生するまでの時間)は、相互に関係している。したがって、連続記録長に記録されるビデオおよびオーディオデータの時間は、3秒以外に種々選ぶことができる。連続記録長に記録されるビデオデータのビデオフレーム数の時間に対応する時間に、整数個のオーディオサンプルが含まれることが好ましい。
【0066】
上述した実施形態において、ビデオまたはオーディオのみを光ディスク上に記録すること、ビデオおよびオーディオを多重化して光ディスク上に記録することが可能とされており、さらに、連続記録長として、1個または複数個のChunk が含まれる場合が可能とされる。したがって、一実施形態では、オーディオChunk 、ビデオChunk をどのよう単位で光ディスク上で連続記録長としているかを示す情報をQuickTime ムービーファイル内のMovie Resource部(管理情報部)に格納する。すなわち、オーディオTrack と、ビデオTrack のデータがどのように連続記録の対象となっているかをファイル内の管理データ部の情報を見ればわかるようにしている。この情報としては、連続記録の対象となるトラックの関係を示す情報と、連続記録長に含まれるChunk (またはセット)の個数の情報とである。
【0067】
具体的には、QuickTime ムービーファイル内のMovie Resource部の中に存在するサンプルデスクリプション57(図2および図4参照)の部分に上述した情報を記述する。図11は、ビデオとオーディオの二つのトラックで構成されるQuickTime ムービーファイルの一般的な構造を示す。サンプルデスクリプション57には、主としてサンプルデータを解釈するために必要な情報として、CODEC(圧縮伸張方式)や、その属性に関する各種の情報を格納することができる。
【0068】
図12は、サンプルデスクリプション57をより詳細に示す。この一実施形態は、サンプルデスクリプション57内で通常使用される情報格納領域に加えて、図12中に示すように、7つのフィールドを追加定義する。なお、Data format のフィールドは、オーディオやビデオの圧縮方式等のフォーマットタイプを識別するための情報である。本例では、MPEG2のビデオと、MPEGオーディオレイヤー2のオーディオデータを記録する時に、フォーマットタイプの一例としてDMPGという文字列を格納する。
【0069】
また、拡張した7つのフィールドはセットで定義するものである。これは、QuickTime のMovie Resourceの基本的な構造単位に似せて、拡張した部分全体に渡っての「サイズ」に始まり、その拡張した内容を認識するための「タイプ」、そして実際の拡張した「データ」が続く構造を持たせている。
【0070】
具体的には、本例では、4バイトのExtension sizeの部分に、拡張した7つのフィールド全部のサイズ(バイト数)を格納し、どこまでが拡張した部分なのかを識別する。続いて、4バイトのExtension typeの部分に、拡張した内容を認識するタイプ名として、例えばstdeという文字列を格納することにする。つまり、このタイプ名(stde)により、拡張して定義するディスク上の連続記録の対象としているトラックやそのChunk の情報をデータとして格納していることを理解する。そして、その情報データとして5種類(Flags,Track ID,Data reference index,Recorded data size,Repeat number)のフィールドを定義し、各々に以下に示す内容を格納する。
【0071】
1バイトのFlags には、Track ID,Data reference index,Recorded data size,Repeat numberに格納するデータの解釈方法に関する情報フラグを格納する。4バイトのTrack ID、2バイトの Data reference index 、2バイトのRecorded data size、1バイトの Repeat numberには、オーディオやビデオのトラックのChunk がどのような単位でインターリーブされて、且つ連続記録されているのかを示す情報を複合的に格納している。
【0072】
Flags は、主に、その値によって異なるトラックのChunk がインターリーブ(値:4)されてディスク上に連続書きされていか、それとも単独(値:0)であるかを示す。
【0073】
Track IDは、ムービーファイルにおいて、図2や図3のTrack ヘッダ42内に格納されているトラックのインデックスの識別値である。また、その値は、一つのムービーファイルの中で重複することのないものである。この値を用いることで、どのトラックに対して連続書きの対象としているかを規定する。
【0074】
Data reference index は、トラック内に存在するサンプルディスクリプション57(図11に詳細に示す)において、そのサンプルの詳細情報を格納するSample description table毎に1つ割り当てられる識別値である。通常は、1つのサンプルディスクリプション内には、1つのSample description tableが格納されるが、ムービーファイルの編集後などにおいては、複数のSample description tableを格納することもある。また、その値は、一つのトラックの中で重複することのないものである。この値を用いることで、どのSample description tableで記述されているサンプル情報を持つサンプルで構成されるChunk に対して連続書きの対象としているかを規定する。
【0075】
Recorded data sizeには、Track IDと Data reference index で指定した一つのトラックのChunk が、ディスク上で連続記録されているChunk のき最小個数を指定する。
【0076】
Repeat numberは、Track ID, Data reference index ,Recorded data sizeで指定したトラックのChunk のセットが複数回繰り返してディスク上に連続記録されるときの回数を指定する。
【0077】
以上の5つのデータフィールドを組み合わせて、どのトラックのChunk が、どういう並び順で、どういう個数の単位で、セットとしてディスク上に連続記録されているかを示す情報を格納する。
【0078】
以降、例を示して説明する。簡単のため、オーディオとビデオのトラックが一つずつ存在するムービーファイル、もしくはオーディオのトラックのみのムービーファイルについて述べる。
【0079】
第1の例を図13Aに示す。第1の例は、オーディオのトラック(Track ID=1)とビデオのトラック(Track ID=2)が存在し、オーディオのChunk ( Data reference index =1)とビデオのChunk ( Data reference index =1)が1個ずつ交互で、先にオーディオChunk 、続いてビデオChunk の順にディスク上に連続書きされている場合である。この場合では、上述した5つのデータフィールドには、
オーディオのトラック
Flags=4
Track ID =2
Data reference index =1
Recorded data size =1
Repeat number=1
ビデオのトラック
Flags=4
Track ID =0
Data reference index =0
Recorded data size =1
Repeat number=1
のような値が格納される。
【0080】
これらの値において、2つのトラックはインターリーブされて配置されているので、 Flagsフィールドは、双方のトラックにおいて、インターリーブ形式であることを示すための値として、4という値を与える。
【0081】
2つのトラックの依存関係は、オーディオChunk と、その後に連結したビデオChunk という順序の状態でセットとしているので、そのための記述として先に配置されているオーディオ Trackの方にのみ、どのトラックのChunk と連結された依存関係を持つかを示すために、 Track ID フィールドにビデオ Trackの Track ID 値(2)、加えて Data reference index フィールドにビデオ Trackの Data reference index 値(1)を与える。
【0082】
逆に後ろ側のトラックであるビデオ Trackの方には、その後ろには連続書きの連結対象が存在しないことを示すために、 Track ID フィールドと Data reference index フィールドの双方に、不連続であることを示すための値(0)を与える。
【0083】
連続書きされているオーディオおよびビデオの TrackのChunk の個数として、 Recorded data size フィールドには、双方とも1Chunk ずつを示す値(1)を与える
また、そのオーディオとビデオのChunk を1個ずつの繰り返し回数として、
Repeat numberのフィールドには、双方とも1回ずつ(1)を与える。
【0084】
第2の例を図13Bに示す。第2の例は、オーディオのトラック(Track ID=1)とビデオのトラック(Track ID=2)が存在し、オーディオのChunk ( Data reference index =1)とビデオのChunk ( Data reference index =1)が1個ずつ交互で、先にビデオChunk 、続いてオーディオChunk の順にディスク上に連続書きされている場合である。この場合では、上述した5つのデータフィールドには、
オーディオのトラック
Flags=4
Track ID =0
Data reference index =0
Recorded data size =1
Repeat number=1
ビデオのトラック
Flags=4
Track ID =1
Data reference index =1
Recorded data size =1
Repeat number=1
のような値が格納される。
【0085】
第3の例を図13Cに示す。第3の例は、オーディオのトラック(Track ID=1)とビデオのトラック(Track ID=2)が存在し、オーディオのChunk ( Data reference index =1)が2個とビデオのChunk ( Data reference index =1)が1個の関係で、先にオーディオChunk が2個連続し、続いてビデオChunk が1個の順に、セットでディスク上に連続書きされている場合である。この場合では、上述した5つのデータフィールドには、
オーディオのトラック
Flags=4
Track ID =2
Data reference index =1
Recorded data size =2
Repeat number=1
ビデオのトラック
Flags=4
Track ID =0
Data reference index =0
Recorded data size =1
Repeat number=1
のような値が格納される。
【0086】
第4の例を図13Dに示す。第4の例は、オーディオのトラック(Track ID=1)とビデオのトラック(Track ID=2)が存在し、オーディオのChunk ( Data reference index =1)が1個とビデオのChunk ( Data reference index =1)が1個の関係で、先にオーディオChunk が1個、続いてビデオChunk が1個の順のセットが3回連続した単位で、ディスク上に連続書きされている場合である。この場合では、上述した5つのデータフィールドには、
オーディオのトラック
Flags=4
Track ID =2
Data reference index =1
Recorded data size =1
Repeat number=3
ビデオのトラック
Flags=4
Track ID =0
Data reference index =0
Recorded data size =1
Repeat number=3
のような値が格納される。
【0087】
第5の例を図13Eに示す。第5の例は、オーディオのトラック(Track ID=1)とビデオのトラック(Track ID=2)が存在し、オーディオのChunk ( Data reference index =1)が2個とビデオのChunk ( Data reference index =1)が1個の関係で、先にオーディオChunk が2個連続し、続いてビデオChunk が1個の順のセットが2回連続した単位で、ディスク上に連続書きされている場合である。この場合では、上述した5つのデータフィールドには、
オーディオのトラック
Flags=4
Track ID =2
Data reference index =1
Recorded data size =2
Repeat number=2
ビデオのトラック
Flags=4
Track ID =0
Data reference index =0
Recorded data size =1
Repeat number=2
のような値が格納される。
【0088】
第6の例を図13Fに示す。第6の例は、オーディオのトラック(Track ID=1)のみが存在し、オーディオのChunk ( Data reference index =1)が1個単位で、ディスク上に連続書きされている場合である。この場合では、上述した5つのデータフィールドには、
オーディオのトラック
Flags=0
Track ID =0
Data reference index =0
Recorded data size =1
Repeat number=1
のような値が格納される。
【0089】
第7の例を図13Gに示す。第7の例は、オーディオのトラック(Track ID=1)のみが存在し、オーディオのChunk ( Data reference index =1)が3個単位で、ディスク上に連続書きされている場合である。この場合では、上述した5つのデータフィールドには、
オーディオのトラック
Flags=0
Track ID =0
Data reference index =0
Recorded data size =3
Repeat number=1
のような値が格納される。
【0090】
なお、以上の説明では、携帯形カメラ一体形ディスク記録再生装置に対してこの発明を適用した例について説明したが、他の機器に対してもこの発明を適用できる。例えばディジタルスチルカメラ、ディジタルオーディオレコーダ/プレーヤ等にもこの発明を適用できる。
【0091】
さらに、この発明は、図1のブロック図に示すハードウエア構成の一部、または全体をソフトウェアによって実現するようにしても良い。また、このソフトウェアは、CD−ROM等のコンピュータによって読み取り可能な記録媒体に格納されて提供される。
【0092】
また、QuickTime について説明したが、それ以外に、複数の時系列的に変化する一連のデータを特殊なハードウエアを使用せずに同期して再生することを可能とするコンピュータソフトウェアに対してこの発明を適用しても良い。
【0093】
【発明の効果】
この発明によれば、光ディスクにファイル構造を有するデータを記録する時に、連続記録長を複数の第2のデータ単位(例えばQuickTime のChunk )に対応させているので、アクセス性、編集性を向上できる。また、この発明では、連続記録の対象となるトラックの関係を示す情報、並びに連続記録長に含まれるチャンクまたはセットの個数を示す情報を管理部に記録するので、連続記録を実行する対象を直ちに知ることができる。
【図面の簡単な説明】
【図1】この発明の一実施形態のブロック図である。
【図2】この発明を適用できるQuickTime ファイルフォーマットの一例を示す略線図である。
【図3】 QuickTime におけるMovie Resourceのより詳細なデータ構成を示す略線図である。
【図4】 QuickTime におけるMovie Resourceのより詳細なデータ構成を示す略線図である。
【図5】この発明の一実施形態におけるMPEGビデオのGOPとQuickTime のファイルフォーマットの関係を説明するための略線図である。
【図6】この発明の一実施形態における圧縮符号化オーディオとQuickTime のファイルフォーマットの関係の一例を説明するための略線図である。
【図7】この発明の一実施形態における圧縮符号化オーディオとQuickTime のファイルフォーマットの関係の他の例を説明するための略線図である。
【図8】この発明の一実施形態におけるMPEGビデオのGOPとQuickTime のファイルフォーマットの関係を説明するための略線図である。
【図9】この発明の一実施形態における圧縮符号化オーディオとQuickTime のファイルフォーマットの関係の一例を説明するための略線図である。
【図10】この発明の一実施形態における光ディスクへの記録方法の一例を説明するための略線図である。
【図11】ビデオとオーディオの二つのトラックで構成されるQuickTime ムービーファイルの一般的なデータ構成を示す略線図である。
【図12】この発明の一実施形態におけるサンプルデスクリプションのデータ構成をより詳細に示す略線図である。
【図13】この発明の一実施形態におけるチャンクフラグおよびチャンクナンバーの幾つかの例を説明するための略線図である。
【符号の説明】
1・・・ビデオ符号器、2・・・オーディオ符号器、3・・・ビデオ復号器、4・・・オーディオ復号器、5・・・ファイル生成器、6・・・ファイル復号器、20・・・光ディスク
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a recording apparatus and method suitable for recording a video signal and / or an audio signal encoded by compression encoding, for example MPEG, on an optical disc, and a recording medium.
[0002]
[Prior art]
In recent years, QuickTime is known as multimedia-compatible system software. QuickTime is software for handling data that changes over time (called Movie). Movie includes video, audio and text data. MPEG-1 (Moving Picture Experts Group phase 1) program stream currently supported by Apple as a QuickTime file format only on the Macintosh platform (data format in which a video elementary stream and an audio elementary stream are multiplexed in time) There is a file storage format. In this storage format, the entire MPEG-1 file, that is, one entire closed scene is associated with a sample in the QuickTime file format regardless of the length of time, and the huge sample is treated as one huge chunk. ing.
[0003]
Audio and video data are stored together in one track and one media in the QuickTime file format. MPEGMedia is defined as a new Media Type for understanding this data, and it understands video data and audio data contained in huge Samples and Chunks.
[0004]
[Problems to be solved by the invention]
However, there was a problem that the accessibility to specific data in a huge sample was lowered and the editability was poor. For example, in order to enable playback and editing by QuickTime in a computer, it is conceivable to store video / audio data on a recording medium such as an optical disk in a portable camera-integrated recording / playback apparatus in accordance with the QuickTime file format. Even in this case, it is necessary to solve the problem that the accessibility to specific data is poor and the editability is poor. The same applies to a recording / reproducing apparatus for audio data as well as video data.
[0005]
Therefore, the object of the present invention is to prevent the deterioration of accessibility when recording data having a converted data structure on a recording medium so as to have a file structure compliant with a multimedia data format such as QuickTime. It is an object of the present invention to provide a recording apparatus and method, and a recording medium that can improve performance.
[0006]
[Means for Solving the Problems]
According to a first aspect of the present invention, there is provided a recording apparatus for recording video data on a rewritable optical disc in order to achieve the above-described problem.
Encoding means for encoding video data by compression encoding;
Means for converting the data structure of the encoded video data from the encoding means so as to have a file structure that can be handled by computer software for synchronously playing back moving images etc. without using special hardware;
Comprising means for recording data having a file structure on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of first data units,
The recording apparatus is characterized in that it corresponds to a continuous recording length when a plurality of second data units are written on an optical disc.
[0007]
The invention of claim 2 is a recording apparatus for recording audio data on a rewritable optical disc,
Means for converting the data structure of the audio data or the encoded audio data so as to have a file structure that can be handled by computer software for synchronously playing back moving images or the like without using special hardware;
Comprising means for recording data having a file structure on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of first data units,
The recording apparatus is characterized in that it corresponds to a continuous recording length when a plurality of second data units are written on an optical disc.
[0008]
The invention of claim 3 is a recording apparatus for recording video data and audio data on a rewritable optical disc.
Video encoding means for combining video predictive encoding and motion compensation, and encoding video data by compression encoding having a group structure of a plurality of frames;
Audio output means for outputting compression-encoded or uncompressed audio data;
The encoded video data from the encoding means and the audio data from the audio output means have a file structure that can be handled by computer software for synchronously playing back moving images etc. without using special hardware. Means for converting each of the data structures and multiplexing the encoded video data and audio data having a file structure;
It has a file structure and comprises means for recording multiplexed data on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of first data units,
The recording apparatus is characterized in that it corresponds to a continuous recording length when a plurality of second data units are written on an optical disc.
[0009]
The invention of claim 9 is a recording method for recording video data on a rewritable optical disc,
Encoding video data by compression encoding;
Converting the data structure of the encoded video data so as to have a file structure that can be handled by computer software for synchronously playing back moving images and the like without using special hardware;
Recording data having a file structure on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of first data units,
A recording method characterized in that a plurality of second data units correspond to a continuous recording length when writing to an optical disc.
[0010]
The invention of claim 10 is a recording method for recording audio data on a rewritable optical disc.
Converting the data structure of the audio data or the encoded audio data so as to have a file structure that can be handled by computer software for synchronously playing back moving images or the like without using special hardware;
Recording data having a file structure on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of first data units,
A recording method characterized in that a plurality of second data units correspond to a continuous recording length when writing to an optical disc.
[0011]
The invention of claim 11 is a recording method for recording video data and audio data on a rewritable optical disc.
A step of video encoding that combines inter-frame predictive encoding and motion compensation and encodes video data by compression encoding having a group structure of multiple frames;
An audio output step for outputting compression-encoded or uncompressed audio data;
Convert the data structure of the encoded video data and output audio data so that it has a file structure that can be handled by computer software for synchronously playing back moving images etc. without using special hardware, Multiplexing encoded video data and audio data having a file structure;
Having a file structure and recording multiplexed data on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of first data units,
A recording method characterized in that a plurality of second data units correspond to a continuous recording length when writing to an optical disc.
[0012]
The invention of claim 12 is a recording medium on which a computer-controllable program for recording video data on a rewritable optical disk is recorded.
The program
Encoding video data by compression encoding;
Converting the data structure of the encoded video data so as to have a file structure that can be handled by computer software for synchronously playing back moving images and the like without using special hardware;
Recording data having a file structure on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of first data units,
A recording medium characterized by corresponding to a continuous recording length when a plurality of second data units are written on an optical disc.
[0013]
The invention of claim 13 is a recording medium on which a computer-controllable program for recording audio data on a rewritable optical disc is recorded.
The program
Converting the data structure of the audio data or the encoded audio data so as to have a file structure that can be handled by computer software for synchronously playing back moving images or the like without using special hardware;
Recording data having a file structure on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of first data units,
A recording medium characterized by corresponding to a continuous recording length when a plurality of second data units are written on an optical disc.
[0014]
The invention of claim 14 is a recording medium on which a computer-controllable program for recording video data and audio data on a rewritable optical disc is recorded.
The program
A step of video encoding that combines inter-frame predictive encoding and motion compensation and encodes video data by compression encoding having a group structure of multiple frames;
An audio output step for outputting compression-encoded or uncompressed audio data;
Convert the data structure of the encoded video data and output audio data so that it has a file structure that can be handled by computer software for synchronously playing back moving images etc. without using special hardware, Multiplexing encoded video data and audio data having a file structure;
Having a file structure and recording multiplexed data on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of first data units,
A recording medium characterized by corresponding to a continuous recording length when a plurality of second data units are written on an optical disc.
[0015]
According to the present invention, when recording data having a file structure on an optical disc, the continuous recording length is made to correspond to a plurality of second data units (for example, QuickTime Chunks), so that accessibility and editability can be improved. . In addition, since a plurality of sets of encoded video data and audio data (compressed or uncompressed) are associated with the continuous recording length, accessibility and editability can be improved.
[0016]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 shows a digital recording / reproducing apparatus according to an embodiment of the present invention. In FIG. 1, 1 indicates a video encoder. The video input is supplied to the video encoder 1 where the video signal is compression encoded. Reference numeral 2 denotes an audio encoder, and the audio input is compressed and encoded in the audio encoder 2 as an audio input. For example, MPEG is used as compression encoding for video signals and audio signals. The outputs of the video encoder 1 and the audio encoder 2 are called elementary streams.
[0017]
In the case of MPEG, the video encoder 1 includes a motion prediction unit that detects a motion vector, a picture order rearrangement unit, a subtraction unit that forms a prediction error between an input video signal and a local decoded video signal, and a DCT that performs DCT conversion on the subtraction output. , A quantization unit that quantizes the output of the DCT unit, a variable length coding unit that performs variable length coding on the quantized output, and a buffer memory that outputs encoded data at a constant rate. The picture order rearranging unit rearranges the picture order to one suitable for encoding processing. That is, the I and P pictures are encoded first, and then the pictures are rearranged in an order suitable for encoding the B picture. The local decoding unit includes an inverse quantization unit, an inverse DCT unit, an addition unit, a frame memory, and a motion compensation unit. In the motion compensation unit, forward prediction, backward prediction, and bidirectional prediction are possible. In the case of intra coding, the subtraction unit does not perform the subtraction process and simply passes the data. The audio encoder 2 includes a subband encoding unit, an adaptive quantization bit allocation unit, and the like.
[0018]
As an example, in the case of a portable camera-integrated disk recording / playback apparatus, an image captured by a video camera is used as a video input, and sound collected by a microphone is used as an audio input. In the video encoder 1 and the audio encoder 2, the analog signal is converted into a digital signal and processed. In this embodiment, a rewritable optical disc is used as a recording medium. As this type of optical disk, a magneto-optical disk, a phase change disk or the like can be used. In one embodiment, a relatively small-diameter magneto-optical disk is used.
[0019]
The outputs of the video encoder 1 and the audio encoder 2 are supplied to the file generator 5. The file generator 5 has a data structure of a video elementary stream and an audio elementary stream so as to have a file structure that can be handled by computer software for synchronously playing back moving images and the like without using special hardware. Convert. In this embodiment, for example, QuickTime is used as software. A series of data (video data, audio data, text data) that changes in time series processed by QuickTime is called a QuickTime movie (Movie). In the file generator 5, the encoded video data and the encoded audio data are multiplexed. The file generator 5 is controlled by the system control microcomputer 9 in order to create the structure of the QuickTime movie file.
[0020]
QuickTime movie files from the file generator 5 are sequentially written into the memory 7 via the memory controller 8. When a data write request to the disk is input from the system control microcomputer (microcomputer) 9 to the memory controller 8, a QuickTime movie file is read from the memory 7 by the memory controller 8. Here, the transfer rate of QuickTime movie encoding is lower than the transfer rate of write data to the disc, for example, about 1/2. Therefore, while QuickTime movie files are continuously written in the memory 7, reading from the memory 7 is performed intermittently while the system control microcomputer 9 monitors that the memory 7 does not overflow or underflow.
[0021]
The QuickTime movie file read from the memory 7 via the memory controller 8 is supplied to the error correction code / decoder 11. The error correction code / decoder 11 once writes the QuickTime movie file in the memory 10, performs processing for generating interleaved and error correction code redundant data, and reads the data with the redundant data added thereto.
[0022]
The output of the error correction code / decoder 11 is supplied to the data modulator / demodulator 13. The data modulator / demodulator 13 modulates data so as to facilitate clock extraction during reproduction and prevent problems such as intersymbol interference when recording digital data on a disc. For example, RLL (1, 7) can be used.
[0023]
The output of the data modulator / demodulator 13 is supplied to the magnetic field modulation driver 14 and outputs a signal for driving the optical pickup 23. The magnetic field modulation driver 14 drives the magnetic field head 22 in accordance with the input signal and applies a magnetic field to the optical disc 20. The optical pickup 23 irradiates the optical disk 20 with a recording laser beam. In this way, data is recorded on the optical disc 20. The optical disk 20 is rotated by a motor 21 at CLV (constant linear velocity), CAV (constant angular velocity), or ZCAV (zone CLV).
[0024]
Since intermittent data read from the memory controller 8 is recorded on the optical disc 20, normally, a continuous recording operation is not performed. When a certain amount of data is recorded, the recording operation is interrupted and waits until the next recording request. As described above, the recording operation is performed intermittently.
[0025]
In response to a request from the system control microcomputer 9, the drive control microcomputer 12 issues a request to the servo circuit 15, and the entire disk drive is controlled. Thereby, a recording operation is performed. The servo circuit 15 performs servo movement of the optical pickup 23 in the disk radial direction, tracking servo, focus servo, and spindle servo of the motor 21. Although not shown, a user operation input unit is provided in association with the system control microcomputer 9.
[0026]
Next, the configuration and operation for reproduction will be described. During reproduction, the optical disc 20 is irradiated with a reproduction laser beam, and the reflected light from the optical disc 20 is converted into a reproduction signal by a detector in the optical pickup 23. In this case, a tracking error and a focus error are detected from the output signal of the detector of the optical pickup 23, and the read laser beam is positioned on the track and controlled by the servo circuit 15 so as to be focused on the track. Further, the movement of the optical pickup 23 in the radial direction is controlled to reproduce data at a desired position on the optical disc 20.
[0027]
At the time of reproduction, similarly to the case of recording, data is reproduced from the optical disk 20 at a rate higher than, for example, twice the transfer laser of the QuickTime movie file. In this case, normally, continuous reproduction is not performed, and when a certain amount of data is reproduced, the reproduction operation is interrupted and an intermittent reproduction operation is performed to wait for the next reproduction request. In the reproduction operation, as in the recording operation, the drive control microcomputer 12 issues a request to the servo circuit 15 in response to a request from the system control microcomputer 9, and the entire disk drive is controlled.
[0028]
A reproduction signal from the optical pickup 23 is input to the data modulator / demodulator 13 and demodulated. The demodulated data is supplied to the error correction code / decoder 11. In the error correction code / decoder 11, the reproduction data is once written in the memory 10, and deinterleave processing and error correction processing are performed. The QuickTime movie file after error correction is written to the memory 7 via the memory controller 8.
[0029]
The QuickTime movie file written in the memory 7 is output to the file decoder 6 in accordance with the request of the system control microcomputer 9 in accordance with the synchronization timing for demultiplexing. The system control microcomputer 9 monitors the amount of data reproduced from the optical disc 20 and written to the memory 7 and the amount of data read from the memory 7 and output to the file decoder 6 in order to continuously reproduce the video signal and the audio signal. The memory controller 8 and the drive control microcomputer 12 are controlled so that the memory 7 does not overflow or underflow, and data is read from the optical disk 20.
[0030]
The file decoder 6 decomposes the QuickTime movie file into a video elementary stream and an audio elementary stream under the control of the system control microcomputer 9. The video elementary stream is supplied to the video decoder 3 and the audio elementary stream is supplied to the audio decoder 4. The video elementary stream and the audio elementary stream from the file decoder 6 are output so that both are synchronized.
[0031]
The video decoder 3 and the audio decoder 4 perform compression encoding decoding, respectively, and generate a video output and an audio output. For example, MPEG is used as a compression encoding of video signals and audio signals. Although not shown, the video output is output to a display (liquid crystal or the like) via a display drive and displayed, and the audio output is output to a speaker via an audio amplifier and reproduced.
[0032]
The video decoder 3 includes a buffer memory, a variable-length code decoding unit, an inverse DCT unit, an inverse quantization unit, an addition unit that adds the output of the inverse quantization unit and the local decoding output, a picture order rearrangement unit, a frame memory, and a motion The local decoding unit is composed of a compensation unit. In the case of intra coding, the adding process is not performed in the adding unit, and the data passes through the adding unit. The decoded data from the adding unit is made the original image order by the picture order rearranging unit.
[0033]
Since the optical disk 20 on which data is recorded as described above is detachable, it can be reproduced by other devices. For example, a personal computer operating with QuickTime application software can read data recorded on the optical disc 20 and reproduce video and audio data recorded by the personal computer. Furthermore, the present invention can be applied to the case where only video data or only audio data is handled.
[0034]
One embodiment of the present invention described above will be described in more detail. First, QuickTime will be schematically described with reference to FIG. QuickTime is generally an extended function of the OS for reproducing moving images without using special hardware. There are a variety of data formats that can be handled, and it is possible to synchronize the output of audio, video, MIDI, etc. up to 32 tracks.
[0035]
QuickTime movie files are roughly divided into two parts: Movie Resource and Movie Data. The Movie Resource part stores the time required to play the QuickTime file and information for referring to the actual data. The Movie Data part stores the actual video and audio data. .
[0036]
A single QuickTime movie file can store different types of media data such as sound, video, and text as separate tracks, called Sound Track, Video Track, and Text Track, which are strictly managed on the time axis. ing. Each Track has a Media for referring to the compression method, storage location, and display time of each actual data. In Media, the size of the smallest sample that shows how the actual data is stored in the Movie Data part, the storage location of the chunks that are collected and blocked, and the location of each sample Stores information such as display time.
[0037]
FIG. 2 shows an example of a QuickTime movie file that handles audio data and image data. The largest components of a QuickTime movie file are a Movie Resource portion and a Movie Data portion. The Movie Resource portion stores time necessary for reproducing the file and data for referring to actual data. The Movie Data portion stores actual data such as video and audio.
[0038]
The Movie Resource part will be described in detail. Hierarchy of a Movie Resource portion 50, a track portion 51 that describes information related to individual data stored in movie data, a media portion 52 that describes information related to individual data, a media information portion 53, and a sample table portion 54 It has a structure. This Resource is related to one Video Track, and although not shown, Resource 55 having the same structure is described for the audio track.
[0039]
The Movie Resource portion 50 includes a movie header 41 that describes information related to the entire file. The track part 51 includes a Track header 42 describing information relating to the entire track. The media section 52 includes a Media header 43 that describes information related to the entire medium, and a Media handler 44 that describes information related to the handling of Media data. The media information section 53 includes a media header 45 that describes information related to image media, a data handler 46 that describes information related to handling of image data, and a data information 47 that describes information about data. The sample table section 54 includes a sample description 57 for describing each sample, a time-to-sample that describes the relationship between the sample and the time axis, a sample size 48 that describes the size of the sample, and a relationship between the sample and chunk. A sample-to-chunk to be written, a chunk offset 49 that describes the start byte position of the chunk in the movie file, a sync sample that describes the synchronization, and the like are stored.
[0040]
On the other hand, in the Movie Data section 56, for example, audio data encoded by a compression encoding method based on, for example, MPEG audio layer 2, and image data encoded by a compression encoding method in accordance with, for example, the MPEG standard are each a predetermined number of Samples. Stored in units of chunks. Of course, the encoding method is not limited to these, and linear data not subjected to compression encoding can be stored.
[0041]
Each Track in the Movie Resource portion is associated with the data stored in the Movie Data portion. That is, since the example shown in FIG. 2 handles audio data and image data, the Movie Resource portion includes a track for video data and a track for audio data, and the Movie Data portion includes the actual audio data. Data and actual data of image data are included. When other types of data are handled, the contents of the Track in the Movie Resource portion and the actual data in the Movie Data portion may be matched with the data to be handled. For example, when dealing with text, MIDI, etc., the track for text, MIDI, etc. may be included in the Movie Resource portion, and actual data, such as text, MIDI, etc. may be included in the Movie Data portion.
[0042]
3 and 4 show a more detailed data structure of Movie Resource in QuickTime. FIG. 3 and FIG. 4 are originally one figure, but show the data structure of the resource by dividing it due to the restriction of the drawing space. As described with reference to FIG. 2, the Movie Resource portion 50 includes a track portion 51 that describes information related to individual data stored in movie data, a media portion 52 that describes information related to individual data, and media information. The unit 53 and the sample table unit 54 have a hierarchical structure. This Resource is related to one Video Track, and although not shown, Resource 55 having the same structure is described for the audio track.
[0043]
Next, a method for converting compressed video data (video elementary stream) and compressed audio data (audio elementary stream) into a QuickTime file format when MPEG2 is used as a compression encoding / decoding method will be described. . Here, the MPEG will be described. The MPEG has a six-layer hierarchical structure including a sequence layer, a GOP layer, a picture layer, a slice layer, a macroblock layer, and a block layer in order from the top. A header is added to the head of each layer. For example, the sequence header is a header added to the head of the sequence layer, and includes a sequence start code, horizontal and vertical sizes of the screen, aspect ratio, picture rate, bit rate, VBV buffer size, constraint parameter bits, and two quantization matrices. Includes the load flag and contents.
[0044]
In the case of MPEG, there are three types of picture types: I, P, and B. An I picture (Intra-coded picture) uses information that is closed only in one picture when it is encoded. Therefore, at the time of decoding, it can be decoded only with the information of the I picture itself. A P picture (Predictive-coded picture: a forward predictive coded picture) uses a previously decoded I picture or P picture that is temporally previous as a predicted picture (an image that serves as a reference for obtaining a difference). . Whether the difference from the motion compensated predicted image is encoded or encoded without taking the difference is selected in units of macroblocks. A B picture (Bidirectionally predictive-coded picture) is a previously decoded I picture or P picture that is temporally previous, as a predicted picture (a reference picture for obtaining a difference). Three types of I pictures or P pictures that have already been decoded and interpolated pictures made from both are used. Among the three types of motion-compensated difference encoding and intra-encoding, the most efficient one is selected for each macroblock.
[0045]
Therefore, macroblock types include intra-frame (Intra) macroblocks, forward (Foward) inter-frame prediction macroblocks that predict the future from the past, and backward (Backward) frames that predict the past from the future. There are prediction macroblocks and bidirectional macroblocks that predict from both the front and rear directions. All macroblocks in an I picture are intraframe coded macroblocks. Further, the P picture includes an intra-frame encoded macro block and a forward inter-frame prediction macro block. The B picture includes all the four types of macroblocks described above.
[0046]
In MPEG, in order to enable random access, a GOP (Group Of Picture) structure that is a group of a plurality of pictures is defined. According to the MPEG rules concerning GOP, first, on the bitstream, the first GOP is an I picture, and second, in the order of the original image, the last GOP is an I or P picture. Yes. In addition, a structure that requires prediction from the last I or P picture of the previous GOP is allowed as the GOP. A GOP that can be decoded without using an image of a previous GOP is called a closed GOP. In this embodiment, a closed GOP structure is used, and GOP unit editing is possible.
[0047]
As MPEG audio (compression method), three modes of layer 1, layer 2, and layer 3 are defined. For example, in layer 1, 32 subband coding and adaptive bit allocation are performed, and one audio decoding unit is 384 samples. One audio decoding unit is one audio frame of an audio bit stream. The audio decoding unit is the smallest unit that can decode encoded data into audio data independently. Similarly for video data, a video decoding unit corresponding to one video frame is defined. One video frame is 1/30 second in the NTSC system. Usually, the bit rate of layer 1 audio is 256 kbps in stereo. In layer 2, 32 subband coding and adaptive bit allocation are performed, and one audio decoding unit is 1152 samples. Usually, the bit rate of layer 2 audio is 192 kbps in stereo.
[0048]
The file generator 5 converts the video and audio data compressed by MPEG into a file structure compliant with the above-mentioned QuickTime file format. FIG. 5 shows the relationship between video frames, GOPs, and units of Sample and Chunk in the QuickTime file format. As described above, Sample is a minimum unit in Movie data, and Chunk is a unit obtained by collecting a plurality of Samples into blocks.
[0049]
As shown in FIG. 5A, for example, 15 video frames of the original video signal are compression-encoded by MPEG2 to become 1 GOP. Fifteen video frames are 0.5 seconds long. The GOP is preferably a closed GOP structure. A sequence header (SH) is added to the head of each GOP. A sequence header and a GOP are used as one video decoding unit. By adding a sequence header for each GOP, it is possible to directly access Sample units and decode the data in QuickTime. The video encoder 1 in FIG. 1 outputs the MPEG video elementary stream shown in FIG. 5A.
[0050]
As shown in FIG. 5B, one video decoding unit is set to 1 Sample of the QuickTime file format. Two temporally consecutive Samples (for example, Sample # 0 and Sample # 1) are associated with one video Chunk (for example, Chunk # 0). The length of one video chunk is 1 second, and the length of three video chunks is 3 seconds. Note that six GOPs may correspond to one sample, and one sample may correspond to one video chunk. Even in that case, the time length of one video Chunk is 3 seconds.
[0051]
FIG. 6 shows the relationship between the audio frame, the audio decoding unit, and the sample and audio chunk unit in the QuickTime file format when MPEG audio layer 2 encoding (256 kbps in 2-channel stereo) is performed. In layer 2, 1152 samples / channel of audio samples are set as one audio frame. As shown in FIG. 6A, in the case of stereo, 1152 samples × 2 channels of audio data are encoded in layer 2 to form one audio decoding unit. One audio decoding unit includes data of 384 bytes × 2 channels after compression encoding. The audio decoding unit includes a header and information necessary for decoding (allocation, scale factor, etc.).
[0052]
As shown in FIG. 6B, one audio decoding unit is set to 1 Sample of the QuickTime file format. Therefore, QuickTime can decode audio in units of samples. 41 temporally continuous samples (for example, Sample # 0 to Sample # 40) are associated with one audio Chunk (for example, Chunk # 0), and 42 temporally continuous samples (for example, Sample # 41 to Sample #) # 82) corresponds to one audio Chunk (eg Chunk # 1) and 42 consecutive samples (eg Sample # 83 to Sample # 124) correspond to one audio Chunk (eg Chunk # 2) Let The length of one audio chunk is about 1 second when the audio sampling frequency is 48 kHz. Thus, three consecutive audio chunks are 3 seconds long.
[0053]
5 and 6 separately show the structure of video data and the structure of audio data, but the file generator 5 multiplexes them as one data stream (also referred to as interleaving), and QuickTime. Create a movie file. In QuickTime movie files, video chunks and audio chunks alternate in the movie data. In this case, the related video and audio so that the audio Chunk to be played back in synchronization with the same time and the video Chunk (for example, video Chunk # 0 in FIG. 5B and audio Chunk # 0 in FIG. 6B) correspond to each other. Chunks are placed next to each other. As described above, the time length of the video data included in one video chunk is equal to the time length of the audio data included in one audio chunk, and is selected to be, for example, 1 second. Although the time length of one audio chunk is not strictly 1 second, the time length of 3 video chunks and the time length of 3 audio chunks are equally 3 seconds.
[0054]
As another example of audio compression coding, ATRAC (Adaptive Transform Acoustic Coding) employed in minidiscs may be used. In ATRAC, one sample of 16 bits of audio data sampled at 44.1 kHz is processed. The minimum data unit when processing audio data with ATRAC is a sound unit. In the case of stereo, one sound unit is 512 samples × 16 bits × 2 channels.
[0055]
When ATRAC is adopted as audio compression encoding, as shown in FIG. 7A, one sound unit is compressed into audio decoding units of 212 bytes × 2 channels. As shown in FIG. 7B, one audio decoding unit is associated with one sample of the QuickTime file format. In addition, 64 samples are made to correspond to one audio chunk of the QuickTime file format.
[0056]
As audio compression coding, MPEG audio layer 3, ATRAC3 with higher ATRAC compression rate, or the like can be used. Furthermore, in the present invention, audio data may be recorded without being compressed. A method that does not compress is called linear PCM. Also in the linear PCM, 512 audio samples are set as one audio decoding unit, and one audio decoding unit is associated with 1 Sample of the QuickTime file format.
[0057]
FIG. 8 shows a QuickTime file format for video when video and audio are multiplexed. As shown in FIG. 8A, the period of the video frame is t0 seconds, and the number of frames included in one GOP is f0. The original video data is encoded by MPEG2 to form an MPEG video elementary stream shown in FIG. 8B. As described above, a sequence header (SH) is added for each GOP.
[0058]
Then, as shown in FIG. 8C, the GOP to which the sequence header is added is associated with 1 Sample of the QuickTime file format. The size of 1 Sample is referred to as the Sample size. One Sample of QuickTime file format is composed of a plurality of Samples, for example, the six Samples described above. As shown in FIG. 8D, video Chunks and audio Chunks are multiplexed by being alternately arranged in the Movie data, thereby forming a QuickTime movie file. The top position of each video chunk on the QuickTime movie file is called a video chunk offset. The video chunk offset is represented by the number of bytes from the beginning of the file to the beginning of the video chunk.
[0059]
FIG. 9 shows the QuickTime file format for audio when video and audio are multiplexed. In FIG. 9, division symbols A, B, C, and D are attached from the lower side to the upper side in the order of signal processing. As shown in FIG. 9A, the original audio signal is digitized, and f0 audio samples × n channels are included in one audio frame. By compressing and encoding the original audio data with MPEG audio, an MPEG audio elementary stream shown in FIG. 9B is formed.
[0060]
Then, as shown in FIG. 9C, for example, one audio decoding unit is associated with 1 Sample of the QuickTime file format. The size of 1 Sample is referred to as the Sample size. A plurality of Samples, for example, the 125 Samples described above constitute one audio Chunk in the QuickTime file format. As shown in FIG. 9D, video chunks and audio chunks are multiplexed by being alternately arranged on the time axis to form a QuickTime movie file. The head position of each audio chunk on the QuickTime movie file is called an audio chunk offset. The audio chunk offset is represented by the number of bytes from the beginning of the file to the beginning of the audio chunk. The time length of the video chunk and the audio chunk is equal to each other and is set to 1 second or 3 seconds.
[0061]
The sample size of the video sample, the sample size of the audio sample, the video chunk offset value, and the audio chunk offset value are described in the resource of the QuickTime movie file. As a result, each Sample in each Chunk can be specified, and editing can be performed in Sample units (decoding units).
[0062]
As described above, a recording method when a QuickTime movie file in which video chunks and audio chunks are multiplexed (interleaved) is recorded on the optical disc 20 will be described. As described above, a QuickTime movie file is roughly divided into two parts: Movie Resource and Movie Data. When a QuickTime movie file is recorded on the optical disc 20, a plurality of movie resources and movie data (actual data) chunks (video chunks or audio chunks) are made to correspond to the continuous recording length on the disc. The continuous recording length is a length that can be written to continuous addresses without one access, that is, without a jump operation of the optical pickup 23.
[0063]
When video chunks and audio chunks are multiplexed, a plurality of sets of audio chunks and video chunks corresponding to each other (adjacent) in the movie data are associated with the continuous recording length. As shown in FIG. 10, three sets of video Chunk #i for 1 second shown in FIG. 5B and audio Chunk #i for about 1 second shown in FIG. The data for 3 seconds corresponds to the continuous recording length on the optical disc. For example, data of 3 seconds (Audio Chunk # 1, Video Chunk # 1,... Audio Chunk # 3, Video Chunk # 3) is recorded so as to correspond to one continuous recording length.
[0064]
As shown in FIG. 10, the position of the continuous recording length on the optical disc 20 is physically discontinuous. Therefore, a track jump occurs between the playback of two continuous recording lengths, such as when the Movie Resource is played back first and then the first audio Chunk and video Chunk are played back. However, as described above, since the transfer rate of the write / read data is higher than the transfer rate of the QuickTime movie file, for example, twice, the continuous QuickTime movie file cannot be read even if intermittent reading is performed. Can be played.
[0065]
In this way, QuickTime movie file transfer rate, optical disc read rate, continuous recording length time, disc drive seek time (time to jump from one track to another track and play) are interrelated. Yes. Accordingly, various times other than 3 seconds can be selected for the time of video and audio data recorded in the continuous recording length. Preferably, an integer number of audio samples are included in a time corresponding to the time of the number of video frames of video data recorded in the continuous recording length.
[0066]
In the above-described embodiment, it is possible to record only video or audio on the optical disc, multiplex video and audio and record on the optical disc, and further, one or a plurality of continuous recording lengths. It is possible to include Chunks. Therefore, in one embodiment, information indicating how audio Chunks and video Chunks are continuously recorded on the optical disk is stored in the Movie Resource part (management information part) in the QuickTime movie file. That is, it is possible to understand how the data of the audio track and the video track are continuously recorded by looking at the information in the management data section in the file. This information includes information indicating the relationship between tracks to be continuously recorded and information on the number of chunks (or sets) included in the continuous recording length.
[0067]
Specifically, the above-described information is described in the portion of the sample description 57 (see FIGS. 2 and 4) existing in the Movie Resource portion in the QuickTime movie file. FIG. 11 shows a general structure of a QuickTime movie file composed of two tracks of video and audio. In the sample description 57, CODEC (compression / decompression method) and various types of information related to its attributes can be stored mainly as information necessary for interpreting the sample data.
[0068]
FIG. 12 shows the sample description 57 in more detail. In this embodiment, in addition to the information storage area normally used in the sample description 57, seven fields are additionally defined as shown in FIG. The Data format field is information for identifying a format type such as an audio or video compression method. In this example, when MPEG2 video and MPEG audio layer 2 audio data are recorded, a character string DMPG is stored as an example of a format type.
[0069]
The expanded seven fields are defined as a set. It resembles the basic structural unit of QuickTime Movie Resource, starting with "size" over the entire expanded part, "type" for recognizing the expanded content, and the actual expanded " It has a structure followed by “data”.
[0070]
Specifically, in this example, the size (number of bytes) of all the expanded seven fields is stored in the 4-byte Extension size portion, and how far the extended portion is identified. Subsequently, for example, a character string stde is stored in the 4-byte Extension type portion as a type name for recognizing the expanded content. In other words, the type name (stde) is used to understand that the track to be continuously recorded on the extended definition disk and the information of the chunk are stored as data. Then, five types of fields (Flags, Track ID, Data reference index, Recorded data size, Repeat number) are defined as the information data, and the following contents are stored in each field.
[0071]
In 1-byte Flags, information flags relating to the interpretation method of data stored in Track ID, Data reference index, Recorded data size, and Repeat number are stored. In the 4-byte Track ID, 2-byte Data reference index, 2-byte Recorded data size, 1-byte Repeat number, the chunks of audio and video tracks are interleaved and recorded continuously. The information indicating whether or not there is compositely stored.
[0072]
Flags mainly indicates whether Chunks of different tracks depending on the value are interleaved (value: 4) and continuously written on the disk, or are independently (value: 0).
[0073]
The Track ID is an identification value of a track index stored in the Track header 42 of FIGS. 2 and 3 in the movie file. In addition, the value is not duplicated in one movie file. By using this value, it is specified which track is subject to continuous writing.
[0074]
Data reference index is an identification value assigned to each sample description table that stores detailed information of the sample in sample description 57 (shown in detail in FIG. 11) existing in the track. Normally, one sample description table is stored in one sample description, but a plurality of sample description tables may be stored after editing a movie file. Further, the value does not overlap in one track. By using this value, it is specified which Chunk composed of samples having sample information described in which Sample description table is a target of continuous writing.
[0075]
Recorded data size specifies the minimum number of chunks in which the chunk of one track specified by Track ID and Data reference index is continuously recorded on the disc.
[0076]
Repeat number specifies the number of times the Chunk set of the track specified by Track ID, Data reference index, and Recorded data size is repeatedly recorded on the disc multiple times.
[0077]
By combining the above five data fields, information indicating which track's chunk is continuously recorded as a set on the disc in what order and in what number of units is stored.
[0078]
Hereinafter, an example will be described. For simplicity, a movie file with one audio and one video track, or a movie file with only audio tracks will be described.
[0079]
A first example is shown in FIG. 13A. In the first example, there are an audio track (Track ID = 1) and a video track (Track ID = 2), an audio Chunk (Data reference index = 1) and a video Chunk (Data reference index = 1). Are alternately written one by one and written sequentially on the disc in the order of audio chunk and then video chunk. In this case, the above five data fields include
Audio track
Flags = 4
Track ID = 2
Data reference index = 1
Recorded data size = 1
Repeat number = 1
Video track
Flags = 4
Track ID = 0
Data reference index = 0
Recorded data size = 1
Repeat number = 1
Is stored.
[0080]
In these values, since the two tracks are arranged in an interleaved manner, the Flags field gives a value of 4 as a value for indicating the interleave format in both tracks.
[0081]
The dependency between the two tracks is a set in the order of the audio chunk and the concatenated video chunk, and as a description for that, only the audio track that has been placed earlier will be the Chunk of which track. In order to indicate whether or not there is a linked dependency, the Track ID value (2) of the video track is given to the Track ID field, and the Data reference index value (1) of the video track is given to the Data reference index field.
[0082]
Conversely, the video track, which is the back track, must be discontinuous in both the Track ID field and the Data reference index field to indicate that there is no concatenation of continuous writing behind it. A value (0) for indicating is given.
[0083]
As the number of chunks of audio and video tracks that are continuously written, the Recorded data size field is given a value (1) indicating 1 Chunk each.
Also, the audio and video chunks are repeated one by one,
In the Repeat number field, both are given (1) once.
[0084]
A second example is shown in FIG. 13B. In the second example, an audio track (Track ID = 1) and a video track (Track ID = 2) exist, and an audio Chunk (Data reference index = 1) and a video Chunk (Data reference index = 1). Are alternately written one by one, and are sequentially written on the disc in the order of video chunk and then audio chunk. In this case, the above five data fields include
Audio track
Flags = 4
Track ID = 0
Data reference index = 0
Recorded data size = 1
Repeat number = 1
Video track
Flags = 4
Track ID = 1
Data reference index = 1
Recorded data size = 1
Repeat number = 1
Is stored.
[0085]
A third example is shown in FIG. 13C. In the third example, there are an audio track (Track ID = 1) and a video track (Track ID = 2), two audio chunks (Data reference index = 1), and a video chunk (Data reference index). = 1) is a case where two audio chunks are consecutively written first, and then video chunks are sequentially written on the disc in a set in the order of one. In this case, the above five data fields include
Audio track
Flags = 4
Track ID = 2
Data reference index = 1
Recorded data size = 2
Repeat number = 1
Video track
Flags = 4
Track ID = 0
Data reference index = 0
Recorded data size = 1
Repeat number = 1
Is stored.
[0086]
A fourth example is shown in FIG. 13D. In the fourth example, an audio track (Track ID = 1) and a video track (Track ID = 2) exist, one audio Chunk (Data reference index = 1) and one video Chunk (Data reference index). = 1) is a relationship where one set of audio chunks is followed by one set of video chunks in succession three times in succession on the disc. In this case, the above five data fields include
Audio track
Flags = 4
Track ID = 2
Data reference index = 1
Recorded data size = 1
Repeat number = 3
Video track
Flags = 4
Track ID = 0
Data reference index = 0
Recorded data size = 1
Repeat number = 3
Is stored.
[0087]
A fifth example is shown in FIG. 13E. In the fifth example, there are an audio track (Track ID = 1) and a video track (Track ID = 2), two audio chunks (Data reference index = 1), and a video chunk (Data reference index). = 1) is one case, where two audio chunks are consecutively written, and then video chunks are continuously written on the disk in a unit in which one sequential set is repeated twice. . In this case, the above five data fields include
Audio track
Flags = 4
Track ID = 2
Data reference index = 1
Recorded data size = 2
Repeat number = 2
Video track
Flags = 4
Track ID = 0
Data reference index = 0
Recorded data size = 1
Repeat number = 2
Is stored.
[0088]
A sixth example is shown in FIG. 13F. The sixth example is a case in which only an audio track (Track ID = 1) exists and audio Chunk (Data reference index = 1) is written in units on a continuous basis on the disk. In this case, the above five data fields include
Audio track
Flags = 0
Track ID = 0
Data reference index = 0
Recorded data size = 1
Repeat number = 1
Is stored.
[0089]
A seventh example is shown in FIG. 13G. The seventh example is a case where only an audio track (Track ID = 1) exists and audio Chunks (Data reference index = 1) are written in units of three in succession on the disc. In this case, the above five data fields include
Audio track
Flags = 0
Track ID = 0
Data reference index = 0
Recorded data size = 3
Repeat number = 1
Is stored.
[0090]
In the above description, the example in which the present invention is applied to the portable camera-integrated disc recording / reproducing apparatus has been described. However, the present invention can also be applied to other devices. For example, the present invention can be applied to a digital still camera, a digital audio recorder / player, and the like.
[0091]
Furthermore, in the present invention, a part or the whole of the hardware configuration shown in the block diagram of FIG. 1 may be realized by software. The software is provided by being stored in a computer-readable recording medium such as a CD-ROM.
[0092]
In addition, although QuickTime has been described, the present invention is also applied to computer software that enables a plurality of time-sequentially changing data to be reproduced synchronously without using special hardware. May be applied.
[0093]
【The invention's effect】
According to the present invention, when recording data having a file structure on an optical disc, the continuous recording length is made to correspond to a plurality of second data units (for example, QuickTime Chunks), so that accessibility and editability can be improved. . Further, in the present invention, information indicating the relationship between tracks to be continuously recorded and information indicating the number of chunks or sets included in the continuous recording length are recorded in the management unit. I can know.
[Brief description of the drawings]
FIG. 1 is a block diagram of an embodiment of the present invention.
FIG. 2 is a schematic diagram showing an example of a QuickTime file format to which the present invention can be applied.
FIG. 3 is a schematic diagram showing a more detailed data structure of a movie resource in QuickTime.
FIG. 4 is a schematic diagram showing a more detailed data structure of a movie resource in QuickTime.
FIG. 5 is a schematic diagram for explaining the relationship between the GOP of MPEG video and the QuickTime file format in one embodiment of the present invention.
FIG. 6 is a schematic diagram for explaining an example of a relationship between compression-encoded audio and a QuickTime file format according to the embodiment of the present invention.
FIG. 7 is a schematic diagram for explaining another example of the relationship between the compression-encoded audio and the QuickTime file format according to the embodiment of the present invention.
FIG. 8 is a schematic diagram for explaining the relationship between the GOP of MPEG video and the QuickTime file format in one embodiment of the present invention.
FIG. 9 is a schematic diagram for explaining an example of a relationship between compression-encoded audio and a QuickTime file format according to the embodiment of the present invention.
FIG. 10 is a schematic diagram for explaining an example of a recording method onto an optical disc in one embodiment of the present invention.
FIG. 11 is a schematic diagram showing a general data structure of a QuickTime movie file composed of two tracks of video and audio.
FIG. 12 is a schematic diagram showing in more detail the data structure of a sample description according to an embodiment of the present invention.
FIG. 13 is a schematic diagram for explaining several examples of a chunk flag and a chunk number according to an embodiment of the present invention.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... Video encoder, 2 ... Audio encoder, 3 ... Video decoder, 4 ... Audio decoder, 5 ... File generator, 6 ... File decoder, 20. ··optical disk

Claims (14)

ビデオデータを書き換え可能な光ディスクに記録する記録装置において、
圧縮符号化によってビデオデータを符号化する符号化手段と、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、上記符号化手段からの符号化ビデオデータのデータ構造を変換する手段と、
上記ファイル構造を有するデータを光ディスクに記録する手段とからなり、
上記ファイル構造は、第1のデータ単位と、複数の上記第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の上記第2のデータ単位を上記光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録装置。
In a recording apparatus for recording video data on a rewritable optical disc,
Encoding means for encoding video data by compression encoding;
Means for converting the data structure of the encoded video data from the encoding means so as to have a file structure that can be handled by computer software for synchronously reproducing moving pictures and the like without using special hardware; ,
Comprising means for recording data having the file structure on an optical disc;
The file structure has a first data unit and a second data unit as a set of a plurality of the first data units,
A recording apparatus, wherein a plurality of the second data units are made to correspond to a continuous recording length when writing to the optical disc.
オーディオデータを書き換え可能な光ディスクに記録する記録装置において、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、オーディオデータまたは符号化オーディオデータのデータ構造を変換する手段と、
上記ファイル構造を有するデータを光ディスクに記録する手段とからなり、
上記ファイル構造は、第1のデータ単位と、複数の上記第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の上記第2のデータ単位を上記光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録装置。
In a recording apparatus for recording audio data on a rewritable optical disc,
Means for converting the data structure of the audio data or the encoded audio data so as to have a file structure that can be handled by computer software for synchronously playing back moving images or the like without using special hardware;
Comprising means for recording data having the file structure on an optical disc;
The file structure has a first data unit and a second data unit as a set of a plurality of the first data units,
A recording apparatus, wherein a plurality of the second data units are made to correspond to a continuous recording length when writing to the optical disc.
ビデオデータおよびオーディオデータを書き換え可能な光ディスクに記録する記録装置において、
フレーム間予測符号化と動き補償とを組み合わせ、複数フレームのグループ構造を有する圧縮符号化によってビデオデータを符号化するビデオ符号化手段と、
圧縮符号化または非圧縮のオーディオデータを出力するオーディオ出力手段と、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、上記符号化手段からの符号化ビデオデータと上記オーディオ出力手段からのオーディオデータのデータ構造をそれぞれ変換し、上記ファイル構造を有する符号化ビデオデータと上記オーディオデータを多重化する手段と、
上記ファイル構造を有し、多重化されたデータを光ディスクに記録する手段とからなり、
上記ファイル構造は、第1のデータ単位と、複数の上記第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の上記第2のデータ単位を上記光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録装置。
In a recording device for recording video data and audio data on a rewritable optical disc,
Video encoding means for combining video predictive encoding and motion compensation, and encoding video data by compression encoding having a group structure of a plurality of frames;
Audio output means for outputting compression-encoded or uncompressed audio data;
The encoded video data from the encoding means and the audio from the audio output means so as to have a file structure that can be handled by computer software for synchronously playing back moving images and the like without using special hardware. Means for respectively converting the data structure of the data and multiplexing the encoded video data having the file structure and the audio data;
Comprising the above file structure and comprising means for recording multiplexed data on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of the first data units,
A recording apparatus, wherein a plurality of the second data units are made to correspond to a continuous recording length when writing to the optical disc.
請求項3において、
上記多重化されたデータは、上記第2のデータ単位の符号化ビデオデータと上記第2の単位のオーディオデータの時間長が略等しくされたことを特徴とする記録装置。
In claim 3,
The multiplexed apparatus is characterized in that the time lengths of the encoded video data of the second data unit and the audio data of the second unit of the multiplexed data are substantially equal.
請求項3において、
上記多重化されたデータは、上記第2のデータ単位の符号化ビデオデータと上記第2の単位のオーディオデータとが交互に配列され、
隣接する上記第2の単位の符号化ビデオデータおよびオーディオデータのセットの複数個を上記連続記録長に対応させることを特徴とする記録装置。
In claim 3,
In the multiplexed data, the encoded video data of the second data unit and the audio data of the second unit are alternately arranged,
A recording apparatus characterized in that a plurality of sets of adjacent encoded video data and audio data of the second unit correspond to the continuous recording length.
請求項2または3において、
上記オーディオデータがATRACにより圧縮符号化され、
上記ファイル構造の上記第1のデータ単位に上記ATRACの1または複数のサウンドユニットが含まれることを特徴とする記録装置。
In claim 2 or 3,
The audio data is compressed and encoded by ATRAC,
The recording apparatus according to claim 1, wherein one or more sound units of the ATRAC are included in the first data unit of the file structure.
請求項1または2において、
上記ファイル構造が管理情報を記述するためのデータ部分をさらに有し、上記データ部分に、上記連続記録長に含まれる上記第2のデータ単位の個数を記述することを特徴とする記録装置。
In claim 1 or 2,
The recording apparatus, wherein the file structure further includes a data portion for describing management information, and the number of the second data units included in the continuous recording length is described in the data portion.
請求項3において、
上記ファイル構造が管理情報を記述するためのデータ部分をさらに有し、上記データ部分に、上記第2の単位の符号化ビデオデータおよびオーディオデータのセットを記録しているか否かを示すフラグと、上記連続記録長に含まれる上記セットの個数を記述することを特徴とする記録装置。
In claim 3,
The file structure further includes a data portion for describing management information, and a flag indicating whether or not the set of encoded video data and audio data of the second unit is recorded in the data portion; A recording apparatus, wherein the number of sets included in the continuous recording length is described.
ビデオデータを書き換え可能な光ディスクに記録する記録方法において、
圧縮符号化によってビデオデータを符号化するステップと、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、符号化ビデオデータのデータ構造を変換するステップと、
上記ファイル構造を有するデータを光ディスクに記録するステップとからなり、
上記ファイル構造は、第1のデータ単位と、複数の上記第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の上記第2のデータ単位を上記光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録方法。
In a recording method for recording video data on a rewritable optical disc,
Encoding video data by compression encoding;
Converting the data structure of the encoded video data so as to have a file structure that can be handled by computer software for synchronously playing back moving images and the like without using special hardware;
Recording the data having the file structure on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of the first data units,
A recording method, wherein a plurality of the second data units are made to correspond to a continuous recording length when writing to the optical disc.
オーディオデータを書き換え可能な光ディスクに記録する記録方法において、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、オーディオデータまたは符号化オーディオデータのデータ構造を変換するステップと、
上記ファイル構造を有するデータを光ディスクに記録するステップとからなり、
上記ファイル構造は、第1のデータ単位と、複数の上記第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の上記第2のデータ単位を上記光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録方法。
In a recording method for recording audio data on a rewritable optical disc,
Converting the data structure of the audio data or the encoded audio data so as to have a file structure that can be handled by computer software for synchronously playing back moving images or the like without using special hardware;
Recording the data having the file structure on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of the first data units,
A recording method, wherein a plurality of the second data units are made to correspond to a continuous recording length when writing to the optical disc.
ビデオデータおよびオーディオデータを書き換え可能な光ディスクに記録する記録方法において、
フレーム間予測符号化と動き補償とを組み合わせ、複数フレームのグループ構造を有する圧縮符号化によってビデオデータを符号化するビデオ符号化のステップと、
圧縮符号化または非圧縮のオーディオデータを出力するオーディオ出力のステップと、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、符号化ビデオデータと上記出力されるオーディオデータのデータ構造をそれぞれ変換し、上記ファイル構造を有する符号化ビデオデータと上記オーディオデータを多重化するステップと、
上記ファイル構造を有し、多重化されたデータを光ディスクに記録するステップとからなり、
上記ファイル構造は、第1のデータ単位と、複数の上記第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の上記第2のデータ単位を上記光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録方法。
In a recording method for recording video data and audio data on a rewritable optical disc,
A step of video encoding that combines inter-frame predictive encoding and motion compensation and encodes video data by compression encoding having a group structure of multiple frames;
An audio output step for outputting compression-encoded or uncompressed audio data;
The data structure of the encoded video data and the output audio data is converted so that it has a file structure that can be handled by computer software for synchronously playing back moving images etc. without using special hardware. Multiplexing the encoded video data having the file structure and the audio data;
And having the above file structure and recording multiplexed data on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of the first data units,
A recording method, wherein a plurality of the second data units are made to correspond to a continuous recording length when writing to the optical disc.
ビデオデータを書き換え可能な光ディスクに記録するためのコンピュータ制御可能なプログラムが記録された記録媒体において、
上記プログラムは、
圧縮符号化によってビデオデータを符号化するステップと、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、符号化ビデオデータのデータ構造を変換するステップと、
上記ファイル構造を有するデータを光ディスクに記録するステップとからなり、
上記ファイル構造は、第1のデータ単位と、複数の上記第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の上記第2のデータ単位を上記光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録媒体。
In a recording medium on which a computer-controllable program for recording video data on a rewritable optical disc is recorded,
The above program
Encoding video data by compression encoding;
Converting the data structure of the encoded video data so as to have a file structure that can be handled by computer software for synchronously playing back moving images and the like without using special hardware;
Recording the data having the file structure on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of the first data units,
A recording medium characterized in that a plurality of the second data units correspond to a continuous recording length when writing to the optical disc.
オーディオデータを書き換え可能な光ディスクに記録するためのコンピュータ制御可能なプログラムが記録された記録媒体において、
上記プログラムは、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、オーディオデータまたは符号化オーディオデータのデータ構造を変換するステップと、
上記ファイル構造を有するデータを光ディスクに記録するステップとからなり、
上記ファイル構造は、第1のデータ単位と、複数の上記第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の上記第2のデータ単位を上記光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録媒体。
In a recording medium on which a computer-controllable program for recording audio data on a rewritable optical disc is recorded,
The above program
Converting the data structure of the audio data or the encoded audio data so as to have a file structure that can be handled by computer software for synchronously playing back moving images or the like without using special hardware;
Recording the data having the file structure on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of the first data units,
A recording medium characterized in that a plurality of the second data units correspond to a continuous recording length when writing to the optical disc.
ビデオデータおよびオーディオデータを書き換え可能な光ディスクに記録するためのコンピュータ制御可能なプログラムが記録された記録媒体において、
上記プログラムは、
フレーム間予測符号化と動き補償とを組み合わせ、複数フレームのグループ構造を有する圧縮符号化によってビデオデータを符号化するビデオ符号化のステップと、
圧縮符号化または非圧縮のオーディオデータを出力するオーディオ出力のステップと、
特殊なハードウエアを用いずに動画等を同期して再生するためのコンピュータソフトウェアにより取り扱うことができるファイル構造を持つように、符号化ビデオデータと上記出力されるオーディオデータのデータ構造をそれぞれ変換し、上記ファイル構造を有する符号化ビデオデータと上記オーディオデータを多重化するステップと、
上記ファイル構造を有し、多重化されたデータを光ディスクに記録するステップとからなり、
上記ファイル構造は、第1のデータ単位と、複数の上記第1のデータ単位の集合としての第2のデータ単位とを有し、
複数の上記第2のデータ単位を上記光ディスクに書き込む時の連続記録長に対応させることを特徴とする記録媒体。
In a recording medium recorded with a computer-controllable program for recording video data and audio data on a rewritable optical disc,
The above program
A step of video encoding that combines inter-frame predictive encoding and motion compensation and encodes video data by compression encoding having a group structure of multiple frames;
An audio output step for outputting compression-encoded or uncompressed audio data;
The data structure of the encoded video data and the output audio data is converted so that it has a file structure that can be handled by computer software for synchronously playing back moving images etc. without using special hardware. Multiplexing the encoded video data having the file structure and the audio data;
And having the above file structure and recording multiplexed data on an optical disc,
The file structure has a first data unit and a second data unit as a set of a plurality of the first data units,
A recording medium characterized in that a plurality of the second data units correspond to a continuous recording length when writing to the optical disc.
JP35603799A 1999-09-30 1999-12-15 Recording apparatus and method, and recording medium Expired - Fee Related JP3991540B2 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP35603799A JP3991540B2 (en) 1999-12-15 1999-12-15 Recording apparatus and method, and recording medium
KR1020000056948A KR100739357B1 (en) 1999-09-30 2000-09-28 Recording apparatus, recording method and recording media
EP00308498A EP1089572B1 (en) 1999-09-30 2000-09-28 Recording apparatus, recording method, and record medium
US09/676,645 US7668437B1 (en) 1999-09-30 2000-09-29 Recording apparatus, recording method, and record medium
CNB00136958XA CN1197073C (en) 1999-09-30 2000-09-30 Recording device, method and medium
US12/642,969 US20100092158A1 (en) 1999-09-30 2009-12-21 Recording apparatus, recording method, and record medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35603799A JP3991540B2 (en) 1999-12-15 1999-12-15 Recording apparatus and method, and recording medium

Publications (2)

Publication Number Publication Date
JP2001176195A JP2001176195A (en) 2001-06-29
JP3991540B2 true JP3991540B2 (en) 2007-10-17

Family

ID=18447014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35603799A Expired - Fee Related JP3991540B2 (en) 1999-09-30 1999-12-15 Recording apparatus and method, and recording medium

Country Status (1)

Country Link
JP (1) JP3991540B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010503266A (en) * 2006-08-29 2010-01-28 トムソン ライセンシング Method and apparatus for repairing samples contained in container files with lost packets
JP4561815B2 (en) * 2007-11-26 2010-10-13 ソニー株式会社 File recording device, file playback device, file editing device, file recording method, file playback method, file editing method, file recording method program, file playback method program, file editing method program, file recording method program recorded RECORDING MEDIUM, RECORDING MEDIUM RECORDING PROGRAM FOR FILE REPRODUCTION METHOD, RECORDING MEDIUM RECORDING PROGRAM FOR FILE EDITING METHOD

Also Published As

Publication number Publication date
JP2001176195A (en) 2001-06-29

Similar Documents

Publication Publication Date Title
KR100739357B1 (en) Recording apparatus, recording method and recording media
US7313320B2 (en) Recording apparatus, recording method, reproducing apparatus, reproducing method, and record medium
US8521003B2 (en) Recording apparatus and recording medium
US8204360B2 (en) Recording apparatus, recording method and record medium
KR100866443B1 (en) Recording apparatus, recording method, and program, and recording medium
JP2003059236A (en) Recorder, recording method and recording medium
JP2006073173A (en) Information recording and reproducing device and method
JP3991540B2 (en) Recording apparatus and method, and recording medium
JP2004140679A (en) Recording medium and its reproducer and recorder

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060314

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070716

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100803

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110803

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110803

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120803

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees