以下に本発明の実施の形態を説明するが、請求項に記載の構成要件と、発明の実施の形態における具体例との対応関係を例示すると、次のようになる。この記載は、請求項に記載されている発明をサポートする具体例が、発明の実施の形態に記載されていることを確認するためのものである。従って、発明の実施の形態中には記載されているが、構成要件に対応するものとして、ここには記載されていない具体例があったとしても、そのことは、その具体例が、その構成要件に対応するものではないことを意味するものではない。逆に、具体例が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その具体例が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
さらに、この記載は、発明の実施の形態に記載されている具体例に対応する発明が、請求項に全て記載されていることを意味するものではない。換言すれば、この記載は、発明の実施の形態に記載されている具体例に対応する発明であって、この出願の請求項には記載されていない発明の存在、すなわち、将来、分割出願されたり、補正により追加されたりする発明の存在を否定するものではない。
請求項1に記載の情報処理装置は、
データ記録媒体にデータを記録する記録手段に、画像または音声の前記データを出力する情報処理装置(例えば、図1のディスク装置14)において、
前記画像または音声のデータである本線データか、または前記本線データよりデータ量が少ない前記データであるプロキシデータのいずれか一方を取得し、出力する取得手段(例えば、図10の要素抽出部41)と、
前記取得手段において前記本線データが取得された場合、前記本線データから前記プロキシデータを生成する第1の生成手段(例えば、図10のIMXデコーダ42、画素間引き部43、MPEG4エンコーダ44など)と、
前記取得手段において前記プロキシデータが取得された場合、前記本線データの代替となる本線同等データを、前記プロキシデータから生成する第2の生成手段(例えば、図10のMPEG4エンコーダ45、画素補間部46、IMXエンコーダ47など)と、
前記取得手段において前記本線データが取得された場合には、前記取得手段により出力された前記本線データと、前記第1の生成手段により生成された前記プロキシデータとを選択し、前記取得手段において前記プロキシデータが取得された場合には、前記取得手段により出力された前記プロキシデータと、前記第2の生成手段により生成された前記本線同等データとを選択し、前記記録手段に出力する選択手段(例えば、図10のスイッチ50乃至53)と
を備えることを特徴とする。
請求項2に記載の情報処理装置は、
前記取得手段において前記プロキシデータが取得された場合、前記本線同等データに関する情報である第1のメタデータを生成し、前記記録手段に出力する第3の生成手段(例えば、図10のNRTメタデータファイル生成部55)をさらに備える
ことを特徴とする。
請求項5に記載の情報処理装置は、
前記取得手段は、所定の通信路を介して所定の伝送フォーマットで送信されてくる、前記本線データか、または前記プロキシデータのいずれか一方を取得し、
前記選択手段により選択された前記本線データおよび前記プロキシデータか、または、前記プロキシデータおよび前記本線同等データを、前記伝送フォーマットから前記データ記録媒体に記録するときの記録フォーマットに変換する変換手段(例えば、図10のデータ変換部54)をさらに備える
ことを特徴とする。
請求項6に記載の情報処理方法は、
データ記録媒体にデータを記録する記録手段に、画像または音声の前記データを出力する情報処理装置の情報処理方法において、
前記画像または音声のデータである本線データか、または前記本線データよりデータ量が少ない前記データであるプロキシデータのいずれか一方を取得し、出力する取得ステップ(例えば、図12のステップS14の処理)と、
前記取得ステップにおいて前記本線データが取得された場合、前記本線データから前記プロキシデータを生成する第1の生成ステップ(例えば、図12のステップS15乃至S17の処理)と、
前記取得ステップにおいて前記プロキシデータが取得された場合、前記本線データの代替となる本線同等データを、前記プロキシデータから生成する第2の生成ステップ(例えば、図12のステップS23乃至S25の処理)と、
前記取得ステップにおいて前記本線データが取得された場合には、前記取得ステップの処理により出力された前記本線データと、前記第1の生成ステップの処理により生成された前記プロキシデータとを選択し、前記取得ステップにおいて前記プロキシデータが取得された場合には、前記取得ステップの処理により出力された前記プロキシデータと、前記第2の生成ステップの処理により生成された前記本線同等データとを選択し、前記記録手段に出力する選択ステップ(例えば、図12のステップS13の処理)と
を含むことを特徴とする。
請求項7に記載の記録媒体のプログラム、請求項8に記載のプログラムの各ステップの具体例も、請求項6に記載の情報処理方法の各ステップの発明の実施の形態における具体例と同様である。
以下、図を参照して、本発明の実施の形態について説明する。
図1は、本発明を適用したAV(Audio/Video)ネットワークシステム(システムとは、複数の装置が論理的に集合した物をいい、各構成の装置が同一筐体中にあるか否かは問わない)の一実施の形態の構成例を示している。
映像記録装置11には、例えば、Blu-ray Disk(商標),DVD-RAM(Digital Versatile Disc - Random Access Memory),DVD-R(DVD - Recordable),DVD-RW(DVD - ReWritable),DVD+R(DVD + Recordable),DVD+RW(DVD + ReWritable),CD-R(Compact Disc - Recordable),またはCD-RW(CD - ReWritable)等の光ディスク12を着脱することができるようになっている。映像記録装置11は、例えば、ビデオカメラであり、被写体を撮影し、その結果得られる被写体の画像のデータ(ビデオデータ)、および集音した音声のデータ(オーディオデータ)を、所定のディスク記録フォーマットのファイルとして光ディスク12に記録する。
すなわち、光ディスク12には、図2に示すように、本線ビデオオーディオデータ(以下、本線データという)、プロキシビデオオーディオデータ(以下、プロキシデータという)、RT(Real Time)メタデータ、NRT(Non Real Time)メタデータなどが記録される。
ここで、本線データは、映像記録装置11で撮像された映像(音声も含む)のオリジナルのデータであり、データ量は大きいが高画質(高解像度)のビデオデータ(本線のビデオデータ)や高音質のオーディオデータ(本線のオーディオデータ)である。プロキシデータは、本線のビデオデータとオーディオデータのそれぞれを、例えば、フレームの画素数を少なくしたり、音声の周波数帯域を狭くしたり、サンプル数を少なくするなどして、データ量を少なくした、ビデオデータ(プロキシビデオデータ)とオーディオデータ(プロキシオーディオデータ)である。RTメタデータは、ビデオデータまたはオーディオデータに関するデータであって、読み込み処理においてリアルタイム性が要求される内容のデータである。NRTメタデータは、ビデオデータまたはオーディオデータに関するデータであって、読み込み処理においてリアルタイム性が要求されない(本線データと同時に読み出される必要のない)内容のデータである。
なお、映像記録装置11で撮像された映像を、本線のビデオデータとして記録する場合の符号化方式としては、例えば、D10と呼ばれるMPEG(Moving Picture Experts Group) IMX方式が採用される。また、映像記録装置11で集音された音声を、本線のオーディオデータとして記録する場合の符号化方式としては、例えば、AES(Audio Engineering Society)3方式が採用される。また、映像記録装置11で撮像された映像から、プロキシビデオデータを得るための符号化方式としては、例えばMPEG4(Moving Picture Experts Group 4)方式が採用される。また、映像記録装置11で集音された音声から、プロキシオーディオデータを得るための符号化方式としては、例えばITU-T(International Telecommunication Union, Telecommunication Standardization Sector) G.711 A-Law方式が採用される。また、以下において、本線データ、プロキシデータ、RTメタデータ、およびNRTメタデータを総称してAVデータと称する。
また、RTメタデータとしては、例えば、フレームの位置を時、分、秒等の所定の時間情報を利用して特定するLTC(Linear Time Code)、各フレームのフレーム番号であり、ファイルの先頭フレームからの相対的な位置情報であるFTC(File Time Code)、そのフレームのビデオデータ(画像信号)の信号特性を示すユーザビット(UB:User Bit)、ビデオカメラによる撮像が行われた位置を表すGPS(Global Positioning System)の情報、ビデオデータやオーディオデータ等のエッセンスデータの内容に関する情報であるエッセンスマーク、ARIB(Association of Radio Industries and Businesses)メタデータ、撮像が行われたビデオカメラの設定/制御情報などがある。なお、ARIBメタデータとは、標準化団体であるARIBで標準化された、SDI(Serial Digital Interface)等の通信インタフェース用のメタデータである。また、ビデオカメラの設定/制御情報とは、例えば、IRIS(アイリス)制御値や、ホワイトバランス/ブラックバランスのモード、レンズのズームやフォーカスに関するレンズ情報等の情報である。
NRTメタデータとしては、例えば、撮像が行われた日時(年、月、日、時、分、秒)、各フレームに対応するLTCをフレーム番号(FTC)に対応させた変換テーブル、クリップをグローバルユニークに識別するための固有の識別子であるUMID(Unique Material Identifier)、またはGPSの情報などがある。なお、フレームとは、ビデオデータの単位であり、1画面分の画像に対応するビデオデータ(または、そのビデオデータに対応する各種のデータ)のことである。また、クリップとは、撮影者が撮像を開始して終了(一時停止)するまでの1回の撮像処理を示す単位である。すなわち、1つのクリップのビデオデータは、通常、複数のフレームのビデオデータからなる。
このようなRTメタデータおよびNRTメタデータは、どのような単位のビデオデータに対して付加されてもよい。以下においては、RTメタデータがフレーム毎にビデオデータに付加され、NRTメタデータがクリップ毎にビデオデータに付加される場合について説明する。
図1に戻り、ディスク装置14は、そこに装着された光ディスク(光ディスク15)に記録された本線データとプロキシデータを用いて、放送用の映像の編集や放送を行う装置である。例えば、ディスク装置14において、編集者が記録媒体に記録された映像のプロキシ編集を行う場合には、データ量が少なく、データの読み出し等が簡易なプロキシデータが使用される。プロキシ編集とは、例えば、プロキシデータを素材として、撮影された映像シーンの中から、放送に必要なシーンを選択し、その選択されたシーンにIN点およびOUT点を設定する作業などである。設定されたIN点およびOUT点は、エディットリストとして記録される。そして、放送時には、ディスク装置14は、エディットリスト(プロキシ編集により設定されたIN点およびOUT点)に基づいて、必要なシーンの映像および音声を、光ディスク15に記録された本線データから抽出し、出力する(放送する)。
従って、ディスク装置14が放送用の編集や放送を行うためには、ディスク装置14に装着された光ディスクに、本線データとプロキシデータの両方が記録されている必要がある。
映像記録装置11で撮影して得られたAVデータを使用(放送)するまでの時間に余裕がある場合には、ディスク装置14が設置されている場所から離れた遠隔地において、撮影を行った撮影者が、撮影して得られたAVデータが記録されている光ディスク12をディスク装置14が設置されている場所に持参すればよい。また、撮影して得られたAVデータを使用(放送)するまでの時間に余裕がある場合には、光ディスク12に記録された本線データを、ネットワーク13を介してディスク装置14に送信することもできる。
一方、映像記録装置11で撮影した映像を緊急に放送する場合など、映像記録装置11で撮像して得られたAVデータを使用するまでの時間に余裕がない場合には、撮影者は、映像記録装置11から、データ量が少なくて比較的短時間で送信することが可能なプロキシデータを、ネットワーク13を介してディスク装置14に送信する。しかしながら、送信されてくるプロキシデータを光ディスク15に記録させるだけでは、その後の放送用の編集や放送に必要な、本線データとプロキシデータの両方が揃うことにならないため、ディスク装置14は、プロキシデータが送信されてきた場合には、本線データの代替となる本線同等データを生成し、プロキシデータとともに光ディスク15に記録させる。
即ち、ディスク装置14には、映像記録装置11から、本線データが送信されてくる場合とプロキシデータが送信されてくる場合とがある。また、先に送信されたプロキシデータに対応するNRTメタデータのみが、映像記録装置11からディスク装置14に送信されてくる場合もある。
なお、映像記録装置11は、ネットワーク13を介してディスク装置14にビデオデータおよびオーディオデータを送信する場合、光ディスク12に記録されているディスク記録フォーマットのファイルを、標準AV多重フォーマット(伝送フォーマット)のファイルに変換してから送信する。この標準AV多重フォーマットとしては、例えば、MXF(Material eXchange Format)がある。MXFは、例えば、異なる機種やメーカの放送機器どうしの間のファイル交換に加えて、ストリーミングを考慮したフォーマットであり、ビデオデータとオーディオデータがフレームごと等の細かい単位で多重化されているフォーマットである。
また、映像記録装置11からディスク装置14にNRTメタデータのみを送信する場合には、NRTメタデータはXML形式のファイルとして送信される。
映像記録装置11からディスク装置14に、MXFのファイルで本線データを送信する場合、そのMXFのファイルには、RTメタデータとNRTメタデータも格納することができる。従って、本線データが格納されたMXFのファイル(以下、適宜、本線データのMXFファイルという)を受信したディスク装置14は、受信したファイルから、本線データ、RTメタデータ、およびNRTメタデータを抽出し、本線データからプロキシデータを生成して、光ディスク15に記録させる。
即ち、通信I/F21は、例えば、IEEE(Institute of Electrical and Electronics Engineers)1394ポートや、USB(Universal Serial Bus)ポート、LAN(Local Area Network)接続用のNIC(Network Interface Card)、あるいは、アナログモデムや、TA(Terminal Adapter)およびDSU(Digital Service Unit)、ADSL(Asymmetric Digital Subscriber Line)モデム等で構成され、例えば、インターネットやイントラネット等のネットワーク13を介して、映像記録装置11と標準AV多重フォーマット(いまの場合、MXF)のファイルをやりとりする。具体的には、通信I/F21は、ネットワーク13を介して映像記録装置11から送信されてくる本線データのMXFファイルを受信して、バッファメモリ22に供給する。また、通信部I/F21は、通信衛星や無線通信を介しても、映像記録装置11と標準AV多重フォーマットのファイルをやりとりする。
バッファメモリ22は、通信I/F21から供給される本線データのMXFファイルを一時蓄積し、所定単位(例えば、ファイル単位)のデータが蓄積されたところで、データ生成変換部23に供給する
データ生成変換部23は、バッファメモリ23から供給される、本線データのMXFファイルから、本線データ、RTメタデータおよびNRTメタデータを抽出するとともに、本線データからプロキシデータを生成する。そして、データ生成変換部23は、抽出または生成された本線データ、プロキシデータ、RTメタデータおよびNRTメタデータを、ディスク記録フォーマットのファイルに変換して、ディスクドライブ装置24に供給する。
ディスクドライブ装置24には、光ディスク15を着脱することができるようになっている。ディスクドライブ装置24は、データ生成変換部23から供給される、ディスク記録フォーマットのファイル(本線データ、プロキシデータ、RTメタデータおよびNRTメタデータのファイル)を光ディスク15に記録する(書き込む)。
これにより、光ディスク12と同一のデータが、光ディスク15に記録される。
また、映像記録装置11からディスク装置14に、MXFのファイルでプロキシデータを送信する場合、そのMXFのファイルには、RTメタデータも格納することができる。従って、プロキシデータが格納されたMXFのファイル(以下、適宜、プロキシデータのMXFファイルという)を受信したディスク装置14は、受信したファイルから、プロキシデータおよびRTメタデータを抽出する。また、ディスク装置14は、受信して得られたプロキシデータから、本線データの代替となる本線同等データを生成するとともに、デフォルトのNRTメタデータも生成する。そして、ディスク装置15は、抽出されたプロキシデータおよびRTメタデータ、並びに、生成された本線同等データおよびデフォルトのNRTメタデータを光ディスク15に記録させる。
即ち、通信I/F21は、ネットワーク13を介して映像記録装置11から送信されてくるプロキシデータのMXFファイルを受信して、バッファメモリ22に供給する。バッファメモリ22は、通信I/F21から供給されるプロキシデータのMXFファイルを一時蓄積し、所定単位(例えば、ファイル単位)のデータが蓄積されたところで、データ生成変換部23に供給する
データ生成変換部23には、バッファメモリ23から、プロキシデータのMXFファイルが供給される。データ生成変換部23は、プロキシデータのMXFファイルから、プロキシデータおよびRTメタデータを抽出するとともに、本線同等データおよびデフォルトのNRTメタデータを生成する。そして、データ生成変換部23は、抽出または生成された本線同等データ、プロキシデータ、RTメタデータおよびデフォルトのNRTメタデータを、ディスク記録フォーマットのファイルに変換して、ディスクドライブ装置24に供給する。
ディスクドライブ装置24は、データ生成変換部23から供給される、ディスク記録フォーマットのファイル(本線同等データ、プロキシデータ、RTメタデータおよびデフォルトのNRTメタデータのファイル)を光ディスク15に記録する(書き込む)。
これにより、ディスク装置14は、光ディスク12と同等の(同一構成の)データを光ディスク15に記録させることができる。
また、映像記録装置11からディスク装置14に、NRTメタデータのみが格納されたファイル(以下、適宜、単独NRTメタデータのファイルという)が送信されてきた場合、そのファイルを受信したディスク装置14は、受信したファイルからNRTメタデータを抽出し、先に送信されたプロキシデータのMXFファイルで生成されたデフォルトのNRTメタデータを、抽出した本来のNRTメタデータに置き換える。
即ち、通信I/F21は、ネットワーク13を介して映像記録装置11から送信されてくる単独NRTメタデータのファイルを受信して、バッファメモリ22に供給する。バッファメモリ22は、通信I/F21から供給される単独NRTメタデータのファイルを一時蓄積し、所定単位(例えば、ファイル単位)のデータが蓄積されたところで、データ生成変換部23に供給する
データ生成変換部23は、単独NRTメタデータのファイルからNRTメタデータを抽出し、ディスクドライブ装置24に供給する。
ディスクドライブ装置24は、データ生成変換部23から供給される、ディスク記録フォーマットのファイル(NRTメタデータのファイル)を光ディスク15に記録する(書き込む)。
なお、制御部25は、データ生成変換部23およびディスクドライブ装置24を制御する。例えば、制御部25は、データ生成変換部23を制御して、本線データやプロキシデータをディスクドライブ装置24に供給させたり、ディスクドライブ装置24に、本線データやプロキシデータなどの光ディスク15への記録または再生を指令する。
以上のように構成されるディスク装置14では、ネットワーク13を介して映像記録装置11から送信されてくる標準AV多重フォーマットのファイル(本線データのMXFファイル、プロキシデータのMXFファイル、または単独NRTメタデータのファイル)が受信され、データ生成変換部23に供給される。データ生成変換部23は、本線(同等)データ、プロキシデータ、RTメタデータ、またはNRTメタデータ(デフォルトのNRTメタデータ)を生成または抽出し、さらに、ディスク記録フォーマットに変換して、ディスクドライブ装置24に供給する。そして、ディスクドライブ装置24は、ディスク記録フォーマットのファイルとしての、本線(同等)データ、プロキシデータ、RTメタデータ、またはNRTメタデータ(デフォルトのNRTメタデータ)を、そこに装着された光ディスク15に記録する。
図3乃至図5を参照して、光ディスク12に記録されているデータのフォーマット(ディスク記録フォーマット)について説明する。なお、光ディスク15に記録されているデータのフォーマットも、光ディスク12に記録されているデータのフォーマットと同様である。
光ディスク12に記録されたデータは、例えば、UDF(Universal Disk Format)やISO9660(International Organization for Standardization 9660)等のファイルシステムにより管理され、ユーザからは、図3に示すディレクトリ構造およびファイルとして見えるようになされている。
即ち、図3は、光ディスク12に記録されているデータのディレクトリ(フォルダ)、およびファイルの構造の例を示す図である。
図3に示されるように、ROOTディレクトリには、1つのプログラムに対応するビデオデータを格納するPROAVディレクトリ、および、PROAVディレクトリのデータのメタデータを格納する構成表データファイルが格納されている。
PROAVディレクトリには、インデックスファイル(INDEX.XML)、インデックスファイルがコピーされたファイル(INDEX.RSV)、ディスク情報ファイル(DISCINFO.XML)、ディスク情報ファイルがコピーされたファイル(DISCINFO.RSV)が格納されている。
インデックスファイルは、光ディスク12に記録されたファイルの情報を一元管理するファイルであり、例えば、XML(eXtensible Markup Language)ベースの言語で記述されている。インデックスファイルには、光ディスク12に記録されたクリップそれぞれに関する情報が格納されている。このクリップに関する情報としては、例えば、クリップをグローバルユニークに識別するための固有の識別子であるUMIDなどがある。ディスク情報ファイルは、光ディスク12の属性、再生開始位置などを記述するファイルである。
PROAVディレクトリには、また、クリップディレクトリ(CLPR)およびエディトディレクトリ(EDTR)が格納されている。
クリップディレクトリには、それぞれのクリップに対応するディレクトリが格納される。図3では、3つのクリップに対応する、「C0001」のディレクトリ、「C0002」のディレクトリ、および「C0003」のディレクトリがクリップディレクトリ内に存在している。エディトディレクトリには、映像データおよび音声データの再生順序、および再生範囲を示すエディトリストのデータが格納されている。このエディトリストには、上述したように、クリップに対して設定された、IN点およびOUT点の位置を表す情報が記述される。
図4は、クリップディレクトリ(図3の、名前が「C0001」のディレクトリ)に格納されているファイルの例を示す図である。なお、図4において、ファイルの右方に付されているかっこ書きは、そのファイルの内容を示すものであり、ファイル名には含まれない。
クリップディレクトリの先頭に示される、「C0001C01.SMI」の名前が設定されたファイルは、1セットの独立したマルチメディアオブジェクト(映像または音声のオブジェクト)の時間的な挙動、画面上のレイアウト、または他のマルチメディアオブジェクトとの結び付きを、例えば、SMIL(Synchronized Multimedia Integration Language)で記述するファイルである。
「C0001V01.MXF」の名前が設定されたファイルは、本線のビデオデータを格納するファイルである。
「C0001A01.MXF」乃至「C0001A08.MXF」の名前が設定されたファイルは、本線のオーディオデータを格納するファイルである。それぞれのファイルに1チャンネル分のオーディオデータが記録されている。
なお、光ディスク15に本線同等データが記録される場合も、上述の本線のビデオデータおよび本線のオーディオデータと同様に記録される。
「C0001S01.MXF」の名前が設定されたファイルは、プロキシビデオデータを格納するファイルである。すなわち、ここに格納されているプロキシビデオデータは、「C001V01.MXF」の名前が設定されているファイルに格納されている本線のビデオデータのデータ量を少なくしたデータである。
「C0001M01.XML」の名前が設定されたファイルは、このクリップ(「C0001」のクリップ)に対して付加されたNRTメタデータ(クリップメタデータ)を格納する、XMLベースの言語で記述されるファイル(NRTメタデータファイル)である。
「C0001R01.BIM」の名前が設定されたファイルは、このクリップの各フレームに対して設定されたRTメタデータ(フレームメタデータ)を格納するファイル(RTメタデータファイル)である。この例においては、フレームメタデータは、XML形式のファイルをバイナリ変換したBIM(binary format for metadata)方式で記述されている。
「C0001I01.PPF」の名前が設定されたファイルは、フレーム構造に関する情報が記述されるファイルである。
図5は、オーディオデータやビデオデータが記録された光ディスク12のトラックを模式的に示している。なお、図5において、オーディオデータの記録部分は、影を付して示されており、ビデオデータの記録部分は、特に模様を付さずに示されている。
光ディスク12では、螺旋状または同心円状に、その内周側から外周側の方向に、データが記録されていく。より詳しくは、光ディスク12において、同一の時刻に再生される本線のオーディオデータおよびビデオデータ、並びに、それらに対応するプロキシデータおよびRTメタデータからなる所定の再生時間帯(いまの場合、2秒間)のリアルタイムデータが、撮像して得られた順番に記録されていく。そして、1クリップ分記録された複数の所定の再生時間帯のリアルタイムデータに続いて、リアルタイム性が要求されないNRTメタデータが記録される。
この場合、図5に示すように、光ディスク12には、木の年輪を形成するかのように、同じような所定の再生時間帯(例えば、2秒間)の本線のビデオデータとオーディオデータとが交互に記録されることから、光ディスク12に記録されるリアルタイムデータのひとまとまりを、「年輪」と称し、所定の再生時間帯を、「年輪長」と称する。なお、図5では、簡略化のため、プロキシデータ、RTメタデータ、およびNRTメタデータの図示は省略されている。
このように、光ディスク12においては、同一時刻に再生される年輪長(いまの場合、2秒間)のオーディオデータとビデオデータが光ディスク12上の近い位置に記録されるので、光ディスク12から、同一時刻に再生されるオーディオデータとビデオデータを、迅速に読み出して再生することが可能となる。光ディスク15も同様である。
次に、映像記録装置11で撮影されたAVデータがネットワーク13上を伝送する場合のフォーマットである、標準AV多重フォーマットについて説明する。
図6は、本線データのMXFファイルの例を示している。
MXFのファイルは、その先頭から、ヘッダ(File Header)、ボディ(File Body)、フッタ(File Footer)が順次配置されて構成される。
ヘッダには、その先頭から、ヘッダパーティションパック(Header Partition Pack)、ヘッダメタデータ(Header Metadata)、インデックステーブル(Index Table)が順次配置される。ヘッダパーティションパックには、ヘッダを特定するためのデータや、ボディに配置されるデータの形式、ファイルのフォーマットを表す情報などが配置される。ヘッダメタデータには、例えば、ファイルの作成日や、ボディに配置されたデータに関する情報などのファイル(クリップ)単位のメタデータ(NRTメタデータ)が配置される。インデックステーブルには、ボディに配置される、後述するエディットユニットの位置を表すテーブルが配置される。
また、インデックステーブルは、オプションであり、ヘッダに含めても、含めなくても良い。また、ヘッダには、インデックステーブルの他、種々のオプションのデータを配置することができる。
フッタは、フッタパーティションパック(Footer Partition Pack)で構成され、フッタパーティションパックには、フッタを特定するためのデータなどが配置される。
ボディは、1以上のエディットユニット(Edit Unit)で構成される。エディットユニットは、1フレームの単位であり、そこには、1フレーム分のAVデータその他が配置される。
即ち、エディットユニットは、その先頭から、システムアイテム(Sytem Item)、ピクチャアイテム(Picture Item)、サウンドアイテム(Sound Item)、オグジュアリアイテム(Auxiliary Item)が配置されて構成される。
システムアイテムには、その後段のピクチャアイテムに配置されるビデオデータのフレームについてのメタデータ(RTメタデータ)が配置される。ここで、RTメタデータとしては、例えば、LTCなどがある。
ピクチャアイテムには、1フレーム分のビデオデータが配置される。図6では、上述したD10形式のビデオデータが配置される。
ここで、ピクチャアイテムには、1フレームのビデオデータがKLV(Key,Length,Value)構造にKLVコーディングされて配置される。
KLV構造とは、その先頭から、キー(Key)、レングス(Length)、バリュー(Value)が順次配置された構造であり、キーには、バリューに配置されるデータがどのようなデータであるかを表す、SMPTE 298Mの規格に準拠した16バイトのラベルが配置される。レングスには、バリューに配置されるデータのデータ長が配置される。バリューには、実データ、即ち、ここでは、1フレームのビデオデータが配置される。
また、ピクチャアイテムは、そのデータ長が、KAG(KLV Alignment Grid)を基準とする固定長となっている。そして、ピクチャアイテムを固定長とするのに、スタッフィング(stuffing)のためのデータとしてのフィラー(Filler)が、やはりKLV構造とされて、ピクチャアイテムのビデオデータの後に配置される。
なお、ピクチャアイテムのデータ長であるKAGを基準とする固定長は、例えば、光ディスク12のセクタ長の整数倍(例えば、512バイトや2Kバイトなど)とされている。この場合、光ディスク12とピクチャアイテムとの、いわば親和性が高くなり、光ディスク12に対するピクチャアイテムの読み書き処理の高速化を図ることができる。
また、上述のシステムアイテム、並びに後述するサウンドアイテムおよびオグジュアリアイテムにおいても、ピクチャアイテムと同様に、KLV構造が採用されているとともに、そのデータ長がKAGを基準とする固定長になっている。
サウンドアイテムには、ピクチャアイテムに配置されたビデオデータのフレームにおける1フレーム分のオーディオデータが、上述のピクチャアイテムにおける場合と同様にKLV構造で配置される。
また、サウンドアイテムには、複数としての、例えば8チャネルのオーディオデータが多重化されて配置される。
即ち、サウンドアイテムにおいて、KLV構造のバリューには、その先頭から、エレメントヘッダEH(Element Header)、オーディオサンプルカウントASC(Audio Sample Count)、ストリームバリッドフラグSVF(Stream Valid Flags)、多重化された8チャネルのオーディオデータが順次配置される。
ここで、サウンドアイテムにおいて、8チャネルのオーディオデータは、1フレームにおける8チャネルそれぞれのオーディオデータの第1サンプル、第2サンプル、・・・といった順番に、オーディオデータのサンプルが配置されることにより多重化されている。図6の最下部に示したオーディオデータにおいて、括弧付きで示してある数字は、オーディオデータのサンプルが何サンプル目かを表している。
また、エレメントヘッダEHには、そのエレメントヘッダを特定するためのデータなどが配置される。オーディオサンプルカウントASCには、サウンドアイテムに配置されているオーディオデータのサンプル数が配置される。ストリームバリッドフラグSVFは、8ビット(1バイト)のフラグで、各ビットは、そのビットに対応するチャネルのオーディオデータが有効か、無効かを表す。即ち、ストリームバリッドフラグSVFの各ビットは、そのビットに対応するチャネルのオーディオデータが有効である場合に、例えば1とされ、無効である場合に、例えば0とされる。
オグジュアリアイテムには、必要なユーザデータが配置される。従って、オグジュアリアイテムは、ユーザが任意のデータを配置することができるエリアである。
以上のように、本線データのMXFファイルでは、フレーム単位のメタデータ(RTメタデータ)が配置されるシステムアイテム、ビデオデータが配置されるピクチャアイテム、オーディオデータが配置されるサウンドアイテム、ユーザデータが配置されるオグジュアリアイテムが、1フレーム単位で多重化されており、さらに、サウンドアイテムでは、8チャネルのオーディオデータが、1サンプル単位で多重化されている。
このため、ビデオデータとオーディオデータが、別々にまとめて配置されているファイルでは、そのまとまったビデオデータのファイルとオーディオデータのファイルをすべて受信してからでないと、そのビデオデータおよびオーディオデータの再生を開始することができないが、MXFのファイル(標準AV多重フォーマットのファイル)では、ビデオデータとオーディオデータとがフレーム単位で多重化されているため、1フレーム分のビデオデータとオーディオデータを受信すれば、そのフレームのビデオデータおよびオーディオデータを、即座に再生することができる。従って、MXFのファイル(MXFファイル)は、ストリーミングに適しているということができる。
図7は、MXFのファイルにプロキシデータが格納される場合の、ボディを構成する1つのエディットユニットの構成を示す図である。なお、MXFのファイルにプロキシデータが格納される場合のヘッダおよびフッタは、そこにNRTメタデータが格納されていない点を除いて本線データにおける場合と同様であるので説明を省略する。
プロキシデータが格納される場合のエディットユニットは、その先頭から、システムアイテム(Sytem Item)、ピクチャアイテム(ピクチャエッセンス(picture essence))、サウンドアイテム(サウンドエッセンス(sound essence))が配置されて構成される。なお、システムアイテムとピクチャエッセンスとの間には、フィルアイテムが配置されている。ピクチャアイテム(ピクチャエッセンス)の詳細な構成については、図8を参照して説明し、サウンドアイテム(サウンドエッセンス)の詳細な構成については、図9を参照して説明する。
図8は、図7のピクチャエッセンスの詳細な構成例を示す図である。
ピクチャエッセンスには、KLV構造を有するMPEG4エレメンタリストリーム方式のビデオデータが配置される。すなわち、総走査線数/フレームレートが525/60(59.94)であるビデオデータの場合、フレームレートが24(23.97)のプログレッシブスキャン画像であるビデオデータの場合、またはフレームレートが60(59.94)のプログレッシブスキャン画像であるビデオデータの場合、1つのエディットユニットのピクチャエッセンスには、6つのGOV(Group of VideoObjectPlane)が配置される。一方、総走査線数/フレームレートが625/50であるビデオデータの場合、1つのエディットユニットのピクチャエッセンスには、5つのGOVが配置される。1つのGOVに先頭には、フレーム内符号化されたI-VOP(Intra Video Object Plane)が配置され、その後ろには、所定の数のフレーム間順方向予測符号化されたP-VOP(Predicted Video Object Plane)が配置される。
図9は、図7のサウンドエッセンスの詳細な構成例を示す図である。
サウンドエッセンスには、2チャンネルの、ITU-T G.711の規格に基づいた方式(A-Law方式)のオーディオデータが配置される。サウンドエッセンスは、4つに分割され、それぞれに、KLV構造となされているデータが、KLV構造となされているフィラーとともに配置されている。
バリューには、2チャンネルのサンプルが交互に配置される。総走査線数/フレームレートが525/60(59.94)であるピクチャエッセンスに対するサウンドエッセンスの場合、フレームレートが24(23.97)のプログレッシブスキャン画像であるピクチャエッセンスに対するサウンドエッセンスの場合、またはフレームレートが60(59.94)のプログレッシブスキャン画像であるピクチャエッセンスに対するサウンドエッセンスの場合、サウンドエッセンスが4つに分割されたうちの1つには、16016のサンプルが配置される。一方、総走査線数/フレームレートが625/50であるピクチャエッセンスに対するサウンドエッセンスの場合、サウンドエッセンスが4つに分割されたうちの1つには、16000のサンプルが配置される。
図10は、データ生成変換部23の詳細な構成例を示すブロック図である。
要素抽出部41には、本線データのMXFファイル、プロキシデータのMXFファイル、または単独NRTメタデータのファイルが、バッファメモリ22から供給される。要素抽出部41は、供給されたファイルに格納されている情報から、そのファイルに格納されているデータの種類を判別する。即ち、要素抽出部41は、バッファメモリ22から供給されたファイルが、本線データまたはプロキシデータのファイルか、若しくは、単独NRTメタデータのファイルかを判別する。
そして、要素抽出部41は、ファイルに格納されているビデオデータ、オーディオデータ、RTメタデータ、またはNRTメタデータを抽出し、対応する各部に供給する。
即ち、要素抽出部41は、MXFファイルのボディの各ピクチャアイテムから、本線のビデオデータを抽出した場合には、IMXデコーダ42およびスイッチ50の端子部50aに供給し、MXFファイルのボディの各サウンドアイテムから、本線のオーディオデータを抽出した場合には、A-Lawエンコーダ48およびスイッチ52の端子部52aに供給する。また、要素抽出部41は、MXFファイルのボディの各ピクチャアイテムから、プロキシビデオデータを抽出した場合には、MPEG4デコーダ45およびスイッチ51の端子部51bに供給し、MXFファイルのボディの各サウンドアイテムから、プロキシオーディオデータを抽出した場合には、A-Lawデコーダ49およびスイッチ53の端子部53bに供給する。さらに、要素抽出部41は、MXFファイルのボディの各システムアイテムから、RTメタデータを抽出した場合には、データ変換部54に供給し、MXFファイルのヘッダのヘッダメタデータから、NRTメタデータを抽出した場合には、NRTメタデータファイル生成部55に供給する。
なお、制御部25(図1)は、要素抽出部41に、本線データのMXFファイル、プロキシデータのMXFファイル、または単独NRTメタデータのファイルのいずれが供給されたかを認識し、後述するスイッチ50乃至53およびNRTメタデータファイル生成部55を制御する。
IMXデコーダ42は、要素抽出部41からの、MPEG IMX方式で符号化されている本線のビデオデータを復号(デコード)し、画素間引き部43に供給する。画素間引き部43は、IMXデコーダ42から供給された本線のビデオデータに対し、画像を構成する縦×横の画素数それぞれが、例えば、元の画素数から1/2となるように画素を間引く処理(間引き処理)を行い、処理後のビデオデータをMPEG4エンコーダ44に供給する。MPEG4エンコーダ44は、画素間引き部43からのビデオデータをMPEG4方式により符号化(エンコード)し、スイッチ51の端子部51aに供給する。従って、IMXデコーダ42、画素間引き部43、およびMPEG4エンコーダ44により、本線のビデオデータからプロキシビデオデータが生成される。
MPEG4デコーダ45は、要素抽出部41からの、MPEG4方式で符号化されているプロキシビデオデータを復号(デコード)し、画素補間部46に供給する。画素補間部46は、MPEG4デコーダ45から供給されたプロキシビデオデータに対し、周辺の画素の画素値を用いて内挿する画素の画素値を求めるなどして、画像を構成する縦×横の画素数それぞれが、例えば、元の画素数の2倍となるように画素を補間する処理(画素補間処理)を行い、処理後のビデオデータをIMXエンコーダ47に供給する。IMXエンコーダ47は、画素補間部46からのビデオデータをMPEG IMX方式により符号化(エンコード)し、スイッチ50の端子部50bに供給する。従って、MPEG4デコーダ45、画素補間部46、およびIMXエンコーダ47により、プロキシビデオデータから本線同等ビデオデータが生成される。
A-Lawエンコーダ48は、要素抽出部41からの、AES3形式の非圧縮のオーディオデータを、ITU-T G.711 A-Law方式により符号化(エンコード)し、スイッチ53の端子部53aに供給する。従って、A-Lawエンコーダ48により、本線オーディオデータからプロキシオーディオデータが生成される。
A-Lawデコーダ49は、要素抽出部41からの、ITU-T G.711 A-Law方式により符号化されているプロキシオーディオデータを復号(デコード)し、スイッチ52の端子部52bに供給する。従って、A-Lawデコーダ49から、本線同等オーディオデータが生成される。
スイッチ50は、制御部25の制御に基づいて、2つの端子部50aおよび50bのうちのいずれか一方を選択する。スイッチ51は、制御部25の制御に基づいて、2つの端子部51aおよび51bのうちのいずれか一方を選択する。スイッチ52は、制御部25の制御に基づいて、2つの端子部52aおよび52bのうちのいずれか一方を選択する。スイッチ53は、制御部25の制御に基づいて、2つの端子部53aおよび53bのうちのいずれか一方を選択する。以下において、スイッチ50乃至53のそれぞれが、端子部50a乃至53aを選択することを、a側端子部を選択するともいう。また、スイッチ50乃至53のそれぞれが、端子部50b乃至53bを選択することを、b側端子部を選択するともいう。
制御部25は、バッファメモリ22から要素抽出部41に供給されたファイルが本線データのMXFファイルである場合には、a側端子部を選択するように、スイッチ50乃至53を制御する。この場合、スイッチ50は、要素抽出部41で抽出された本線のビデオデータをデータ変換部54に供給し、スイッチ51は、IMXデコーダ42、画素間引き部43、およびMPEGエンコーダ44により本線のビデオデータから生成されたプロキシビデオデータをデータ変換部54に供給する。また、スイッチ52は、要素抽出部41で抽出された本線のオーディオデータをデータ変換部54に供給し、スイッチ53は、A-Lawエンコーダ48により本線のオーディオデータから生成されたプロキシオーディオデータをデータ変換部54に供給する。
また、制御部25は、バッファメモリ22から要素抽出部41に供給されたファイルがプロキシデータのMXFファイルである場合には、b側端子部を選択するように、スイッチ50乃至53を制御する。この場合、スイッチ50は、MPEG4デコーダ45、画素補間部46、およびIMXエンコーダ47によりプロキシのビデオデータから生成された本線同等ビデオデータをデータ変換部54に供給し、スイッチ51は、要素抽出部41で抽出されたプロキシビデオデータをデータ変換部54に供給する。また、スイッチ52Aは、A-Lawデコーダ49によりプロキシオーディオデータから生成された本線同等オーディオデータをデータ変換部54に供給し、スイッチ53は、要素抽出部41で抽出されたプロキシオーディオデータをデータ変換部54に供給する。
データ変換部54は、スイッチ50乃至53から供給された本線(同等)データおよびプロキシデータと、要素抽出部41から供給されたRTメタデータとを、ディスク記録フォーマットに変換し、ディスクドライブ装置24(のドライブインタフェース66)に供給する。
即ち、データ変換部54は、図5を参照して説明したように、年輪単位のリアルタイムデータが光ディスク15に記録されるように、スイッチ50乃至53から供給された本線(同等)データおよびプロキシデータと、要素抽出部41から供給されたRTメタデータとを構成する(時分割多重処理する)。また、データ変換部54は、図3および図4を参照して説明したように、本線(同等)のオーディオデータおよびビデオデータ、並びに、それらに対応するプロキシデータおよびRTメタデータそれぞれがファイルとして参照可能なように構成する(リアルタイムデータファイル生成処理)。
NRTメタデータファイル生成部55には、要素抽出部41に入力されたファイルが、本線データ、プロキシデータ、または単独NRTメタデータのいずれのファイルであったかについての情報が、制御部25から供給される。
そして、本線データのMXFファイルが要素抽出部41に供給された旨の情報がNRTメタデータファイル生成部55に供給された場合、NRTメタデータファイル生成部55は、要素抽出部41で抽出され、供給されたNRTメタデータをディスク記録フォーマットに変換し、ディスクドライブ装置24に供給する。このNRTメタデータファイル生成部55がディスクドライブ装置24に供給したNRTメタデータは、例えば、光ディスク15上の、1クリップ分の複数の年輪単位のリアルタイムデータの後に記録される。また、光ディスク15に記録されたNRTメタデータは、図3および図4を参照して説明したように、NRTメタデータファイルとして参照可能となる。
一方、プロキシデータのMXFファイルが要素抽出部41に供給された旨の情報がNRTメタデータファイル生成部55に供給された場合、NRTメタデータファイル生成部55は、デフォルトのNRTメタデータを生成し、それをディスク記録フォーマットに変換して、ディスクドライブ装置24に供給する。このデフォルトのNRTメタデータも、光ディスク15上の、1クリップ分の複数の年輪単位のリアルタイムデータの後に記録され、NRTメタデータファイルとして参照可能となる。なお、デフォルトのNRTメタデータは、本来のNRTメタデータに代わる仮のメタデータであり、例えば、NRTメタデータの1つであるファイルの作成日の項目においては、本来のNRTメタデータでは、撮影された日付が入力されているが、デフォルトのNRTメタデータでは、デフォルトのNRTメタデータを作成した日となされている。
さらに、単独NRTメタデータのファイルが要素抽出部41に供給された旨の情報がNRTメタデータファイル生成部55に供給された場合、NRTメタデータファイル生成部55は、要素抽出部41から供給されたNRTメタデータに含まれているUMIDと同一のUMIDを、ディスクドライブ装置24に装着されている光ディスク15から検索する。即ち、図3を参照して上述したように、光ディスク15に記録されているインデックスファイルに、光ディスク15に記録されたクリップそれぞれをグローバルユニークに識別するUMIDが含まれているので、NRTメタデータファイル生成部55は、インデックスファイルのデータを光ディスク15から読み出させ、要素抽出部41から供給されたNRTメタデータに含まれているUMIDと同一のUMIDが存在するかどうかを検索する。
そして、要素抽出部41から供給されたNRTメタデータに含まれているUMIDと同一のUMIDが検出された場合、NRTメタデータファイル生成部55は、同一のUMIDを有する光ディスク15のNRTメタデータを、要素抽出部41から供給されたNRTメタデータに置き換える。この場合、既に光ディスク15に記録されているNRTメタデータは、例えば、上述のデフォルトのNRTデータなどである。
以上のように構成されるデータ生成変換部23では、要素抽出部41が、本線データのMXFファイルか、またはプロキシデータのMXFファイルのいずれか一方を取得する。そして、本線データのMXFファイルが取得された場合には、IMXデコーダ42、画素間引き部43、およびMPEG4エンコーダ44により、本線データからプロキシデータが生成される。また、プロキシデータのMXFファイルが取得された場合には、MPEG4デコーダ45、画素補間部46、およびIMXエンコーダ47により、プロキシデータから本線同等データが生成される。スイッチ50乃至53は、本線データのMXFファイルが取得された場合には、要素抽出部41により抽出された本線データと、生成されたプロキシデータとを選択してデータ変換部54に出力し、プロキシデータのMXFファイルが取得された場合には、要素抽出部41により抽出されたプロキシデータと、生成された本線同等データとを選択してデータ変換部54に出力する。データ変換部54は、本線(同等)データ、プロキシデータ、RTメタデータ、NRTメタデータ(デフォルトのNRTメタデータ)を、ディスク記録フォーマットに変換し、ディスクドライブ装置24に供給する。
図11は、ディスクドライブ装置24の詳細な構成例を示すブロック図である。
ローディングメカニズムコントローラ61は、光ディスク15の着脱を制御する。メカニズムインタフェース62は、制御部25(図1)からの指令をローディングメカニズムコントローラ61に伝達する。ピックアップコントローラ64は、ピックアップ63のメカニカルな動きを制御する。データプロセッサ65は、光ディスク15に記録させるデータをピックアップ63に出力するとともに、ピックアップ63でレーザの反射光から検出されたデータを取得する。ドライブインタフェース66は、制御部25またはデータ生成変換部23と、ピックアップコントローラ64またはデータプロセッサ65との間で、ピックアップ63を制御する制御コマンド、および光ディスク15に対する書き込みまたは読み出しのデータの中継を行う。
以上のように構成されるディスクドライブ装置24は、データ生成変換部23から供給される本線(同等)データ、プロキシデータ、RTメタデータまたはNRTメタデータを、装着された光ディスク15に記録する。
次に、図12のフローチャートを参照して、データ生成変換部23が行うデータ生成変換処理について説明する。なお、この処理は、バッファメモリ22から本線データのMXFファイル、プロキシデータのMXFファイル、または単独NRTメタデータのファイルが供給されたときに開始される。
初めに、ステップS11において、要素抽出部41は、バッファメモリ22から供給された本線データのMXFファイル、プロキシデータのMXFファイル、または単独NRTメタデータのファイルを取得する。また、ステップS11において、要素抽出部41は、取得したファイルが、本線データまたはプロキシデータのMXFファイルか、若しくは、単独NRTメタデータのファイルかを判別する。
ステップS11で、バッファメモリ22から供給されたファイルが、本線データまたはプロキシデータのMXFファイルであると判別された場合、ステップS12に進み、要素抽出部41は、さらにそのファイルが、本線データまたはプロキシデータのいずれのMXFファイルであるかを判別する。
ステップS12で、バッファメモリ22から供給されたファイルが、本線データのMXFファイルであると判別された場合、ステップS13に進み、制御部25は、スイッチ50乃至53を制御し、a側端子部を選択させる(スイッチ50乃至53は、a側端子部を選択する)。
そして、ステップS14において、要素抽出部41は、MXFファイルのボディの各ピクチャアイテムから、本線のビデオデータを抽出し、IMXデコーダ42およびスイッチ50の端子部50aに供給するとともに、MXFファイルのボディの各サウンドアイテムから、本線のオーディオデータを抽出し、A-Lawエンコーダ48およびスイッチ52の端子部52aに供給する。また、ステップS14において、要素抽出部41は、MXFファイルのボディの各システムアイテムから、RTメタデータを抽出し、データ変換部54に供給するとともに、MXFファイルのヘッダのヘッダメタデータから、NRTメタデータを抽出し、NRTメタデータファイル生成部55に供給する。
ステップS14の処理後、ステップS15に進み、IMXデコーダ42は、要素抽出部41から供給された本線のビデオデータをMPEG IMX方式により復号し、画素間引き部43に供給して、ステップS16に進む。
ステップS16において、画素間引き部43は、IMXデコーダ42から供給された本線のビデオデータに対して間引き処理を行い、処理後のビデオデータをMPEG4エンコーダ44に供給して、ステップS17に進む。
ステップS17において、MPEG4エンコーダ44は、画素間引き部43からのビデオデータをMPEG4方式により符号化し、スイッチ51の端子部51aに供給して、ステップS18に進む。
ステップS18において、A-Lawエンコーダ48は、要素抽出部41から供給されたAES3形式の非圧縮のオーディオデータを、ITU-T G.711 A-Law方式により符号化し、スイッチ53の端子部53aに供給して、ステップS19に進む。
なお、ステップS18の処理は、上述したステップS15乃至S17の処理より先に行っても良いし、ステップS15乃至S17の処理と並行して行うこともできる。
ステップS19において、データ変換部54は、ネットワーク13を介して映像記録装置11から送信されてきた本線データのMXFファイルから生成(または抽出)された、本線データ、プロキシデータ、およびRTメタデータを、ディスク記録フォーマットに変換し、ディスクドライブ装置24に供給して、ステップS20に進む。
ステップS20において、データ生成変換部23は、要素抽出部41に新たなファイルが供給されたか否かを判定する。ステップS20で、要素抽出部41に新たなファイルが供給されたと判定された場合、ステップS14に戻り、上述した処理を繰り返す。
一方、ステップS20で、要素抽出部41に新たなファイルが供給されていないと判定された場合、ステップS21に進み、NRTメタデータファイル生成部55は、本線データのMXFファイルが要素抽出部41に供給された旨の情報を制御部25から取得し、要素抽出部41から供給されたNRTメタデータをディスク記録フォーマットに変換し、ディスクドライブ装置24に供給して、処理を終了する。
一方、ステップS12で、バッファメモリ22から供給されたファイルが、プロキシデータのMXFファイルであると判別された場合、ステップS22に進み、制御部25は、スイッチ50乃至53を制御し、b側端子部を選択させる(スイッチ50乃至53は、b側端子部を選択する)。
そして、ステップS23において、要素抽出部41は、MXFファイルのボディの各ピクチャアイテムから、プロキシビデオデータを抽出し、MPEG4デコーダ45およびスイッチ51の端子部51bに供給するとともに、MXFファイルのボディの各サウンドアイテムから、プロキシオーディオデータを抽出し、A-Lawデコーダ49およびスイッチ53の端子部53bに供給する。また、ステップS23において、要素抽出部41は、MXFファイルのボディの各システムアイテムから、RTメタデータを抽出し、データ変換部54に供給する。
ステップS23の処理後、ステップS24乃至S27において、プロキシビデオデータおよびプロキシオーディオデータそれぞれから、本線同等ビデオデータおよび本線同等オーディオデータが生成される。
即ち、ステップS24において、MPEG4デコーダ45は、要素抽出部41から供給されたプロキシビデオデータをMPEG4方式により復号し、画素補間部46に供給して、ステップS25に進む。
ステップS25において、画素補間部46は、MPEG4デコーダ45から供給されたプロキシビデオデータに対して画素補間処理を行い、処理後のビデオデータをIMXエンコーダ47に供給して、ステップS26に進む。
ステップS26において、IMXエンコーダ47は、画素補間部46からのビデオデータをMPEG IMX方式により符号化し、スイッチ50の端子部50bに供給して、ステップS27に進む。
ステップS27において、A-Lawデコーダ49は、要素抽出部41から供給されたプロキシオーディオデータをITU-T G.711 A-Law方式により復号し、スイッチ52の端子部52bに供給して、ステップS28に進む。
なお、ステップS27の処理は、上述したステップS24乃至S26の処理より先に行っても良いし、ステップS24乃至S26の処理と並行して行うこともできる。
ステップS28において、データ変換部54は、ネットワーク13を介して映像記録装置11から送信されてきたプロキシデータのMXFファイルから生成(または抽出)された、本線同等データ、プロキシデータ、およびRTメタデータを、ディスク記録フォーマットに変換し、ディスクドライブ装置24に供給して、ステップS29に進む。
ステップS29において、データ生成変換部23は、要素抽出部41に新たなファイルが供給されたか否かを判定する。ステップS29で、要素抽出部41に新たなファイルが供給されたと判定された場合、ステップS23に戻り、上述した処理を繰り返す。
一方、ステップS29で、要素抽出部41に新たなファイルが供給されていないと判定された場合、ステップS30に進み、NRTメタデータファイル生成部55は、プロキシデータのMXFファイルが要素抽出部41に供給された旨の情報を制御部25から取得し、デフォルトのNRTメタデータを生成する。また、ステップS30において、NRTメタデータファイル生成部55は、生成したNRTメタデータをディスク記録フォーマットに変換し、ディスクドライブ装置24に供給して、処理を終了する。
一方、上述したステップS11において、バッファメモリ22から供給されたファイルが、本線データまたはプロキシデータのMXFファイルではないと判別された場合、ステップS31に進み、要素抽出部41は、さらにそのファイルが、単独NRTメタデータのファイルであるかを判別する。
ステップS31で、バッファメモリ22から供給されたファイルが単独NRTメタデータのファイルではないと判別された場合、要素抽出部41は、処理を終了する。一方、ステップS31で、バッファメモリ22から供給されたファイルが単独NRTメタデータのファイルであると判別された場合、ステップ32に進み、要素抽出部41は、供給されたファイルからNRTメタデータを抽出し、NRTメタデータファイル生成部55に供給して、ステップS33に進む。
ステップS33において、制御部25は、単独NRTメタデータのファイルが要素抽出部41に供給された旨の情報をNRTメタデータファイル生成部55に供給し、NRTメタデータファイル生成部55は、それを取得する。また、ステップS33において、NRTメタデータファイル生成部55は、要素抽出部41から供給されたNRTメタデータに含まれているUMIDと同一のUMIDを、ディスクドライブ装置24に装着されている光ディスク15から検索する。
即ち、ステップS33では、NRTメタデータファイル生成部55は、光ディスク15のインデックスファイルのデータを光ディスク15から読み出し、要素抽出部41から供給されたNRTメタデータに含まれているUMIDと同一のUMIDが存在するかどうかを判定する。
そして、ステップS33で、要素抽出部41から供給されたNRTメタデータに含まれているUMIDと同一のUMIDが光ディスク15に存在しないと判定された場合、NRTメタデータファイル生成部55は、処理を終了する。
一方、ステップS33で、要素抽出部41から供給されたNRTメタデータに含まれているUMIDと同一のUMIDが光ディスク15に存在すると判定された場合、ステップS34に進み、NRTメタデータファイル生成部55は、要素抽出部41から供給されたNRTメタデータをディスクドライブ装置24に供給し、同一のUMIDを有する光ディスク15のNRTメタデータを、要素抽出部41から供給されたNRTメタデータに置き換えて(書き換えて)、処理を終了する。
以上のように、データ生成変換処理によれば、データ生成変換部23は、映像記録装置11から送信されてきたファイルが本線データのMXFファイルである場合、そのファイルから、本線データ、RTメタデータ、およびNRTメタデータを抽出するとともに、本線データをダウンコンバートしてプロキシデータを生成する。
また、データ生成変換部23は、映像記録装置11から送信されてきたファイルがプロキシデータのMXFファイルである場合、そのファイルから、プロキシデータ、RTメタデータを抽出するとともに、プロキシデータをアップコンバートして本線同等データを生成する。さらに、データ生成変換部23は、デフォルトのNRTメタデータを生成する。
これにより、ディスク装置14では、映像記録装置11からプロキシデータのMXFファイルが伝送されてきた場合でも、本線データと同等な本線同等データおよびNRTメタデータを生成して、光ディスク15に記録させることができる。換言すれば、伝送されてきたプロキシデータのMXFファイルから、光ディスク12と同一のデータ構成となるように不足しているデータを生成して、光ディスク15に記録させることができる。
また、データ生成変換処理によれば、映像記録装置11から伝送されてきたファイルが単独NRTメタデータのファイルである場合、伝送されてきたNRTメタデータに含まれているUMIDと同一のUMIDが光ディスク15に記録されているかどうか検索し、伝送されてきたNRTメタデータに含まれているUMIDと同一のUMIDを有するNRTメタデータを、伝送されてきたNRTメタデータに置き換える。
これにより、プロキシデータのMXFファイルから仮に作成され、光ディスク15に記録済みのデフォルトのNRTメタデータを、本来のNRTメタデータに置き換えることができる。
本線データは、上述したように、データ量が大きいため、本線データのMXFファイルを送信するのには時間がかかる。一方、プロキシデータは、データ量が少なく、プロキシデータのMXFファイルを比較的短時間で送信することができる。また、NRTメタデータのファイルも比較的短時間で送信することができる。
したがって、短時間で伝送させることができるプロキシデータのMXFファイルから、本線データと同等な本線同等データを生成(用意)することができるので、光ディスク15には、本線データとプロキシデータが記録されている光ディスク12と同一構成の、本線同等データとプロキシデータを記録させることができ、その光ディスク15を用いて、遠方で撮像した映像の緊急の放送などに対応することができる。
上述した例では、標準AV多重フォーマットの例として、MXFを例に説明したが、その他のフォーマットを採用してもよい。
また、上述した例では、プロキシデータのMXFファイルには、NRTメタデータが含まれていないものとして説明したが、プロキシデータのMXFファイルには、本線データのMXFファイルにおける場合と同様にNRTメタデータを含むようにしてもよく、その場合、NRTメタデータファイル生成部55は、デフォルトのNRTメタデータを生成せずに、プロキシデータのMXFファイルから抽出されたNRTメタデータをデータ変換部54に供給する。これにより、本来のNRTメタデータを、本線同等データおよびプロキシデータと同時に光ディスク15に記録させることができる。
また、本実施の形態では、記録媒体として光ディスクにAVデータを記録する例を説明したが、記録媒体は、その他ハードディスクや半導体メモリなどであってもよい。
上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図13は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク105やROM103に予め記録しておくことができる。
あるいはまた、プログラムは、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体111に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体111は、いわゆるパッケージソフトウエアとして提供することができる。
なお、プログラムは、上述したようなリムーバブル記録媒体111からコンピュータにインストールする他、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部108で受信し、内蔵するハードディスク105にインストールすることができる。
コンピュータは、CPU(Central Processing Unit)102を内蔵している。CPU102には、バス101を介して、入出力インタフェース110が接続されており、CPU102は、入出力インタフェース110を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部107が操作等されることにより指令が入力されると、それにしたがって、ROM(Read Only Memory)103に格納されているプログラムを実行する。あるいは、また、CPU102は、ハードディスク105に格納されているプログラム、衛星若しくはネットワークから転送され、通信部108で受信されてハードディスク105にインストールされたプログラム、またはドライブ109に装着されたリムーバブル記録媒体111から読み出されてハードディスク105にインストールされたプログラムを、RAM(Random Access Memory)104にロードして実行する。これにより、CPU102は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU102は、その処理結果を、必要に応じて、例えば、入出力インタフェース110を介して、LCD(Liquid Crystal Display)やスピーカ等で構成される出力部106から出力、あるいは、通信部108から送信、さらには、ハードディスク105に記録等させる。
また、プログラムは、1のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
14 ディスク装置, 15 光ディスク, 21 通信I/F, 22 バッファメモリ, 23 データ生成変換部, 24 ディスクドライブ装置, 41 要素抽出部, 42 IMXデコーダ, 43 画素間引き部, 44 MPEG4エンコーダ, 45 MPEG4デコーダ, 46 画素補間部, 47 IMXエンコーダ, 48 A-Lawエンコーダ, 49 A-Lawデコーダ, 50乃至53 スイッチ, 54 データ変換部, 55 NRTメタデータファイル生成部