例えば、ビデオ及びオーディオに関する符号化や多重化方式で最も広く応用されているものとして、MPEG(Moving Pictures Expert Group)方式が存在する。以下では、このMPEGについて説明する。
MPEG1(MPEGフェーズ1)は毎秒1.5メガビット(1.5Mbps)程度の蓄積メディアを対象とした標準技術である。MPEG1は、静止画符号化を目的としたJPEGの技術と、ISDNのテレビ会議やテレビ電話の低転送レート用の動画像圧縮を目的としたH.261(CCITT SGXV、現在のITU−T SG15で標準化)の基本的な技術とを受け継ぎ、蓄積メディア用に新しい技術を導入したものであり、1993年8月にISO/IEC 11172として成立されたものである。MPEG2(MPEGフェーズ2)は、通信や放送などの多様なアプリケーションに対応できるような汎用標準技術を目的として、1994年11月にISO/IEC13818、H.262として成立されたものである。これらのMPEG1及びMPEG2は、ビデオ符号化やオーディオ符号化と共に、多重化方式も規定されている(下記の非特許文献1を参照)。
次に、MPEG方式を用いて、ビデオ信号の符号化データをマルチチャンネルで多重化する例について説明する。MPEGシステム規格はMPEGビデオ及びMPEGオーディオなどで符号化されたビットストリームを、1つのビットストリームに多重化するとともに、同期を確保しながら多重化されたビットストリームを再生する方式を規定したものである。システムで規定されている内容は大きく分けて、次の5点である。
1)複数の符号化されたビットストリームの同期再生
2)複数の符号化されたビットストリームの単一ビットストリームへの多重化
3)再生開始時のバッファの初期化
4)連続的なバッファの管理
5)復号や再生などの時刻の確定
MPEGシステムで多重化を行う場合、情報がパケット化される必要がある。パケットによる多重化とは、例えばビデオ及びオーディオを多重化する場合、それぞれをパケットと呼ばれる適当な長さのストリームに分割し、ヘッダなどの付加情報を付けて、適宜、ビデオ及びオーディオのパケットを切り換えて時分割伝送する方式である。パケットのヘッダにはビデオ、オーディオなどを識別する情報や、同期のための時間情報が存在する。また、パケット長は伝送媒体やアプリケーションに依存し、ATMのように53バイトから、光ディスクのように4キロバイトの長さに達するものまで存在している。MPEGでは、パケット長は可変であり、任意に指定できるようになっている。
MPEG1システムは、主にCD−ROMなどのデジタル記録媒体を対象とし、多重化できる最大チャンネル数として、オーディオ32、ビデオ16、その他2がサポートされている。また、MPEG1システムのデータ構造は、図12に図示されているように規定されている。図12は、従来の技術に係るMPEG1システムのデータ構造を示す図である。MPEG1システムのデータはパック化及びパケット化され、1パックは複数のパケットで構成されている。各パックの先頭部分には、パックスタートコード(pack_start_code)やSCR(System Clock Reference)が記述されたパックヘッダが設けられ、各パケットの先頭部分には、ストリームID(stream_id)やタイムスタンプなどが記述される。タイムスタンプには、オーディオ、ビデオなどの同期付けを行うための時間情報が記述されている。なお、タイプスタンプは、DTS (Decoding Time Stamp)及びPTS(Presentation Time Stamp) の2種類が存在する。
また、SCRは、90KHzの時間精度で記述されており、デコーダの基準時計をロックする情報である。DTSは、そのパケットに含まれるデータの最初のアクセスユニット(ビデオなら1ピクチャ、オーディオなら例えば1152サンプル)のデコード開始時刻を示しており、PTSは、表示(再生)開始時刻を示している。オーディオデコーダやビデオデコーダ、その他のデコーダは、SCRでロックした共通の基準時計を常に監視し、DTSやPTSの時刻と一致したときに、デコードや表示を行うように構成されている。多重化されたデータが各デコーダでバッファリングされるとともに、同期した表示を行うための仮想的なデコーダ(STD(System Target Decoder))が、オーバーフローやアンダーフローを起こさないように多重化される。
次に、図13を参照しながら、MPEGシステムにおいて同期再生を実現するための構成について説明する。図13は、従来の技術に係るMPEGシステムの再生器の一構成例を示すブロック図である。多重化されたシステムストリームはシステムデコーダに入力される。システムデコーダ1301では、システムストリームから、オーディオパケット、ビデオパケット、SCR、PTSやDTSが分離化される。オーディオパケットは、そのパケットが分離された後、オーディオの要素データとしてオーディオデコーダ1302に入力される。一方、ビデオパケットは、そのパケットが分離された後、ビデオの要素データとしてビデオデコーダ1303に入力される。オーディオデコーダ1302では、後述のビデオパックのDTSの時刻にオーディオが復号され、ビデオデコーダ1303ではビデオパックのDTSの時刻にビデオが復号されて、それぞれオーディオデータメモリ1304及びビデオデータメモリ1305に入力される。
一方、SCRはクロックコントロール部1306に入力されて、このクロックコントロール部1306で再生器の基準クロックが生成され、比較部1307に供給される。また、比較部1307には、PTSやDTSも供給される。比較部1307は、基準クロックの時刻と、オーディオ及びビデオのパケットのそれぞれに付加されていたPTS及びDTSとを比較して、これらが一致したときに、オーディオデータメモリ1304及びビデオデータメモリ1305内の対応データのデコードや表示を行うように構成されている。
また、MPEG2システムは、上記のMPEG1システムの機能に対して、通信や放送の広範囲なアプリケーションに対応できるように機能を拡張、追加したものである。MPEG2システムのデータ構造は、大きく分けて、TS(Transport Stream:トランスポートストリーム)及びPS(Program Stream:プログラムストリーム)の2つが存在する。これらはいずれも、PES(Packetized Elementary Stream)、及びその他の必要な情報を含むパケットにより構成されている。PESは、両ストリーム間の変換を可能とするための中間ストリームとして規定されており、MPEG方式で符号化されたビデオ、オーディオのほかに、プライベートストリームなどをパケット化したものである。
また、MPEG1ではオーディオビデオ同期に十分な90KHzのSCRが採用されているのに対し、MPEG2では、エンコーダ側と同一のクロックをデコーダ側で再現可能とするために、27MHzに拡張されたSCR(TSではPCR(Program Clock Referance)と呼ばれる)が採用されている。なお、MPEG2システムでもMPEG1システムにおいて使用されているSTDと同様の概念が採用されている。
また、PSは、MPEG1システムと類似した構造をもっていて、スタートコードの割り当てもMPEG2における追加部分を除いて、同一である。PSは、基本的にはエラーの無い環境で使用され、MPEG1と同様に共通の基準時間を有するプログラムのビデオ及びオーディオの多重化を行うことが可能である。
図14は、従来の技術に係るMPEG2のPS、TS、PESの関係を示す図である。パケットレイヤはPESと呼ばれ、この構造はTSと共用され、PS及びTSの相互互換性を可能とするために、MPEG1のパケットと比較してヘッダ部分が複雑になっている。なお、PSの場合には、ストリームはPESパケット内のストリームID(stream_id)によってスイッチされる。
また、TSもPSと同様に、共通の基準時間を有するプログラムのビデオ及びオーディオの多重化を行うことが可能であるが、TSは、更に異なる基準時間を有する通信や放送などのマルチプログラムの多重化を可能としている。TSは、ATMセル長や誤り訂正符号化を行う場合などを考慮し、188バイトの固定長パケットで構成されており、エラーが存在するシステムでも使用できるように考慮されている。TSパケット自体の構造はそれほど複雑ではないが、マルチプログラムのストリームであるため、その運用は複雑である。また、PSと比べた場合のTSの特徴は、TSパケットが上位構造であるにもかかわらず、通常はPESパケットより短く、PESパケットを分割して複数のTSパケットとして伝送する点にある。なお、TSの場合には、ストリームはTSパケット内のPID(パケットID)によってスイッチされる。
また、下記の特許文献1には、多重化されているデータを再生するにあたり、各要素データに対応するデコーダのいずれか1つに入力されるパケットに含まれるタイムスタンプを基準タイムスタンプとして、他のデコーダに入力されるパケットに含まれるタイムスタンプと上記の基準タイムスタンプとを比較し、この比較関係が所定の関係にある場合に、対応する他のデコーダのデコード処理の待ち状態及び実行状態を制御するようにして、特殊再生時において主映像とサブピクチャとの同期を安定させる技術が開示されている。
また、下記の特許文献2には、パケット化されたデータ列の多種多様な編集が行われても、その都度クロック情報の不連続性を管理できるようにするために、編集後のデータ列の接続点より前に位置する前データの最後のアクセスユニットに対応する時間基準情報と、上記の接続点より後に位置する後データの最初のアクセスユニットに対応する時間基準情報とを検出して、前データの最後のアクセスユニットに対応する時間基準情報と、後データの最初のアクセスユニットに対応する時間基準情報との差に関するクロックオフセット情報を計算し、このクロックオフセット情報を付加情報として記述する技術が開示されている。
上述のように、従来の技術によれば、オーディオ及びビデオを多重化するにあたって、その多重化単位でパケット化を行う場合に、同期を考慮してタイムスタンプが記述される。このとき、オーディオとビデオとはパケットの再生単位が違うために、その再生開始タイミングで、それぞれのパケットにタイムスタンプが記述される。また、多重化されたオーディオ及びビデオを再生するにあたり、多重化データの所定の位置から所定の異なる位置にシームレスにアクセスチェンジを行う場合には、タイムスタンプのオフセット値をあらかじめ計算して記述するなどの工夫が行われている。このとき、マルチチャンネルのデータを各要素データによって構成するとともに、再生する際に組み合わせるマルチチャンネル情報の記録再生システムでは、オーディオ及びビデオの各システムにおいて、タイムスタンプの記述が行われる。
特開平11−149717号公報(図2、3、段落0021、0022)
特開2003−158712号公報(図1、13)
ISO/IEC13818−1(MPEG2多重化規格)
以下、図面を参照しながら、本発明の第1〜第3の実施の形態について説明する。
<第1の実施の形態>
まず、本発明の第1の実施の形態について説明する。まず、本発明の第1の実施の形態におけるオーディオ及びビデオのデータ生成に係る構成及び動作について説明する。図1は、本発明の第1の実施の形態の符号化装置(マルチチャンネル情報処理装置)を示すブロック図である。図1には、MPEGビデオ符号化器101、クロック発生器102、ビデオタイムスタンプ生成器103、MPEGビデオパケット化器104、第1MPEGオーディオ符号化器105、第2MPEGオーディオ符号化器106、第3MPEGオーディオ符号化器107、第4MPEGオーディオ符号化器108、オーディオタイムスタンプ生成器109、第1MPEGオーディオパケット化器110、第2MPEGオーディオパケット化器111、第3MPEGオーディオパケット化器112、第4MPEGオーディオパケット化器113、基準クロック情報生成器114、多重化器115、記録媒体116が図示されている。
MPEGビデオ符号化器101は、符号化装置に入力された画像データに関して、MPEGビデオ符号化を行って、MPEGビデオ符号化データを生成する機能を有している。MPEGビデオ符号化器101によって生成されたMPEGビデオ符号化データは、MPEGビデオパケット化器104に供給される。
また、クロック発生器102は、所定の周期を有するパルス信号(クロック信号)を発生する機能を有している。クロック発生器102で発生したクロック信号は、ビデオタイムスタンプ生成器103、オーディオタイムスタンプ生成器109、基準クロック情報生成器114に供給される。
また、ビデオタイムスタンプ生成器103は、クロック発生器102から供給されるクロック信号に基づいて、ビデオピクチャの時刻に対応するビデオタイムスタンプを生成する機能を有している。ビデオタイムスタンプ生成器103で生成されたビデオタイムスタンプは、MPEGビデオパケット化器104に供給される。
また、MPEGビデオパケット化器104は、MPEGビデオ符号化器101から供給されるMPEGビデオ符号化データを、例えばMPEG2のPESパケットなどにパケット化するとともに、ビデオタイムスタンプ生成器103から供給されるビデオタイムスタンプをパケットのヘッダに記述してビデオパケットを生成する機能を有している。MPEGビデオパケット化器104で生成されたビデオパケットは、多重化器115に供給される。
また、第1〜第4MPEGオーディオ符号化器105〜108は、符号化装置に入力されたマルチチャンネル音響データに関して、MPEGオーディオ符号化を行う機能を有している。なお、以下の説明では、マルチチャンネル音響データのチャンネル数を4とし、4つの第1〜第4MPEGオーディオ符号化器105〜108のそれぞれが、各チャンネル音響データに係るMPEGオーディオ符号化を行うものとする。なお、チャンネル数は任意の値が設定可能であり、このチャンネル数に等しい数のMPEGオーディオ符号化器が設置されることが望ましい。第1〜第4MPEGオーディオ符号化器105〜108のそれぞれによって生成されたMPEGオーディオ符号化データは、それぞれ第1〜第4MPEGオーディオパケット化器110〜113に供給される。
また、オーディオタイムスタンプ生成器109は、クロック発生器102から供給されるクロック信号に基づいて、オーディオフレームデータの先頭の時刻に対応するオーディオタイムスタンプを生成する機能を有している。オーディオタイムスタンプ生成器109で生成されたオーディオタイムスタンプは、第1〜第4MPEGオーディオパケット化器110〜113のそれぞれに供給される。
また、第1〜第4MPEGオーディオパケット化器110〜113は、第1〜第4MPEGオーディオ符号化器105〜108のそれぞれから供給されるMPEGオーディオ符号化データを、例えばMPEG2のPESパケットなどにパケット化するとともに、オーディオタイムスタンプ生成器109から供給されるオーディオタイムスタンプをパケットのヘッダに記述してオーディオパケットを生成する機能を有している。なお、第1〜第4MPEGオーディオパケット化器110〜113で行われるパケット化では、MPEGオーディオ符号化データは、すべて同一の固定長を有するパケットにパックされる。各第1〜第4MPEGオーディオパケット化器110〜113で生成された各オーディオパケット(第1〜第4オーディオパケット)は、多重化器115に供給される。
また、基準クロック情報生成器114は、データ復号時の時刻基準となる基準クロック情報(MPEG2/PSのPCRやMPEG2/TSのSCR)を生成する機能を有している。基準クロック情報生成器114で生成された基準クロック情報は、多重化器115に供給される。
また、多重化器115は、MPEGビデオパケット化器104から供給されるビデオパケットと、第1〜第4MPEGオーディオパケット化器110〜113のそれぞれから供給される第1〜第4オーディオパケットと、基準クロック情報生成器114から供給される基準クロック情報とを多重化して、多重化データを生成する機能を有している。多重化器115で生成された多重化データは、記録媒体116に記録されたり、あるいは通信網に伝送されたりする。このとき、ビデオパケット及び第1〜第4オーディオパケットのそれぞれに独立して基準クロック情報が付与された後、多重化が行われる。
ここで、多重化器115において多重化される第1〜第4オーディオパケットと基準クロック情報との関係について、図11を参照しながら説明する。図11に図示されているように、本発明の第1の実施の形態では、第1〜第4オーディオパケットの要素ストリームのそれぞれに対して、クロック信号に基づく同一の基準クロック情報(図11ではSCRと記載)を時間軸として、タイムスタンプが独立して(すなわち並列的に)割り当てられる。この結果、マルチチャンネル情報のうち、同一時刻で再生されるパケットに対して同一の基準時刻及びタイムスタンプの値の対応関係が割り当てられることになる。また、シームレスにアクセスチェンジを行う各要素ストリームのパケット長はすべて同一の固定長に設定される。したがって、このマルチチャンネル情報の再生時にアクセスチェンジが行われる場合でも、基準クロック情報やタイムスタンプの補正を行う必要がなく、また、パケットの読み出しタイミングも同一周期で行われるため、パケット読み出しの待機時間などが発生せずに、シームレスな再生が実現される。なお、本発明の第1の実施の形態では、図11に図示されている第1〜第4オーディオパケットの要素ストリームは、多重化器115で多重化されるが、各要素ストリームに基準クロック情報が独立して付与されている状態は保存され、したがって、再生器における多重化データの再生処理の際に、図11に図示されているような各要素ストリームに基準クロック情報が独立して付与されている状態が得られる。
次に、本発明の第1の実施の形態の符号化装置の記録動作の一例について説明する。図2は、本発明の第1の実施の形態の符号化装置の記録伝送アルゴリズムを示すフローチャートである。なお、図2に示す動作に関して、図1に図示されている符号化装置の構成に基づいて説明を行うが、図1に図示されている構成によって限定されるものではない。
図2に示すフローチャートにおいて、まず、符号化装置では、同期が保たれた状態の映像(画像データ)及び音声(マルチチャンネル音響データ)の入力が開始される(ステップS201)。符号化装置では、これらの同期した画像データ及びマルチチャンネル音響データのそれぞれに関して、並行処理が行われる。以下では、画像データに関する処理をステップS202〜S206の処理として説明し、マルチチャンネル音響データに関する処理をステップS207〜S211の処理として説明する。
画像データは、まず、MPEGビデオ符号化器101に入力される(ステップS202)。MPEGビデオ符号化器101は、入力された画像データに対してMPEGビデオ符号化の処理を行い、MPEGビデオ符号化データを生成して、MPEGビデオパケット化器104に渡す(ステップS203)。一方、ビデオタイムスタンプ生成器103は、クロック発生器102から供給されるクロック信号に基づいてビデオタイムスタンプを生成し、このビデオタイムスタンプをMPEGビデオパケット化器104に渡す(ステップS204)。MPEGビデオパケット化器104は、MPEGビデオ符号化データのパケット化を行い(ステップS205)、さらに、ビデオパケットのヘッダにビデオタイムスタンプを記述する(ステップS206)。
また、マルチチャンネル音響データに関しては、まず、各チャンネルの音響データが、第1〜第4MPEGオーディオ符号化器105〜108のそれぞれに入力される(ステップS207)。各第1〜第4MPEGオーディオ符号化器105〜108は、入力された音響データに対してMPEGオーディオ符号化の処理を行い、MPEGオーディオ符号化データを生成して、対応する第1〜第4MPEGオーディオパケット化器110〜113に渡す(ステップS208)。一方、オーディオタイムスタンプ生成器109は、クロック発生器102から供給されるクロック信号に基づいてオーディオタイムスタンプを生成し、このオーディオタイムスタンプを各第1〜第4MPEGオーディオパケット化器110〜113に渡す(ステップS209)。そして、各第1〜第4MPEGオーディオパケット化器110〜113は、MPEGオーディオ符号化データのパケット化を行うが、このとき、全チャンネルのMPEGオーディオ符号化データは、同一の再生時間長でパケット化される(ステップS210)。さらに、各第1〜第4MPEGオーディオパケット化器110〜113は、オーディオパケットのヘッダにオーディオタイムスタンプを記述するが、このとき、同一時刻に再生されるべき全チャンネルのオーディオパケットのヘッダには、同一のタイムスタンプが記述される(ステップS211)。
また、基準クロック情報生成器114は、クロック信号に基づいて基準クロック情報を生成する(ステップS212)。そして、多重化器115は、ステップS202〜S206の処理によって生成されたビデオパケットと、ステップS207〜S211の処理によって生成されたオーディオパケットと、ステップS212の処理によって生成された基準クロック情報を多重化し(ステップS213)、ステップS213で生成された多重化データに係るストリームを記録媒体116に記録(あるいは、通信網に伝送)する(ステップS214)。
また、ステップS215において、画像データ及びマルチチャンネル音響データの入力がまだ行われている場合には、ステップS201に戻って、上述の処理を再び行い、画像データ及びマルチチャンネル音響データの入力が終了した場合には、動作を終了する。
次に、図1に図示されている符号化装置で生成されたデータの再生に係る構成及び動作について説明する。図3は、本発明の第1の実施の形態の再生装置(マルチチャンネル情報再生装置)を示すブロック図である。図3には、記録媒体301、分離化器302、基準クロック情報読み取り器303、基準クロック発生器304、MPEGビデオパケット分離化器305、MPEGビデオ復号器306、ビデオタイムスタンプ読み取り器307、第1MPEGオーディオパケット分離化器308、第2MPEGオーディオパケット分離化器309、第3MPEGオーディオパケット分離化器310、第4MPEGオーディオパケット分離化器311、チャンネル選択器312、MPEGオーディオ復号器313、オーディオタイムスタンプ読み取り器314、同期再生制御器315、表示器/音声出力器316が図示されている。
記録媒体301は、図1に図示されている記録媒体116に対応しており、記録媒体301には、図1の符号化装置において最終的に生成された多重化データが記録されている。記録媒体301から読み取られた多重化データは、分離化器302に供給される。
また、分離化器302は、記録媒体301から供給される多重化データの分離化を行う機能を有している。この多重化データは、図1に図示されている多重化器115で生成されたデータであり、ビデオパケットと、第1〜第4オーディオパケットと、基準クロック情報とを含んでいる。分離化器302で抽出された基準クロック情報は基準クロック情報読み取り器303に供給され、分離化器302で抽出されたビデオパケットはMPEGビデオパケット分離化器305に供給され、分離化器302で抽出された第1〜第4オーディオパケットは、それぞれ第1〜第4MPEGオーディオパケット分離化器308〜311に供給される。
また、基準クロック情報読み取り器303は、分離化器302で抽出される基準クロック情報の読み取りを行う機能を有しており、読み取られた基準クロック情報は、基準クロック発生器304に供給される。
また、基準クロック発生器304は、基準クロック情報読み取り器303から供給された基準クロック情報の値に基づいて、基準クロック信号を発生する機能を有している、基準クロック発生器304で発生した基準クロック信号は、同期再生制御器315に供給される。
また、MPEGビデオパケット分離化器305は、分離化器302から供給されるビデオパケットの分離化を行うことによって、MPEGビデオ符号化データを取得する機能を有している。MPEGビデオパケット分離化器305で取得されたMPEGビデオ符号化データは、MPEGビデオ復号器306及びビデオタイムスタンプ読み取り器307に供給される。
また、MPEGビデオ復号器306は、MPEGビデオパケット分離化器305によって取得されたMPEGビデオ符号化データに関して、MPEGビデオ復号処理を行って、ビデオ復号データを取得する機能を有している。MPEGビデオ復号器306によって取得されたビデオ復号データは、同期再生制御器315に供給される。
また、ビデオタイムスタンプ読み取り器307は、MPEGビデオパケット分離化器305によって取得されたMPEGビデオ符号化データ(具体的には、ビデオパケットのヘッダ)から、ビデオタイムスタンプを読み取る機能を有している。ビデオスタンプ読み取り器307で読み取られたビデオタイムスタンプは、同期再生制御器315に供給される。
また、第1〜第4MPEGオーディオパケット分離化器308〜311は、分離化器302から供給されるオーディオパケットの分離化を行うことによって、MPEGオーディオ符号化データを取得する機能を有している。なお、MPEGオーディオパケット分離化器は、オーディオのチャンネル数に合わせて設置されることが望ましい。第1〜第4MPEGオーディオパケット分離化器308〜311のそれぞれで取得された各チャンネルのMPEGオーディオ符号化データ(第1〜第4MPEGオーディオ符号化データ)は、チャンネル選択器312に供給される。
また、チャンネル選択器312は、ユーザインタフェース(不図示)からの選択指示信号に基づいて、4つのチャンネルの第1〜第4MPEGオーディオ符号化データのうちのいずれか1つを選択して出力する機能(チャンネルチェンジ機能又はアクセスチェンジ機能)を有している。チャンネル選択器312で選択されたチャンネルのMPEGオーディオ符号化データは、MPEGオーディオ復号器313及びオーディオタイムスタンプ読み取り器314に供給される。なお、ユーザによって選択されたチャンネルに係るMPEGオーディオ符号化データが、最終的に表示器/音声出力器316から出力されることになる。
また、MPEGオーディオ復号器313は、チャンネル選択器312から選択的に出力されるMPEGオーディオ符号化データに関して、MPEGオーディオ復号処理を行って、オーディオ復号データを取得する機能を有している。MPEGオーディオ復号器313によって取得されたオーディオ復号データは、同期再生制御器315に供給される。
また、オーディオタイムスタンプ読み取り器314は、チャンネル選択器312から選択的に出力されるMPEGオーディオ符号化データ(具体的には、オーディオパケットのヘッダ)から、オーディオタイムスタンプを読み取る機能を有している。オーディオスタンプ読み取り器314で読み取られたオーディオタイムスタンプは、同期再生制御器315に供給される。
また、同期再生制御器315は、基準クロック発生器304から供給される基準クロック信号と、ビデオタイムスタンプ読み取り器307から供給されるビデオタイムスタンプと、オーディオタイムスタンプ読み取り器314から供給されるオーディオタイムスタンプとに基づいて、MPEGビデオ復号器306から供給されるビデオ復号データと、MPEGオーディオ復号器313から供給されるオーディオ復号データとを同期再生する機能を有している。なお、具体的には、同期再生制御器315は、基準クロック信号に基づく基準時刻を参照して、ビデオタイムスタンプに対応するビデオ復号データの再生、及びオーディオタイムスタンプに対応するオーディオ復号データの再生を行うことによってビデオ復号データ及びオーディオ復号データの同期再生制御を行う。ビデオ復号データ及びオーディオ復号データの同期再生の結果、同期再生制御器315から出力されるビデオ再生データ及びオーディオ再生データは、表示器/音声出力器316に供給される。
また、表示器/音声出力器316は、同期再生制御器315から出力されるビデオ再生データの画面表示や、同期再生制御器315から出力されるオーディオ再生データの音声出力を行う機能を有している。
次に、本発明の第1の実施の形態の再生装置の再生動作の一例について説明する。図4は、本発明の第1の実施の形態の再生装置の受信再生アルゴリズムを示すフローチャートである。なお、図4に示す動作に関して、図3に図示されている再生装置の構成に基づいて説明を行うが、図3に図示されている構成によって限定されるものではない。
図4に示すフローチャートにおいて、まず、再生装置では、記録媒体301からの多重化データの読み出し(あるいは、通信網からの多重化データの受信)が開始される(ステップS401)。分離化器302は、ステップS401で読み出された多重化データの分離化を行い、ビデオパケットと、第1〜第4オーディオパケットと、基準クロック情報とを抽出する(ステップS402)。
再生装置では、これらのビデオパケット、第1〜第4オーディオパケット、基準クロック情報に関して、並行処理が行われる。以下では、ビデオパケット及び基準クロック情報に関する処理をステップS403〜S406の処理として説明し、第1〜第4オーディオパケットに関する処理をステップS407〜S410の処理として説明する。
分離化器302で抽出されたビデオパケットは、MPEGビデオパケット分離化器305に供給される。そして、MPEGビデオパケット分離化器305がビデオパケットの分離化を行う(ステップS403)。また、ビデオタイムスタンプ読み取り器307が、ビデオパケットのヘッダに含まれているビデオタイムスタンプの読み取りを行う(ステップS404)。
また、ステップS403におけるビデオパケットの分離化によって取得されたMPEGビデオ符号化データは、MPEGビデオ復号器306に供給される。MPEGビデオ復号器306は、MPEGビデオ符号化データに対してMPEGビデオ復号処理を行い、ビデオ復号データを生成する(ステップS405)。
また、基準クロック情報読み取り器303が、分離化器302で抽出された基準クロック情報を読み取り、さらに、基準クロック発生器204が、この基準クロック情報を基にして、基準クロック信号を発生する(ステップS406)。
一方、分離化器302で抽出されたオーディオパケットは、各チャンネルに対応する第1〜第4MPEGオーディオパケット分離化器308〜311に供給される。そして、第1〜第4MPEGオーディオパケット分離化器308〜311が、各チャンネルのオーディオパケットの分離化を行い(ステップS407)、各第1〜第4MPEGオーディオパケット分離化器308〜311は、オーディオパケットの分離化によって取得されたMPEGオーディオ符号化データをチャンネル選択器312に出力する。
チャンネル選択器312には、ユーザの指示などによって選択すべきチャンネルが設定されており、チャンネル選択器312は、選択すべきチャンネルのMPEGオーディオ符号化データのみを選択して、MPEGオーディオ復号器313及びオーディオタイムスタンプ読み取り器314に出力する(ステップS408)。なお、ユーザは、随時チャンネル選択を行うことが可能であり、本発明の第1の実施の形態では、上述のように、ユーザによるチャンネルの切り換えの際に、基準クロック情報やタイムスタンプなどの補正を行う必要がなく、その結果、シームレスなチャンネル切り換えが実現される。
オーディオタイムスタンプ読み取り器314は、オーディオパケットのヘッダに含まれているオーディオタイムスタンプの読み取りを行う(ステップS409)。また、MPEGオーディオ復号器313は、MPEGオーディオ符号化データに対してMPEGオーディオ復号処理を行い、オーディオ復号データを生成する(ステップS410)。
そして、同期再生制御器315は、ステップS404の処理によって取得されたビデオタイムスタンプと、ステップS406の処理によって発生した基準クロック信号と、ステップS409の処理によって取得されたオーディオタイムスタンプとに基づいて、ステップS405の処理によって生成されたビデオ復号データと、ステップS410の処理によって生成されたオーディオ復号データとを同期して再生を行う(ステップS411)。
また、ステップS412において、読み出すべき多重化データがまだ存在する場合には、ステップS401に戻って、上述の処理を再び行い、多重化データの読み出しが終了した場合には、動作を終了する。
以上、説明したように、本発明の第1の実施の形態によれば、マルチチャンネル情報を含むストリームを生成する際に、マルチチャンネル情報に係る複数の要素ストリームを構成するすべてのパケットを同一時間長(固定長)にするとともに、各要素ストリームに同一の基準時刻を割り当てて、各要素ストリームの同一時刻に再生されるデータに対して、それぞれ同一時刻を示すタイムスタンプ情報が記述されるので、特殊な処理を必要とせずに、マルチチャンネル情報の各要素ストリームのチャンネルチェンジをシームレスに実現することが可能となる。
<第2の実施の形態>
次に、本発明の第2の実施の形態について説明する。図5は、本発明の第2の実施の形態の符号化装置を示すブロック図である。図5には、MPEGビデオ符号化器501、クロック発生器502、ビデオタイムスタンプ生成器503、MPEGビデオパケット化器504、第1MPEGオーディオ符号化器505、第2MPEGオーディオ符号化器506、第3MPEGオーディオ符号化器507、第4MPEGオーディオ符号化器508、オーディオタイムスタンプ生成器509、第1MPEGオーディオパケット化器510、第2MPEGオーディオパケット化器511、第3MPEGオーディオパケット化器512、第4MPEGオーディオパケット化器513、基準クロック情報生成器514、記録媒体516が図示されている。
図5に示すMPEGビデオ符号化器501、クロック発生器502、ビデオタイムスタンプ生成器503、第1MPEGオーディオ符号化器505、第2MPEGオーディオ符号化器506、第3MPEGオーディオ符号化器507、第4MPEGオーディオ符号化器508、オーディオタイムスタンプ生成器509、記録媒体516は、図1に示すMPEGビデオ符号化器101、クロック発生器102、ビデオタイムスタンプ生成器103、第1MPEGオーディオ符号化器105、第2MPEGオーディオ符号化器106、第3MPEGオーディオ符号化器107、第4MPEGオーディオ符号化器108、オーディオタイムスタンプ生成器109、記録媒体116と同一である。なお、図5に示す符号化装置には、図1に示す多重化器115は設けられていない。
図5に示すMPEGビデオパケット化器504は、MPEGビデオ符号化器501から供給されるMPEGビデオ符号化データを、例えばMPEG2のPESパケットなどにパケット化するとともに、ビデオタイムスタンプ生成器503から供給されるビデオタイムスタンプ、及び基準クロック情報生成器514から供給される基準クロック情報の両方をパケットのヘッダに記述してビデオパケットを生成する機能を有している。MPEGビデオパケット化器504で生成されたビデオパケットは、記録媒体516に直接記録される。
また、第1〜第4MPEGオーディオパケット化器510〜513は、図1に示す第1〜第4MPEGオーディオパケット化器110〜113と同様に、第1〜第4MPEGオーディオ符号化器505〜508のそれぞれから供給されるMPEGオーディオ符号化データを、例えばMPEG2のPESパケットなどにパケット化するとともに、オーディオタイムスタンプ生成器509から供給されるオーディオタイムスタンプをパケットのヘッダに記述してオーディオパケットを生成する機能を有している。なお、第1〜第4MPEGオーディオパケット化器510〜513で行われるパケット化では、MPEGオーディオ符号化データは、すべて同一の固定長を有するパケットにパックされる。ただし、本発明の第2の実施の形態では、各第1〜第4MPEGオーディオパケット化器510〜513において生成されたオーディオパケット(第1〜第4オーディオパケット)の供給先は記録媒体516であり、各オーディオパケットは記録媒体516に直接記録される。
また、図5に示す基準クロック情報生成器514は、図1に示す基準クロック情報生成器114と同様に、データ復号時の時刻基準となる基準クロック情報を生成する機能を有している。ただし、基準クロック情報生成器514で生成された基準クロック情報は、MPEGビデオパケット化器504に供給される。
本発明の第2の実施の形態における符号化装置の構成(図5に示す構成)によれば、基準クロック情報はビデオパケットのヘッダに記述され、ビデオパケット及び各チャンネルのオーディオパケットは、多重化されずにそれぞれ独立したパケットのまま記録媒体516に記録される。
また、記録媒体516に直接記録されるビデオパケット及び第1〜第4オーディオパケットのそれぞれのストリームは、図11に図示されているデータ構造と同一のデータ構造を有している。すなわち、本発明の第2の実施の形態においても、本発明の第1の実施の形態と同様に、マルチチャンネル情報のうち、同一時刻で再生されるパケットに対して同一の基準時刻及びタイムスタンプの値の対応関係が割り当てられることになるとともに、シームレスにアクセスチェンジを行う各要素ストリームのパケット長はすべて同一の固定長に設定されるので、マルチチャンネル情報の再生時にアクセスチェンジが行われる場合でも、基準クロック情報やタイムスタンプの補正を行う必要がなく、また、パケットの読み出しタイミングも同一周期で行われるため、パケット読み出しの待機時間などが発生せずに、シームレスな再生が実現される。
次に、本発明の第2の実施の形態における記録伝送の記録動作の一例について、図6を参照しながら説明する。図6は、本発明の第2の実施の形態の符号化装置の記録伝送アルゴリズムを示すフローチャートである。なお、図6に示す動作に関して、図5に図示されている符号化装置の構成に基づいて説明を行うが、図5に図示されている構成によって限定されるものではない。
図6に示すフローチャートにおいて、まず、符号化装置では、同期が保たれた状態の映像(画像データ)及び音声(マルチチャンネル音響データ)の入力が開始される(ステップS601)。そして、図2に示すフローチャートと同様に、符号化装置では、これらの同期した画像データ及びマルチチャンネル音響データビデオデータのそれぞれに関して、並行処理が行われる。以下では、画像データに関する処理をステップS602〜S608の処理として説明し、マルチチャンネル音響データに関する処理をステップS609〜S613の処理として説明する。
画像データに関しては、ステップS602〜S606において、図2に示すフローチャートのステップS202〜S206と同一の処理が行われる。さらに、基準クロック情報生成器514が、クロック信号に基づいて基準クロック情報を生成して、この基準クロック情報をMPEGビデオパケット化器504に渡し(ステップS607)、MPEGビデオパケット化器504は、ステップS602〜S606の処理によって生成されたビデオタイムスタンプが記述されたヘッダを有するビデオパケットのヘッダ内に、基準クロック情報を記述する(ステップS608)。
一方、マルチチャンネル音響データに関しては、ステップS609〜S613において、図2に示すフローチャートのステップS207〜S211の処理と同一の処理が行われる。
そして、MPEGビデオパケット化器504によって生成されたビデオパケットに係るストリーム、第1〜第4MPEGオーディオパケット化器510〜513によって生成された4チャンネルのオーディオパケットのそれぞれに係るストリームは、独立して記録媒体516に記録(あるいは、通信網に伝送)される(ステップS614)。
また、ステップS615において、画像データ及びマルチチャンネル音響データの入力がまだ行われている場合には、ステップS601に戻って、上述の処理を再び行い、画像データ及びマルチチャンネル音響データの入力が終了した場合には、動作を終了する。
次に、図5に図示されている符号化装置で生成されたデータの再生に係る構成及び動作について説明する。図7は、本発明の第2の実施の形態の再生装置を示すブロック図である。図7には、記録媒体701、基準クロック情報読み取り器703、基準クロック発生器704、MPEGビデオパケット分離化器705、MPEGビデオ復号器706、ビデオタイムスタンプ読み取り器707、MPEGオーディオパケット分離化器708、チャンネル選択器712、MPEGオーディオ復号器713、オーディオタイムスタンプ読み取り器714、同期再生制御器715、表示器/音声出力器716が図示されている。
記録媒体701は、図5に図示されている記録媒体516に対応しており、記録媒体701には、図5の符号化装置において最終的に生成されたビデオパケット及び第1〜第4オーディオパケットが記録されている。記録媒体701から読み取られたビデオパケットは、MPEGビデオパケット分離化器705に供給される。また、記録媒体701から読み取られた第1〜第4オーディオパケットは、チャンネル選択器712に供給される。
MPEGビデオパケット分離化器705及びMPEGビデオ復号器706は、図3に示すMPEGビデオパケット分離化器305及びMPEGビデオ復号器306と同一であり、MPEGビデオパケット分離化器705及びMPEGビデオ復号器706を経て生成されたビデオ復号データは、同期再生制御器715に供給される。
また、ビデオタイムスタンプ読み取り器707は、図3に示すビデオタイムスタンプ読み取り器307と同様に、MPEGビデオ符号化データ(具体的には、ビデオパケットのヘッダ)に記述されているビデオタイムスタンプを読み取り、そのビデオタイムスタンプを同期再生制御器715に供給するとともに、さらに、ビデオパケットのヘッダを基準クロック情報読み取り器703に供給する。
また、基準クロック情報読み取り器703は、ビデオタイムスタンプ読み取り器707から供給されるMPEGビデオ符号化データ(具体的には、ビデオパケットのヘッダ)から基準クロック情報の読み取りを行う機能を有しており、読み取られた基準クロック情報は、基準クロック発生器704に供給される。
また、基準クロック発生器704は、図3に示す基準クロック発生器304と同様に、基準クロック情報読み取り器703から供給された基準クロック情報の値に基づいて、基準クロック信号を発生する機能を有している、基準クロック発生器704で発生した基準クロック信号は、同期再生制御器715に供給される。
また、チャンネル選択器712は、ユーザインタフェース(不図示)からの選択指示信号に基づいて、4つのチャンネルのオーディオパケットのうちのいずれか1つを選択して出力する機能(チャンネルチェンジ機能又はアクセスチェンジ機能)を有している。チャンネル選択器712で選択されたチャンネルのオーディオパケットは、MPEGオーディオパケット分離化器708に供給される。なお、ユーザによって選択されたチャンネルに係るオーディオパケットが、最終的に表示器/音声出力器716から出力されることになる。
また、MPEGオーディオパケット分離化器708は、チャンネル選択器712から選択的に出力されるオーディオパケットの分離化を行うことによって、MPEGオーディオ符号化データを取得する機能を有している。MPEGオーディオパケット分離化器708で取得されたMPEGオーディオ符号化データは、MPEGオーディオ復号器713及びオーディオタイムスタンプ読み取り器714に供給される。
また、MPEGオーディオ復号器713は、MPEGオーディオパケット分離化器708から供給されるMPEGオーディオ符号化データに関して、MPEGオーディオ復号処理を行って、オーディオ復号データを取得する機能を有している。MPEGオーディオ復号器713によって取得されたオーディオ復号データは、同期再生制御器715に供給される。
また、オーディオタイムスタンプ読み取り器714は、MPEGオーディオパケット分離化器708から供給されるMPEGオーディオ符号化データ(具体的には、オーディオパケットのヘッダ)から、オーディオタイムスタンプを読み取る機能を有している。オーディオスタンプ読み取り器714で読み取られたオーディオタイムスタンプは、同期再生制御器715に供給される。
また、同期再生制御器715及び表示器/音声出力器716は、図3に示す同期再生制御器315及び表示器/音声出力器316と同一であり、同期再生制御器715によって生成されたビデオ再生データやオーディオ再生データは、表示器/音声出力器716で外部に出力される。
次に、本発明の第2の実施の形態の再生装置の再生動作の一例について説明する。図8は、本発明の第2の実施の形態の再生装置の受信再生アルゴリズムを示すフローチャートである。なお、図8に示す動作に関して、図7に図示されている再生装置の構成に基づいて説明を行うが、図7に図示されている構成によって限定されるものではない。
図8に示すフローチャートにおいて、まず、再生装置では、記録媒体701に記録されているビデオパケット及び各チャンネルのオーディオパケット(第1〜第4オーディオパケット)のそれぞれのストリームの読み出し(あるいは、通信網からの各ストリームの受信)が開始される(ステップS801)。再生装置では、これらのビデオパケット及び第1〜第4オーディオパケットに関して、並行処理が行われる。以下では、ビデオパケットに関する処理をステップS802〜S805の処理として説明し、第1〜第4オーディオパケットに関する処理をステップS806〜S809の処理として説明する。
記録媒体701から読み出されたビデオパケットは、MPEGビデオパケット分離化器705に供給される。そして、MPEGビデオパケット分離化器705がビデオパケットの分離化を行う(ステップS802)。また、ビデオタイムスタンプ読み取り器707が、ビデオパケットのヘッダに含まれているビデオタイムスタンプの読み取りを行う(ステップS803)。
また、ステップS802におけるビデオパケットの分離化によって取得されたMPEGビデオ符号化データは、MPEGビデオ復号器706に供給される。MPEGビデオ復号器706は、MPEGビデオ符号化データに対してMPEGビデオ復号処理を行い、ビデオ復号データを生成する(ステップS804)。
また、基準クロック情報読み取り器703が、ビデオパケットのヘッダに含まれている基準クロック情報を読み取り、さらに、基準クロック発生器704が、この基準クロック情報を基にして、基準クロック信号を発生する(ステップS805)。
一方、記録媒体701から読み出された各チャンネルのオーディオパケットは、チャンネル選択器712に供給される。チャンネル選択器712には、ユーザの指示などによって選択すべきチャンネルが設定されており、チャンネル選択器712は、選択すべきチャンネルのオーディオパケットのみを選択して、MPEGオーディオパケット分離化器708に出力する(ステップS806)。なお、上述の本発明の第1の実施の形態と同様に、本発明の第2の実施の形態においても、ユーザによるチャンネルの切り換えの際に、基準クロック情報やタイムスタンプなどの補正を行う必要がなく、その結果、シームレスなチャンネル切り換えが実現される。
チャンネル選択器712から選択的に出力されたオーディオパケットは、MPEGオーディオパケット分離化器708に供給される。そして、MPEGオーディオパケット分離化器708は、選択されたチャンネルのオーディオパケットの分離化を行い(ステップS807)、この処理によって取得されたMPEGオーディオ符号化データをMPEGオーディオ復号器713及びオーディオタイムスタンプ読み取り器714に出力する。
オーディオタイムスタンプ読み取り器714は、オーディオパケットのヘッダに含まれているオーディオタイムスタンプの読み取りを行う(ステップS808)。また、MPEGオーディオ復号器713は、MPEGオーディオ符号化データに対してMPEGオーディオ復号処理を行い、オーディオ復号データを生成する(ステップS809)。
そして、同期再生制御器715は、ステップS803の処理によって取得されたビデオタイムスタンプと、ステップS805の処理によって発生した基準クロック信号と、ステップS808の処理によって取得されたオーディオタイムスタンプとに基づいて、ステップS804の処理によって生成されたビデオ復号データと、ステップS809の処理によって生成されたオーディオ復号データとを同期して再生を行う(ステップS810)。
また、ステップS811において、読み出すべきストリームがまだ存在する場合には、ステップS801に戻って、上述の処理を再び行い、ストリームの読み出しが終了した場合には、動作を終了する。
以上、説明したように、本発明の第2の実施の形態によれば、マルチチャンネル情報を含むストリームを生成する際に、マルチチャンネル情報に係る複数の要素ストリームを構成するすべてのパケットを同一時間長(固定長)にするとともに、各要素ストリームに同一の基準時刻を割り当てて、各要素ストリームの同一時刻に再生されるデータに対して、それぞれ同一時刻を示すタイムスタンプ情報が記述されるので、特殊な処理を必要とせずに、マルチチャンネル情報の各要素ストリームのチャンネルチェンジをシームレスに実現することが可能となる。
<第3の実施の形態>
次に、本発明の第3の実施の形態について説明する。図9は、本発明の第3の実施の形態の符号化装置を示すブロック図である。図9には、MPEGビデオ符号化器901、クロック発生器902、ビデオタイムスタンプ生成器903、MPEGビデオパケット化器904、第1MPEGオーディオ符号化器905、第2MPEGオーディオ符号化器906、第3MPEGオーディオ符号化器907、第4MPEGオーディオ符号化器908、オーディオタイムスタンプ生成器909、第1MPEGオーディオパケット化器910、第2MPEGオーディオパケット化器911、第3MPEGオーディオパケット化器912、第4MPEGオーディオパケット化器913、基準クロック情報生成器914、記録媒体916a〜916eが図示されている。
図9に示す符号化装置の基本的な構成は、図5に示す符号化装置と同一である。ただし、図5に示す符号化装置は、ビデオパケット及び4つのチャンネルのオーディオパケットに係るストリームが1つの記録媒体516に記録されるように構成されているが、図9に示す符号化装置は、ビデオパケット及び4つのチャンネルのオーディオパケットに係るストリームのそれぞれが、それぞれに対応する記録媒体916a〜916eに記録されるように構成されている。なお、例えば、各ストリームが、ネットワーク上に存在しているデータベースサイトに対して伝送され、そのデータベースサイトに記録されてもよい。
また、本発明の第3の実施の形態における記録伝送の記録動作は、記録媒体916a〜916eのそれぞれに各ストリームを分散して記録するという点を除いて、図6に示すフローチャートに係る記録動作と同一である。
次に、図9に図示されている符号化装置で生成されたデータの再生に係る構成及び動作について説明する。図10は、本発明の第3の実施の形態の再生装置を示すブロック図である。図10には、記録媒体1001a〜1001e、基準クロック情報読み取り器1003、基準クロック発生器1004、MPEGビデオパケット分離化器1005、MPEGビデオ復号器1006、ビデオタイムスタンプ読み取り器1007、MPEGオーディオパケット分離化器1008、チャンネル選択器1012、MPEGオーディオ復号器1013、オーディオタイムスタンプ読み取り器1014、同期再生制御器1015、表示器/音声出力器1016が図示されている。なお、各記録媒体1001a〜1001eは、記録媒体916a〜916eに対応しているが、上述のように、ネットワーク上に存在しているデータベースサイトと読み換えることも可能である。
図10に示す再生装置の基本的な構成は、図7に示す再生装置と同一である。ただし、図7に示す再生装置は、ビデオパケット及び4つのチャンネルのオーディオパケットに係るストリームを1つの記録媒体701から再生するように構成されているが、図10に示す再生装置は、ビデオパケット及び4つのチャンネルのオーディオパケットに係るストリームのそれぞれを、それぞれが記録されている各記録媒体1001a〜1001eから再生するように構成されている。
また、本発明の第3の実施の形態における再生動作は、記録媒体1001a〜1001eのそれぞれに分散して記録されている各ストリームを再生するという点を除いて、図8に示すフローチャートに係る記録動作と同一である。
以上、説明したように、本発明の第3の実施の形態によれば、マルチチャンネル情報を含むストリームを生成する際に、マルチチャンネル情報に係る複数の要素ストリームを構成するすべてのパケットを同一時間長(固定長)にするとともに、各要素ストリームに同一の基準時刻を割り当てて、各要素ストリームの同一時刻に再生されるデータに対して、それぞれ同一時刻を示すタイムスタンプ情報が記述されるので、特殊な処理を必要とせずに、マルチチャンネル情報の各要素ストリームのチャンネルチェンジをシームレスに実現することが可能となる。
なお、上述の本発明の第1〜第3の実施の形態において、マルチチャンネル情報は、MPEGシステムのように、各コンテンツが多重化されて1本のストリームになっていてもよく、また、コンテンツごとに分離されており複数本のストリームに対して同時にアクセスを行うようにしてもよい。また、上述の本発明の第1〜第3の実施の形態では、マルチチャンネル情報としてマルチチャンネル音響データを一例として用いたが、マルチチャンネルのビデオデータに対しても同様の動作及び効果が得られる。