JP2004228680A - 多重化装置、多重化方法及びプログラム - Google Patents
多重化装置、多重化方法及びプログラム Download PDFInfo
- Publication number
- JP2004228680A JP2004228680A JP2003011211A JP2003011211A JP2004228680A JP 2004228680 A JP2004228680 A JP 2004228680A JP 2003011211 A JP2003011211 A JP 2003011211A JP 2003011211 A JP2003011211 A JP 2003011211A JP 2004228680 A JP2004228680 A JP 2004228680A
- Authority
- JP
- Japan
- Prior art keywords
- priority
- data
- multiplexing
- encoded data
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
【課題】多重化に際して、復号側で好適に復号、合成される多重化装置、多重化方法及びプログラムを提供することを目的とする。
【解決手段】出力先で1画面を構成するための複数の符号化データをバッファメモリ4、5へ入力し、優先順位判定器8で前記符号化データの優先順位を決定し、整形器11で前記優先順位に従って、前記符号化データを多重化し、前記多重化されたデータを記憶装置12に出力する。
【選択図】 図1
【解決手段】出力先で1画面を構成するための複数の符号化データをバッファメモリ4、5へ入力し、優先順位判定器8で前記符号化データの優先順位を決定し、整形器11で前記優先順位に従って、前記符号化データを多重化し、前記多重化されたデータを記憶装置12に出力する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、多重化装置、多重化方法及びプログラムに関し、特に複数オブジェクトの符号化データの多重化に関するものである。
【0002】
【従来の技術】
近年、動画像の新しい符号化手段として、MPEG(Moving Picture ExpertsGroup)−4の標準化が進められている。これは従来のMPEG−2に代表される動画像符号化ではフレームあるいはフィールドを単位としていたが、コンテンツの再利用や編集を実現するために、MPEG−4では映像データやオーディオ・データをオブジェクト(物体)として扱う。さらに映像データに含まれる物体も独立して符号化され、それぞれもオブジェクトとして扱うことができる。
【0003】
このMPEG−4の標準化により、オブジェクトを別々に作成し、その配置やタイミングを調整して組み合わせることにより、様々なシーケンスを作成することが出来るようになった。これらを1つのストリームにまとめるために一般的に多重化が行われる。例えば、オブジェクトデータを時間情報に基づいて同期を取って多重化する方式に関しては、基準になるオブジェクトの時間情報に基づいた基準クロックで多重化している(例えば特許文献1参照)。また、スケーラビリティのあるオブジェクトデータの多重化に関して、オブジェクトのレイヤ毎に関連するデータを多重化した後に全体を多重化される(例えば特許文献2参照)。
【0004】
【特許文献1】
特開平10−23401(第4頁 図3)
【特許文献2】
特開平10−4539(第5頁 図1)
【0005】
【発明が解決しようとする課題】
しかしながら、従来のMPEG−2などの多重化では複数のオブジェクトの再生と合成までは対応していないという問題点が生じる。また、上記で開示されている技術において、オブジェクト間の多重化の順番等に関して記述されていない。ただオブジェクトのデータをならべただけでは復号の時間や合成の順番に合致しないため、正しく画像が構成されないといった問題が生じる。例えば、図5(A)のように背景となるオブジェクト1001に人のオブジェクト1002が合成されて1画面を構成する場合、オブジェクト1001のデータがオブジェクト1002のデータよりも順番が遅く多重化されると、オブジェクト1001が大きいためにタイムスタンプの時間までに再生が間に合わないという問題が生じる。
【0006】
図9(A)は、図5(A)において、オブジェクト1001のデータがオブジェクト1002のデータよりも後に多重化された場合の様子を示す。時間1100aはオブジェクト1002の第1フレームの符号化データを伝送するのに必要な時間を表し、時間1101aはオブジェクト1001の第1フレームの符号化データを伝送するのに必要な時間を表し、以下、時間1102a、時間1103aはオブジェクト1002、1001の第2フレームの符号化データを伝送する時間を表す。
【0007】
時間1104a、1106aはオブジェクト1002の符号化データを復号するのに必要な時間を、時間1105a、1107aはオブジェクト1001の符号化データを復号するのに必要な時間を表す。オブジェクト1001は大きいので復号に多くの時間を必要とする。時間1105aの終わりにオブジェクト1002と1001の第1フレームのデータが揃うが、オブジェクト1002の第2フレームが表示可能になるまでの時間が短く、非常に短時間表示されるか、データの転送時間等を考慮すると表示されない。時間1108aは第1フレームが表示されない時間を表す。時間1009aにはオブジェクト1000の第1フレームオブジェクトと1001の第2フレームが合成されて表示される。
【0008】
従って、本発明は前記課題を考慮して、多重化に際して、復号側で好適に復号、合成される多重化装置、多重化方法及びプログラムを提供することを目的としている。
【0009】
【課題を解決するための手段】
上記課題を解決するために本発明の多重化装置は、出力先で1画面を構成するための複数の符号化データを入力する入力手段と、前記符号化データの優先順位を決定する優先順位決定手段と、前記優先順位に従って、前記符号化データを多重化する多重化手段と、前記多重化されたデータを出力する出力手段とを有することを特徴とする。
【0010】
上記課題を解決するために本発明の多重化方法は、出力先で1画面を構成するための複数の符号化データを入力する入力工程と、前記入力工程で入力された符号化データの優先順位を決定する優先順位決定工程と、前記優先順位決定工程で決定した優先順位に従って、前記符号化データを多重化する多重化工程と、前記多重化工程で多重化されたデータを出力する出力工程とを有することを特徴とする。
【0011】
【発明の実施の形態】
〈第1実施例〉
以下、本発明の第1の実施例を、図面を用いて詳細に説明する。
【0012】
図1は本発明を適用する多重化システムの構成を示すブロック図である。図1において、1は本発明に基づく多重化装置である。2、3は画像を入力して符号化する符号化器である。符号化器2はMPEG−4符号化方式で任意形状符号化を扱うCore Profileの符号化を行なうものとするがこれに限定されない。ここでは図5(A)のオブジェクト1002を符号化するものとする。符号化器3はMPEG−4符号化方式で矩形符号化を扱うSimple Profileの符号化を行なうものとするがこれに限定されない。ここでは図5(A)のオブジェクト1001を符号化するものとする。4、5はバッファメモリであり、符号化データを格納する。6、7は符号の一部を解析する解析器、8は解析器6,7からの出力によって多重化の優先順位を決定する優先順位判定器である。9、10は選択器であり、優先順位判定器8の出力によって、入力を後段に出力する。11は整形器であり、入力された符号化データを多重化の書式に整え、ビットストリームとして出力する。ここではその書式としてMPEG−4符号化方式のファイルフォーマットMP4とする。12は出力されたビットストリームを蓄積する記憶装置である。13は符号化器2、3に対して優先順位を設定する優先順位設定器であり、符号化器2、3は符号化時にVOLヘッダにあるvisual_object_priority符号にその値を設定して符号化する。ここでは背景を符号化する符号化器3の優先順位を1に、内包されるオブジェクトを符号化する符号化器2に0をセットする。
【0013】
上記のように構成された多重化システムにおける画像の符号化データの多重化動作を以下で説明する。
【0014】
処理に先立ち、各部を初期化する。バッファメモリ4、5は0でクリアされ、記憶装置12では書き込みのために所定の領域を確保する。符号化器2はMPEG−4符号化方式に従って、各フレームの符号化データの先立って付与されるヘッダデータを生成する。このヘッダデータはvisual_object_start_codeから始まり、VisualObjectレイヤ、VOL(Video Object Plane)のレイヤの符号を生成する。符号化器2はVisualObjectレイヤのvisual_object_priorityを0としておく。生成されたヘッダデータはバッファメモリ4に入力される。同様に符号化器3でもヘッダデータを生成する。符号化器2はVisualObjectレイヤのvisual_object_priorityを1としておき、バッファメモリ5に入力される。
【0015】
解析器6,7はそれぞれ、バッファメモリ4,5からヘッダデータを読み出し、visual_object_priorityの内容を抽出する。この結果を優先順位判定器8に入力する。優先順位判定器8はvisual_object_priorityが大きい方が優先順位が高いと判定して、選択器10の出力を整形器11に開放し、バッファメモリ5の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。続いて、選択器9の出力を整形器11に開放し、バッファメモリ4の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。
【0016】
続いて、符号化器2、3とも同じフレームレートで画像を符号化する。符号化器2は任意形状の画像データをMPEG−4符号化方式のCore Profileに従って符号化して符号化データをバッファメモリ4に格納する。同時に、符号化器3は矩形の画像データをMPEG−4符号化方式のSimple Profileに従って符号化して符号化データをバッファメモリ5に格納する。
【0017】
優先順位判定器8はまず、選択器10の出力を整形器11に開放し、バッファメモリ5の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。続いて、選択器9の出力を整形器11に開放し、バッファメモリ4の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。
【0018】
以後、この順で最後まで多重化を行ない、全てのフレームの処理が終われば全体の処理を終了する。
【0019】
以上、符号化データの蓄積までの処理の簡単な流れを、図6を用いて説明する。図6は、第1の実施例における多重化動作を示すフローチャート図である。
【0020】
まずステップS1にて、各符号化器において、符号化ヘッダを生成する。ステップS2にて、符号化ヘッダの中からvisual_object_priority符号を抽出する。ステップS3にて、符号の値の大きさに基づいて優先順位を決定し、選択器を制御する。ステップS4にて、優先順位の上位からヘッダデータを書式に従って記述・整形して出力する。ステップS5にて、処理の終了判断を行なう。
【0021】
ステップS6では、各符号化器でフレーム(MPEG−4ではVOP(Video Object Plane))を符号化する。ステップS7にて、各符号化器のフレームの符号化データの処理の終了判断を行なう。ステップS8にて、選択器を制御してフレームの符号化データを優先順位上位から読み出し、書式に従って記述・整形して出力する。ステップS7で、フレームデータの出力処理が終わればステップS5に戻る。ステップS5で、符号化処理が終了すれば、全体の処理を終了する。
【0022】
このような一連の選択動作により、オブジェクトの優先順位を反映してオブジェクト毎に多重化の優先順位を付けることができ、復号側でオブジェクトに付与された優先順位に従って復号を開始することができるようになる。また、図9(B)は、図5(A)において、オブジェクト1001のデータがオブジェクト1002のデータよりも先に多重化された場合の様子を示す。図9(B)に示すように、第1フレームが表示されない時間1008bは図9(A)の時間1008aに比べて短縮され、時間1009bにはオブジェクト1002と1001の第1フレームが正しく合成されて表示される。
【0023】
〈第2実施例〉
図2は本発明の第2の実施例としての多重化システムの構成を示す図である。なお、前述の実施例の図1と同様の構成要素については同一番号を付してその詳細な説明は省略する。
【0024】
図2において、51は本発明に基づく多重化装置である。52はビデオ符号化器であり、MPEG―4符号化方式で符号化するものとして説明するが、これに限定されない。ここでは説明を容易にするため、Core Profileの符号化を行なうものとし、図5(A)のオブジェクト1002を符号化するものとして説明する。53はビデオ符号化器であり、MPEG―2符号化方式で符号化するものとして説明するが、これに限定されない。なお、ここでは図5(A)のオブジェクト1001を符号化するものとして説明する。54はオーディオ符号化器であり、入力されたオーディオデータを符号化する。ここではMPEG−4符号化方式のHVXC(Harmonic Vector Excitation Coding)符号化方式を例に取るがこれに限定されない。55はオーディオ符号化器であり、入力されたオーディオデータを符号化する。ここではMPEG−2符号化方式のAAC(Advanced Audio Coding)符号化方式を例に取るがこれに限定されない。56、57はバッファメモリであり、オーディオ符号化データを格納する。ここでは説明を容易にするため、それぞれビデオ1フレームと同じ間隔の符号化データを格納するものとする。58、59は符号の一部を解析する解析器であり、画像のサイズを検出する。60は解析器58,59からの出力によって多重化の優先順位を決定する優先順位判定器である。61、62は選択器であり、優先順位判定器60の出力によって、入力を後段に出力する。
【0025】
上記のように構成された多重化システムにおける画像の符号化データの多重化動作を以下で説明する。
【0026】
処理に先立ち、各部を初期化する。バッファメモリ4、5、56、57は0でクリアされ、記憶装置12では書き込みのために所定の領域を確保する。ビデオ符号化器52は第1の実施例の図1記載の符号化器2または3と同様にMPEG−4符号化方式に従って、各フレームの符号化データの先立って付与されるヘッダデータを生成する。生成されたヘッダデータはバッファメモリ4に入力される。ビデオ符号化器52はVideo Object Layerレイヤのvideo_object_layer_width符号とvideo_object_layer_height符号によって画像サイズを符号化している。また、Core Profileなどの任意形状を扱う場合は各フレームにオブジェクトの幅を表すvop_width符号と高さを表すvop_height符号が含まれている。
【0027】
ビデオ符号化器53はMPEG−2符号化方式に従って、各フレームの符号化データの先立って付与されるヘッダデータを生成する。生成されたヘッダデータはバッファメモリ5に入力される。ビデオ符号化器53はシーケンスレイヤのHorizontal Size Value符号とVertical Size
Value符号によって画像サイズを符号化している。
【0028】
各ビデオ符号化器がヘッダを生成する間にオーディオ符号化器54、55も同様に符号化ヘッダを作成する。オーディオ符号化器54はHVXC符号化の、オーディオ符号化器55はAACの符号化ヘッダをそれぞれ作成し、バッファメモリ56、57に格納する。
【0029】
解析器58,59はそれぞれ、バッファメモリ4,5からヘッダデータを読み出し、画像サイズを表す符号の内容を抽出する。解析器58はvideo_object_layer_width符号とvideo_object_layer_height符号を抽出し、画像サイズとして出力する。解析器58において、抽出した符号を復号し、画像サイズを得る。Core Profileの場合は各フレーム毎に画像サイズを出力する。解析器59はHorizontalSize Value符号とVertical Size Value符号を抽出して画像サイズとして出力する。
【0030】
この結果を優先順位判定器60に入力する。優先順位判定器60はそれぞれ縦、横のサイズを積算して面積をそれぞれ算出し、面積が大きい方を優先順位が高いと判定する。解析器58からは内包されるオブジェクトの大きさが入力され、解析器59からは背景の大きさが入力されるので、背景の大きさがオブジェクトの大きさより大きい場合は、まず、選択器62の出力を整形器11に開放し、バッファメモリ5及びバッファメモリ57の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。続いて、選択器61の出力を整形器11に開放し、バッファメモリ4及びバッファメモリ56の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。
【0031】
続いて、ビデオ符号化器52、53とオーディオ符号化器54、55はとも同じフレームレートで画像を符号化する。ビデオ符号化器52は任意形状の画像データをMPEG−4符号化方式のCore Profileに従って符号化し、符号化データをバッファメモリ4に格納する。同時に、ビデオ符号化器53は画像データをMPEG−2符号化方式に従って符号化し、符号化データをバッファメモリ5に格納する。ここで、解析器58は各VOPのヘッダデータを解析し、vop_width符号とvop_height符号から各VOPの大きさを抽出し、優先順位判定器60に入力する。優先順位判定器60はヘッダの時と同様にして、画像の大きさを判定して、選択器61、62を制御する。
【0032】
図5(A)のようにオブジェクト1002が小さければ、まず、選択器62の出力を整形器11に開放し、バッファメモリ5及びバッファメモリ57の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。続いて、選択器61の出力を整形器11に開放し、バッファメモリ4及びバッファメモリ56の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。
【0033】
図5(B)のようにオブジェクト1002が大きくなり、オブジェクト1001の大きさを超えるようになった場合、まず、選択器61の出力を整形器11に開放し、バッファメモリ4及びバッファメモリ56の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。続いて、選択器62の出力を整形器11に開放し、バッファメモリ5及びバッファメモリ57の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。
【0034】
以後、このようにして最後のフレームまで多重化を行ない、全てのフレームの処理が終われば全体の処理を終了する。
【0035】
以上、符号化データの蓄積までの処理の簡単な流れを、図7を用いて説明する。図7は、第2の実施例における多重化動作を示すフローチャート図である。
【0036】
まずステップS51にて、各符号化器において、符号化ヘッダを生成する。ステップS52にて、符号化ヘッダの中から画像の大きさを表す符号を抽出する。ステップS53にて、画像の大きさに基づいて優先順位を決定し、選択器を制御する。ステップS54にて、ヘッダデータを優先順位上位から読み出し、書式に従って記述・整形して出力する。ステップS55にて、処理の終了判断を行なう。
【0037】
ステップS56では、各ビデオ符号化器でフレーム(MPEG−4ではVOP、MPEG−2ではピクチャ)を、各オーディオ符号化器で所定長のオーディオデータを符号化する。ステップS57にて、符号化ヘッダの中から画像の大きさを表す符号を抽出する。ステップS58にて、画像の大きさに基づいて優先順位を決定し、選択器を制御する。
【0038】
ステップS59にて、各符号化器からのフレーム単位の符号化データの処理の終了判断を行なう。ステップS60にて、選択器を制御してフレームの符号化データを優先順位上位から読み出し、書式に従って記述・整形して出力する。ステップS59でフレームデータの出力処理が終わればステップS55に戻る。ステップS55で符号化処理が終了すれば、全体の処理を終了する。
【0039】
このような一連の選択動作により、オブジェクトの大きさを反映してオブジェクト毎に多重化の優先順位を付けることができ、復号側で大きな画像から復号を開始することができるようになる。一般的に大きな画像が背景であり、先に復号しておくことで、重畳による合成処理を好適に行なうことが出来るようになる。
【0040】
また、ビデオデータだけではなく、オーディオデータも関連付けられて同じように多重化することが可能になる。
【0041】
さらには、各フレーム毎で優先順位を判断して適宜変更することで、画像の変化にも容易に対応できる効果もある。
【0042】
〈第3実施例〉
図3は、本発明の第3の実施に係る多重化システムの構成を示すブロック図である。図3において、300は装置全体の制御、及び種々の処理を行う中央演算装置(CPU)、301は本装置の制御に必要なオペレーティングシステム(OS)、ソフトウェア、演算に必要な記憶領域を提供するメモリである。
【0043】
302は種々の装置をつなぎ、データ、制御信号をやり取りするバスである。303は装置の起動、各種条件の設定、再生の指示を行なうための端末である。304はソフトウェアを蓄積する記憶装置である。305は画像データを蓄積する記憶装置、306は画像を撮像するカメラである。記憶装置304および、305はシステムから切り離して移動できるメディアで構成することも出来る。307は画像を表示するモニタであり、308は通信回線であり、LAN、公衆回線、無線回線、放送電波等で構成されている。309は通信回線308を介して画像データを送受信する通信インターフェースである。
【0044】
このような構成において、画像データの多重化処理について説明する。ここでは、カメラ306で撮像された画像データをMPEG−2符号化方式で符号化し、合成する動画像データとして記憶装置305からMPEG−4符号化方式のCore Profileで符号化された任意形状の符号化データを読み出して同期させて多重化し、通信インターフェース309から送信する例をもって説明する。
【0045】
処理に先立ち、端末303から装置全体に対して起動が指示され、各部が初期化される。すると記憶装置304に格納されているソフトウェアがバス302を介してメモリ301に展開され、ソフトウェアが起動される。
【0046】
図4は実施例4におけるメモリ301のメモリの使用、格納状況を示す。
【0047】
メモリ301には装置全体を制御し、各種ソフトウェアを動作させるためのOS、符号化を行なうソフトウェア、多重化を行なうソフトウェア、データを送受信する通信ソフトウェアが格納されている。
【0048】
また、符号化の際に画像データを格納する画像エリア、生成したり読み出した符号化データを格納する符号エリア、各種演算や各フレームの符号長等のパラメータ等を格納しておくワーキングエリアが存在する。
【0049】
このような構成において、処理に先立ち、端末303から動画像の入力をカメラ306からとする。また記憶装置305から符号化データを読み出すために読み出し位置を調整する。
【0050】
次に、CPU300による動画像データの符号化動作を図8に示すフローチャートに従って説明する。図8は、第3の実施例における多重化動作を示すフローチャート図である。
【0051】
まず、ステップS101では、カメラ306からの符号化に先立ち、メモリ301上の符号化ソフトウェアによって、符号化ヘッダを生成し、符号エリア1に格納してステップS102に進む。続いて、ステップS102にて、記憶装置305よりMPEG−4符号化されたデータの符号化ヘッダを読み出し、符号エリア2に格納してステップS103に進む。ステップS103にて、符号化ヘッダの符号長を算出して、ステップS104に進む。
【0052】
ステップS104にて、それぞれの符号長に基づいて優先順位を決定し、符号長が大きいものを優先順位が高いものと判定する。ここでは、カメラ306から入力されてMPEG−2符号化されるデータの方が大きいとして説明する。但し、記憶装置305から読み出されるデータの方が大きくても全く問題はない。
【0053】
ステップS105にて、記憶装置305からヘッダデータを優先順位上位から読み出し、メモリ301上の多重化ソフトウェアによって書式に従って記述・整形し、通信ソフトウェアによって通信インターフェース309より通信回線308に出力してステップS106に進む。
【0054】
ステップS106にて、カメラ306からの入力が続いていて、かつ記憶装置305上に符号化データがあるならばステップS107に進み、処理を続け、どちらかが無くなれば処理が終了したと判断し、全体の処理を終了する。
【0055】
ステップS107では、カメラ306から入力された1フレームをメモリ301上の画像エリアに格納し、符号化ソフトウェアを動作させて1フレーム分の符号化データを生成し、符号エリア1に格納して、ステップS108に進む。
【0056】
ステップS108にて、記憶装置305よりMPEG−4符号化されたデータの1フレーム分の符号化データを読み出し、符号エリア2に格納してステップS109に進む。ステップS109にて、符号エリア1と符号エリア2に格納されている符号化データのそれぞれの符号長を算出して、ステップS110に進む。
ステップS110にて、それぞれの符号長に基づいて優先順位を決定し、ステップS111に進む。ステップS111にて、フレーム単位の各符号化データがすべて多重化処理されたかを判断し、終了していればステップS106に進み、そうでなければステップS112に進む。
【0057】
ステップS112にて、優先順位に従って、上位から該当する符号化データの符号エリアからフレームの符号化データを読み出し、書式に従って記述・整形して通信ソフトウェアによって通信インターフェース309より通信回線308に出力し、読み出した符号エリアのデータをクリアする。ステップS111に戻る。ステップS111では各符号エリアの内容がクリアされているか否かを調べることでデータの有無を確認できる。
【0058】
このような一連の選択動作により、データの大きさを反映してオブジェクト毎に多重化の優先順位を付けることができ、復号側でデータ量の大きなデータから復号を開始することができるようになる。一般的にデータ量の大きなデータは復号に時間が掛かるため、先に復号を開始することにより、パラレル処理等を行なった場合に合成までの時間を確保でき、復号・合成処理を好適に行なうことが出来るようになる。
【0059】
また、本実施例ではビデオデータを例にとって説明したが、これに限定されず、オーディオデータ等でも同じように多重化することが可能になる。
さらには、各フレーム毎で優先順位を判断して適宜変更することで、画像の変化にも容易に対応できる効果もある。
【0060】
また、オブジェクトに関連するオーディオとビデオのデータの符号長を合計したものによって優先順位を決定してももちろんかまわない。
【0061】
また、多重化されたビットストリームを記憶装置305に蓄積してももちろんかまわない。
【0062】
<その他の実施形態>
また、上記実施形態では、ネットワークを構成するハードウェア等が含まれるものの、各処理部は実際はソフトウェアで実現できるものである。即ち、本発明の目的は、上述した実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または、記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(または、CPUやMPU)が、記憶媒体に格納されたプログラムコードを読み出し、実行することによっても達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が、上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体が本発明を構成することになる。
【0063】
また、コンピュータが読み出したプログラムコードを実行することにより、上述した実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)等が、実際の処理の一部または全部を行ない、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0064】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が、実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0065】
また、上記実施例において、動画像の符号化方式をMPEG−4としたがこれに限定されず、他の符号化方式、たとえば、H.261、MPEG−1、MPEG−2、Motion JPEG(Joint Photographic Experts Group)でももちろん構わない。また、出力のファイルフォーマットもこれに限定されない。
【0066】
さらに、上記実施例ではオブジェクトが2つの場合について説明したが、これに限定されない。必要なバッファメモリや解析器、または、符号エリアをオブジェクトの数に合わせて追加することで任意の数のオブジェクトに対応できることは明らかである。
【0067】
また、上記実施例では、多重化の優先順位を入力される符号化データから自動的に得ることにより、多重化に関する外部からの制御等を省略でき、装置の小型化、処理の軽減を行なう効果もある。
【0068】
【発明の効果】
以上の説明から明らかなように、本発明では、多重化に際して、符号化データを優先順位に従って多重化することにより、復号側での復号、合成等の処理を好適に行なうことができる。
【図面の簡単な説明】
【図1】第1の実施例としての本発明にかかる多重化システムの構成を示すブロック図である。
【図2】第2の実施例としての本発明にかかる多重化システムの構成を示すブロック図である。
【図3】第3の実施例としての本発明にかかる多重化システムの構成を示すブロック図である。
【図4】本発明の第3の実施例におけるメモリ301のメモリの使用、格納状況を表す図である。
【図5】復号側での画像の合成の様子を表す図である。
【図6】本発明の第1の実施例における多重化動作を示すフローチャート図である。
【図7】本発明の第2の実施例における多重化動作を示すフローチャート図である。
【図8】本発明の第3の実施例における多重化動作を示すフローチャート図である。
【図9】(A)は、図5(A)において、オブジェクト1001のデータがオブジェクト1002のデータよりも後に多重化された場合の説明図である。(B)は、図5(A)において、オブジェクト1001のデータがオブジェクト1002のデータよりも先に多重化された場合の説明図である。
【発明の属する技術分野】
本発明は、多重化装置、多重化方法及びプログラムに関し、特に複数オブジェクトの符号化データの多重化に関するものである。
【0002】
【従来の技術】
近年、動画像の新しい符号化手段として、MPEG(Moving Picture ExpertsGroup)−4の標準化が進められている。これは従来のMPEG−2に代表される動画像符号化ではフレームあるいはフィールドを単位としていたが、コンテンツの再利用や編集を実現するために、MPEG−4では映像データやオーディオ・データをオブジェクト(物体)として扱う。さらに映像データに含まれる物体も独立して符号化され、それぞれもオブジェクトとして扱うことができる。
【0003】
このMPEG−4の標準化により、オブジェクトを別々に作成し、その配置やタイミングを調整して組み合わせることにより、様々なシーケンスを作成することが出来るようになった。これらを1つのストリームにまとめるために一般的に多重化が行われる。例えば、オブジェクトデータを時間情報に基づいて同期を取って多重化する方式に関しては、基準になるオブジェクトの時間情報に基づいた基準クロックで多重化している(例えば特許文献1参照)。また、スケーラビリティのあるオブジェクトデータの多重化に関して、オブジェクトのレイヤ毎に関連するデータを多重化した後に全体を多重化される(例えば特許文献2参照)。
【0004】
【特許文献1】
特開平10−23401(第4頁 図3)
【特許文献2】
特開平10−4539(第5頁 図1)
【0005】
【発明が解決しようとする課題】
しかしながら、従来のMPEG−2などの多重化では複数のオブジェクトの再生と合成までは対応していないという問題点が生じる。また、上記で開示されている技術において、オブジェクト間の多重化の順番等に関して記述されていない。ただオブジェクトのデータをならべただけでは復号の時間や合成の順番に合致しないため、正しく画像が構成されないといった問題が生じる。例えば、図5(A)のように背景となるオブジェクト1001に人のオブジェクト1002が合成されて1画面を構成する場合、オブジェクト1001のデータがオブジェクト1002のデータよりも順番が遅く多重化されると、オブジェクト1001が大きいためにタイムスタンプの時間までに再生が間に合わないという問題が生じる。
【0006】
図9(A)は、図5(A)において、オブジェクト1001のデータがオブジェクト1002のデータよりも後に多重化された場合の様子を示す。時間1100aはオブジェクト1002の第1フレームの符号化データを伝送するのに必要な時間を表し、時間1101aはオブジェクト1001の第1フレームの符号化データを伝送するのに必要な時間を表し、以下、時間1102a、時間1103aはオブジェクト1002、1001の第2フレームの符号化データを伝送する時間を表す。
【0007】
時間1104a、1106aはオブジェクト1002の符号化データを復号するのに必要な時間を、時間1105a、1107aはオブジェクト1001の符号化データを復号するのに必要な時間を表す。オブジェクト1001は大きいので復号に多くの時間を必要とする。時間1105aの終わりにオブジェクト1002と1001の第1フレームのデータが揃うが、オブジェクト1002の第2フレームが表示可能になるまでの時間が短く、非常に短時間表示されるか、データの転送時間等を考慮すると表示されない。時間1108aは第1フレームが表示されない時間を表す。時間1009aにはオブジェクト1000の第1フレームオブジェクトと1001の第2フレームが合成されて表示される。
【0008】
従って、本発明は前記課題を考慮して、多重化に際して、復号側で好適に復号、合成される多重化装置、多重化方法及びプログラムを提供することを目的としている。
【0009】
【課題を解決するための手段】
上記課題を解決するために本発明の多重化装置は、出力先で1画面を構成するための複数の符号化データを入力する入力手段と、前記符号化データの優先順位を決定する優先順位決定手段と、前記優先順位に従って、前記符号化データを多重化する多重化手段と、前記多重化されたデータを出力する出力手段とを有することを特徴とする。
【0010】
上記課題を解決するために本発明の多重化方法は、出力先で1画面を構成するための複数の符号化データを入力する入力工程と、前記入力工程で入力された符号化データの優先順位を決定する優先順位決定工程と、前記優先順位決定工程で決定した優先順位に従って、前記符号化データを多重化する多重化工程と、前記多重化工程で多重化されたデータを出力する出力工程とを有することを特徴とする。
【0011】
【発明の実施の形態】
〈第1実施例〉
以下、本発明の第1の実施例を、図面を用いて詳細に説明する。
【0012】
図1は本発明を適用する多重化システムの構成を示すブロック図である。図1において、1は本発明に基づく多重化装置である。2、3は画像を入力して符号化する符号化器である。符号化器2はMPEG−4符号化方式で任意形状符号化を扱うCore Profileの符号化を行なうものとするがこれに限定されない。ここでは図5(A)のオブジェクト1002を符号化するものとする。符号化器3はMPEG−4符号化方式で矩形符号化を扱うSimple Profileの符号化を行なうものとするがこれに限定されない。ここでは図5(A)のオブジェクト1001を符号化するものとする。4、5はバッファメモリであり、符号化データを格納する。6、7は符号の一部を解析する解析器、8は解析器6,7からの出力によって多重化の優先順位を決定する優先順位判定器である。9、10は選択器であり、優先順位判定器8の出力によって、入力を後段に出力する。11は整形器であり、入力された符号化データを多重化の書式に整え、ビットストリームとして出力する。ここではその書式としてMPEG−4符号化方式のファイルフォーマットMP4とする。12は出力されたビットストリームを蓄積する記憶装置である。13は符号化器2、3に対して優先順位を設定する優先順位設定器であり、符号化器2、3は符号化時にVOLヘッダにあるvisual_object_priority符号にその値を設定して符号化する。ここでは背景を符号化する符号化器3の優先順位を1に、内包されるオブジェクトを符号化する符号化器2に0をセットする。
【0013】
上記のように構成された多重化システムにおける画像の符号化データの多重化動作を以下で説明する。
【0014】
処理に先立ち、各部を初期化する。バッファメモリ4、5は0でクリアされ、記憶装置12では書き込みのために所定の領域を確保する。符号化器2はMPEG−4符号化方式に従って、各フレームの符号化データの先立って付与されるヘッダデータを生成する。このヘッダデータはvisual_object_start_codeから始まり、VisualObjectレイヤ、VOL(Video Object Plane)のレイヤの符号を生成する。符号化器2はVisualObjectレイヤのvisual_object_priorityを0としておく。生成されたヘッダデータはバッファメモリ4に入力される。同様に符号化器3でもヘッダデータを生成する。符号化器2はVisualObjectレイヤのvisual_object_priorityを1としておき、バッファメモリ5に入力される。
【0015】
解析器6,7はそれぞれ、バッファメモリ4,5からヘッダデータを読み出し、visual_object_priorityの内容を抽出する。この結果を優先順位判定器8に入力する。優先順位判定器8はvisual_object_priorityが大きい方が優先順位が高いと判定して、選択器10の出力を整形器11に開放し、バッファメモリ5の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。続いて、選択器9の出力を整形器11に開放し、バッファメモリ4の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。
【0016】
続いて、符号化器2、3とも同じフレームレートで画像を符号化する。符号化器2は任意形状の画像データをMPEG−4符号化方式のCore Profileに従って符号化して符号化データをバッファメモリ4に格納する。同時に、符号化器3は矩形の画像データをMPEG−4符号化方式のSimple Profileに従って符号化して符号化データをバッファメモリ5に格納する。
【0017】
優先順位判定器8はまず、選択器10の出力を整形器11に開放し、バッファメモリ5の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。続いて、選択器9の出力を整形器11に開放し、バッファメモリ4の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。
【0018】
以後、この順で最後まで多重化を行ない、全てのフレームの処理が終われば全体の処理を終了する。
【0019】
以上、符号化データの蓄積までの処理の簡単な流れを、図6を用いて説明する。図6は、第1の実施例における多重化動作を示すフローチャート図である。
【0020】
まずステップS1にて、各符号化器において、符号化ヘッダを生成する。ステップS2にて、符号化ヘッダの中からvisual_object_priority符号を抽出する。ステップS3にて、符号の値の大きさに基づいて優先順位を決定し、選択器を制御する。ステップS4にて、優先順位の上位からヘッダデータを書式に従って記述・整形して出力する。ステップS5にて、処理の終了判断を行なう。
【0021】
ステップS6では、各符号化器でフレーム(MPEG−4ではVOP(Video Object Plane))を符号化する。ステップS7にて、各符号化器のフレームの符号化データの処理の終了判断を行なう。ステップS8にて、選択器を制御してフレームの符号化データを優先順位上位から読み出し、書式に従って記述・整形して出力する。ステップS7で、フレームデータの出力処理が終わればステップS5に戻る。ステップS5で、符号化処理が終了すれば、全体の処理を終了する。
【0022】
このような一連の選択動作により、オブジェクトの優先順位を反映してオブジェクト毎に多重化の優先順位を付けることができ、復号側でオブジェクトに付与された優先順位に従って復号を開始することができるようになる。また、図9(B)は、図5(A)において、オブジェクト1001のデータがオブジェクト1002のデータよりも先に多重化された場合の様子を示す。図9(B)に示すように、第1フレームが表示されない時間1008bは図9(A)の時間1008aに比べて短縮され、時間1009bにはオブジェクト1002と1001の第1フレームが正しく合成されて表示される。
【0023】
〈第2実施例〉
図2は本発明の第2の実施例としての多重化システムの構成を示す図である。なお、前述の実施例の図1と同様の構成要素については同一番号を付してその詳細な説明は省略する。
【0024】
図2において、51は本発明に基づく多重化装置である。52はビデオ符号化器であり、MPEG―4符号化方式で符号化するものとして説明するが、これに限定されない。ここでは説明を容易にするため、Core Profileの符号化を行なうものとし、図5(A)のオブジェクト1002を符号化するものとして説明する。53はビデオ符号化器であり、MPEG―2符号化方式で符号化するものとして説明するが、これに限定されない。なお、ここでは図5(A)のオブジェクト1001を符号化するものとして説明する。54はオーディオ符号化器であり、入力されたオーディオデータを符号化する。ここではMPEG−4符号化方式のHVXC(Harmonic Vector Excitation Coding)符号化方式を例に取るがこれに限定されない。55はオーディオ符号化器であり、入力されたオーディオデータを符号化する。ここではMPEG−2符号化方式のAAC(Advanced Audio Coding)符号化方式を例に取るがこれに限定されない。56、57はバッファメモリであり、オーディオ符号化データを格納する。ここでは説明を容易にするため、それぞれビデオ1フレームと同じ間隔の符号化データを格納するものとする。58、59は符号の一部を解析する解析器であり、画像のサイズを検出する。60は解析器58,59からの出力によって多重化の優先順位を決定する優先順位判定器である。61、62は選択器であり、優先順位判定器60の出力によって、入力を後段に出力する。
【0025】
上記のように構成された多重化システムにおける画像の符号化データの多重化動作を以下で説明する。
【0026】
処理に先立ち、各部を初期化する。バッファメモリ4、5、56、57は0でクリアされ、記憶装置12では書き込みのために所定の領域を確保する。ビデオ符号化器52は第1の実施例の図1記載の符号化器2または3と同様にMPEG−4符号化方式に従って、各フレームの符号化データの先立って付与されるヘッダデータを生成する。生成されたヘッダデータはバッファメモリ4に入力される。ビデオ符号化器52はVideo Object Layerレイヤのvideo_object_layer_width符号とvideo_object_layer_height符号によって画像サイズを符号化している。また、Core Profileなどの任意形状を扱う場合は各フレームにオブジェクトの幅を表すvop_width符号と高さを表すvop_height符号が含まれている。
【0027】
ビデオ符号化器53はMPEG−2符号化方式に従って、各フレームの符号化データの先立って付与されるヘッダデータを生成する。生成されたヘッダデータはバッファメモリ5に入力される。ビデオ符号化器53はシーケンスレイヤのHorizontal Size Value符号とVertical Size
Value符号によって画像サイズを符号化している。
【0028】
各ビデオ符号化器がヘッダを生成する間にオーディオ符号化器54、55も同様に符号化ヘッダを作成する。オーディオ符号化器54はHVXC符号化の、オーディオ符号化器55はAACの符号化ヘッダをそれぞれ作成し、バッファメモリ56、57に格納する。
【0029】
解析器58,59はそれぞれ、バッファメモリ4,5からヘッダデータを読み出し、画像サイズを表す符号の内容を抽出する。解析器58はvideo_object_layer_width符号とvideo_object_layer_height符号を抽出し、画像サイズとして出力する。解析器58において、抽出した符号を復号し、画像サイズを得る。Core Profileの場合は各フレーム毎に画像サイズを出力する。解析器59はHorizontalSize Value符号とVertical Size Value符号を抽出して画像サイズとして出力する。
【0030】
この結果を優先順位判定器60に入力する。優先順位判定器60はそれぞれ縦、横のサイズを積算して面積をそれぞれ算出し、面積が大きい方を優先順位が高いと判定する。解析器58からは内包されるオブジェクトの大きさが入力され、解析器59からは背景の大きさが入力されるので、背景の大きさがオブジェクトの大きさより大きい場合は、まず、選択器62の出力を整形器11に開放し、バッファメモリ5及びバッファメモリ57の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。続いて、選択器61の出力を整形器11に開放し、バッファメモリ4及びバッファメモリ56の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。
【0031】
続いて、ビデオ符号化器52、53とオーディオ符号化器54、55はとも同じフレームレートで画像を符号化する。ビデオ符号化器52は任意形状の画像データをMPEG−4符号化方式のCore Profileに従って符号化し、符号化データをバッファメモリ4に格納する。同時に、ビデオ符号化器53は画像データをMPEG−2符号化方式に従って符号化し、符号化データをバッファメモリ5に格納する。ここで、解析器58は各VOPのヘッダデータを解析し、vop_width符号とvop_height符号から各VOPの大きさを抽出し、優先順位判定器60に入力する。優先順位判定器60はヘッダの時と同様にして、画像の大きさを判定して、選択器61、62を制御する。
【0032】
図5(A)のようにオブジェクト1002が小さければ、まず、選択器62の出力を整形器11に開放し、バッファメモリ5及びバッファメモリ57の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。続いて、選択器61の出力を整形器11に開放し、バッファメモリ4及びバッファメモリ56の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。
【0033】
図5(B)のようにオブジェクト1002が大きくなり、オブジェクト1001の大きさを超えるようになった場合、まず、選択器61の出力を整形器11に開放し、バッファメモリ4及びバッファメモリ56の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。続いて、選択器62の出力を整形器11に開放し、バッファメモリ5及びバッファメモリ57の内容を整形器11に入力する。整形器11はMP4ファイルフォーマットの書式に従って記述し、記憶装置12の所定の位置に蓄積する。
【0034】
以後、このようにして最後のフレームまで多重化を行ない、全てのフレームの処理が終われば全体の処理を終了する。
【0035】
以上、符号化データの蓄積までの処理の簡単な流れを、図7を用いて説明する。図7は、第2の実施例における多重化動作を示すフローチャート図である。
【0036】
まずステップS51にて、各符号化器において、符号化ヘッダを生成する。ステップS52にて、符号化ヘッダの中から画像の大きさを表す符号を抽出する。ステップS53にて、画像の大きさに基づいて優先順位を決定し、選択器を制御する。ステップS54にて、ヘッダデータを優先順位上位から読み出し、書式に従って記述・整形して出力する。ステップS55にて、処理の終了判断を行なう。
【0037】
ステップS56では、各ビデオ符号化器でフレーム(MPEG−4ではVOP、MPEG−2ではピクチャ)を、各オーディオ符号化器で所定長のオーディオデータを符号化する。ステップS57にて、符号化ヘッダの中から画像の大きさを表す符号を抽出する。ステップS58にて、画像の大きさに基づいて優先順位を決定し、選択器を制御する。
【0038】
ステップS59にて、各符号化器からのフレーム単位の符号化データの処理の終了判断を行なう。ステップS60にて、選択器を制御してフレームの符号化データを優先順位上位から読み出し、書式に従って記述・整形して出力する。ステップS59でフレームデータの出力処理が終わればステップS55に戻る。ステップS55で符号化処理が終了すれば、全体の処理を終了する。
【0039】
このような一連の選択動作により、オブジェクトの大きさを反映してオブジェクト毎に多重化の優先順位を付けることができ、復号側で大きな画像から復号を開始することができるようになる。一般的に大きな画像が背景であり、先に復号しておくことで、重畳による合成処理を好適に行なうことが出来るようになる。
【0040】
また、ビデオデータだけではなく、オーディオデータも関連付けられて同じように多重化することが可能になる。
【0041】
さらには、各フレーム毎で優先順位を判断して適宜変更することで、画像の変化にも容易に対応できる効果もある。
【0042】
〈第3実施例〉
図3は、本発明の第3の実施に係る多重化システムの構成を示すブロック図である。図3において、300は装置全体の制御、及び種々の処理を行う中央演算装置(CPU)、301は本装置の制御に必要なオペレーティングシステム(OS)、ソフトウェア、演算に必要な記憶領域を提供するメモリである。
【0043】
302は種々の装置をつなぎ、データ、制御信号をやり取りするバスである。303は装置の起動、各種条件の設定、再生の指示を行なうための端末である。304はソフトウェアを蓄積する記憶装置である。305は画像データを蓄積する記憶装置、306は画像を撮像するカメラである。記憶装置304および、305はシステムから切り離して移動できるメディアで構成することも出来る。307は画像を表示するモニタであり、308は通信回線であり、LAN、公衆回線、無線回線、放送電波等で構成されている。309は通信回線308を介して画像データを送受信する通信インターフェースである。
【0044】
このような構成において、画像データの多重化処理について説明する。ここでは、カメラ306で撮像された画像データをMPEG−2符号化方式で符号化し、合成する動画像データとして記憶装置305からMPEG−4符号化方式のCore Profileで符号化された任意形状の符号化データを読み出して同期させて多重化し、通信インターフェース309から送信する例をもって説明する。
【0045】
処理に先立ち、端末303から装置全体に対して起動が指示され、各部が初期化される。すると記憶装置304に格納されているソフトウェアがバス302を介してメモリ301に展開され、ソフトウェアが起動される。
【0046】
図4は実施例4におけるメモリ301のメモリの使用、格納状況を示す。
【0047】
メモリ301には装置全体を制御し、各種ソフトウェアを動作させるためのOS、符号化を行なうソフトウェア、多重化を行なうソフトウェア、データを送受信する通信ソフトウェアが格納されている。
【0048】
また、符号化の際に画像データを格納する画像エリア、生成したり読み出した符号化データを格納する符号エリア、各種演算や各フレームの符号長等のパラメータ等を格納しておくワーキングエリアが存在する。
【0049】
このような構成において、処理に先立ち、端末303から動画像の入力をカメラ306からとする。また記憶装置305から符号化データを読み出すために読み出し位置を調整する。
【0050】
次に、CPU300による動画像データの符号化動作を図8に示すフローチャートに従って説明する。図8は、第3の実施例における多重化動作を示すフローチャート図である。
【0051】
まず、ステップS101では、カメラ306からの符号化に先立ち、メモリ301上の符号化ソフトウェアによって、符号化ヘッダを生成し、符号エリア1に格納してステップS102に進む。続いて、ステップS102にて、記憶装置305よりMPEG−4符号化されたデータの符号化ヘッダを読み出し、符号エリア2に格納してステップS103に進む。ステップS103にて、符号化ヘッダの符号長を算出して、ステップS104に進む。
【0052】
ステップS104にて、それぞれの符号長に基づいて優先順位を決定し、符号長が大きいものを優先順位が高いものと判定する。ここでは、カメラ306から入力されてMPEG−2符号化されるデータの方が大きいとして説明する。但し、記憶装置305から読み出されるデータの方が大きくても全く問題はない。
【0053】
ステップS105にて、記憶装置305からヘッダデータを優先順位上位から読み出し、メモリ301上の多重化ソフトウェアによって書式に従って記述・整形し、通信ソフトウェアによって通信インターフェース309より通信回線308に出力してステップS106に進む。
【0054】
ステップS106にて、カメラ306からの入力が続いていて、かつ記憶装置305上に符号化データがあるならばステップS107に進み、処理を続け、どちらかが無くなれば処理が終了したと判断し、全体の処理を終了する。
【0055】
ステップS107では、カメラ306から入力された1フレームをメモリ301上の画像エリアに格納し、符号化ソフトウェアを動作させて1フレーム分の符号化データを生成し、符号エリア1に格納して、ステップS108に進む。
【0056】
ステップS108にて、記憶装置305よりMPEG−4符号化されたデータの1フレーム分の符号化データを読み出し、符号エリア2に格納してステップS109に進む。ステップS109にて、符号エリア1と符号エリア2に格納されている符号化データのそれぞれの符号長を算出して、ステップS110に進む。
ステップS110にて、それぞれの符号長に基づいて優先順位を決定し、ステップS111に進む。ステップS111にて、フレーム単位の各符号化データがすべて多重化処理されたかを判断し、終了していればステップS106に進み、そうでなければステップS112に進む。
【0057】
ステップS112にて、優先順位に従って、上位から該当する符号化データの符号エリアからフレームの符号化データを読み出し、書式に従って記述・整形して通信ソフトウェアによって通信インターフェース309より通信回線308に出力し、読み出した符号エリアのデータをクリアする。ステップS111に戻る。ステップS111では各符号エリアの内容がクリアされているか否かを調べることでデータの有無を確認できる。
【0058】
このような一連の選択動作により、データの大きさを反映してオブジェクト毎に多重化の優先順位を付けることができ、復号側でデータ量の大きなデータから復号を開始することができるようになる。一般的にデータ量の大きなデータは復号に時間が掛かるため、先に復号を開始することにより、パラレル処理等を行なった場合に合成までの時間を確保でき、復号・合成処理を好適に行なうことが出来るようになる。
【0059】
また、本実施例ではビデオデータを例にとって説明したが、これに限定されず、オーディオデータ等でも同じように多重化することが可能になる。
さらには、各フレーム毎で優先順位を判断して適宜変更することで、画像の変化にも容易に対応できる効果もある。
【0060】
また、オブジェクトに関連するオーディオとビデオのデータの符号長を合計したものによって優先順位を決定してももちろんかまわない。
【0061】
また、多重化されたビットストリームを記憶装置305に蓄積してももちろんかまわない。
【0062】
<その他の実施形態>
また、上記実施形態では、ネットワークを構成するハードウェア等が含まれるものの、各処理部は実際はソフトウェアで実現できるものである。即ち、本発明の目的は、上述した実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または、記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(または、CPUやMPU)が、記憶媒体に格納されたプログラムコードを読み出し、実行することによっても達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が、上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体が本発明を構成することになる。
【0063】
また、コンピュータが読み出したプログラムコードを実行することにより、上述した実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)等が、実際の処理の一部または全部を行ない、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0064】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が、実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0065】
また、上記実施例において、動画像の符号化方式をMPEG−4としたがこれに限定されず、他の符号化方式、たとえば、H.261、MPEG−1、MPEG−2、Motion JPEG(Joint Photographic Experts Group)でももちろん構わない。また、出力のファイルフォーマットもこれに限定されない。
【0066】
さらに、上記実施例ではオブジェクトが2つの場合について説明したが、これに限定されない。必要なバッファメモリや解析器、または、符号エリアをオブジェクトの数に合わせて追加することで任意の数のオブジェクトに対応できることは明らかである。
【0067】
また、上記実施例では、多重化の優先順位を入力される符号化データから自動的に得ることにより、多重化に関する外部からの制御等を省略でき、装置の小型化、処理の軽減を行なう効果もある。
【0068】
【発明の効果】
以上の説明から明らかなように、本発明では、多重化に際して、符号化データを優先順位に従って多重化することにより、復号側での復号、合成等の処理を好適に行なうことができる。
【図面の簡単な説明】
【図1】第1の実施例としての本発明にかかる多重化システムの構成を示すブロック図である。
【図2】第2の実施例としての本発明にかかる多重化システムの構成を示すブロック図である。
【図3】第3の実施例としての本発明にかかる多重化システムの構成を示すブロック図である。
【図4】本発明の第3の実施例におけるメモリ301のメモリの使用、格納状況を表す図である。
【図5】復号側での画像の合成の様子を表す図である。
【図6】本発明の第1の実施例における多重化動作を示すフローチャート図である。
【図7】本発明の第2の実施例における多重化動作を示すフローチャート図である。
【図8】本発明の第3の実施例における多重化動作を示すフローチャート図である。
【図9】(A)は、図5(A)において、オブジェクト1001のデータがオブジェクト1002のデータよりも後に多重化された場合の説明図である。(B)は、図5(A)において、オブジェクト1001のデータがオブジェクト1002のデータよりも先に多重化された場合の説明図である。
Claims (9)
- 出力先で1画面を構成するための複数の符号化データを入力する入力手段と、
前記符号化データの優先順位を決定する優先順位決定手段と、
前記優先順位に従って、前記符号化データを多重化する多重化手段と、
前記多重化されたデータを出力する出力手段とを有することを特徴とする多重化装置。 - 前記優先順位決定手段は、符号化データに記述されている優先順位により優先順位を決定することを特徴とする請求項1に記載の多重化装置。
- 前記優先順位決定手段は、符号化データに記述されているサイズにより優先順位を決定することを特徴とする請求項1に記載の多重化装置。
- 前記優先順位決定手段は、符号化データの大きさにより優先順位を決定することを特徴とする請求項1に記載の多重化装置。
- 出力先で1画面を構成するための複数の符号化データを入力する入力工程と、
前記入力工程で入力された符号化データの優先順位を決定する優先順位決定工程と、
前記優先順位決定工程で決定した優先順位に従って、前記符号化データを多重化する多重化工程と、
前記多重化工程で多重化されたデータを出力する出力工程とを有することを特徴とする多重化方法。 - 前記優先順位決定工程は、符号化データに記述されている優先順位により優先順位を決定することを特徴とする請求項5に記載の多重化方法。
- 前記優先順位決定工程は、符号化データに記述されているサイズにより優先順位を決定することを特徴とする請求項5に記載の多重化方法。
- 前記優先順位決定工程は、符号化データの大きさにより優先順位を決定することを特徴とする請求項5に記載の多重化方法。
- 請求項5〜8の何れか1項に記載の多重化方法の処理手順をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003011211A JP2004228680A (ja) | 2003-01-20 | 2003-01-20 | 多重化装置、多重化方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003011211A JP2004228680A (ja) | 2003-01-20 | 2003-01-20 | 多重化装置、多重化方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004228680A true JP2004228680A (ja) | 2004-08-12 |
Family
ID=32900182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003011211A Withdrawn JP2004228680A (ja) | 2003-01-20 | 2003-01-20 | 多重化装置、多重化方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004228680A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7590294B2 (en) | 2004-11-29 | 2009-09-15 | Sony Corporation | Image compression apparatus and method, and program and recording medium |
US7720295B2 (en) | 2004-06-29 | 2010-05-18 | Sanyo Electric Co., Ltd. | Method and apparatus for coding images with different image qualities for each region thereof, and method and apparatus capable of decoding the images by adjusting the image quality |
KR100971834B1 (ko) * | 2004-10-29 | 2010-07-22 | 산요덴키가부시키가이샤 | 화상 부호화 방법 및 장치 |
JP2011045138A (ja) * | 2010-11-18 | 2011-03-03 | Sanyo Electric Co Ltd | 画像復号方法 |
US8005309B2 (en) | 2004-02-09 | 2011-08-23 | Sanyo Electric Co., Ltd. | Image coding apparatus, image decoding apparatus, image display apparatus and image processing apparatus |
-
2003
- 2003-01-20 JP JP2003011211A patent/JP2004228680A/ja not_active Withdrawn
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8005309B2 (en) | 2004-02-09 | 2011-08-23 | Sanyo Electric Co., Ltd. | Image coding apparatus, image decoding apparatus, image display apparatus and image processing apparatus |
US8326058B2 (en) | 2004-02-09 | 2012-12-04 | Sanyo Electric Co., Ltd. | Image coding apparatus, image decoding apparatus, image display apparatus and image processing apparatus |
US7720295B2 (en) | 2004-06-29 | 2010-05-18 | Sanyo Electric Co., Ltd. | Method and apparatus for coding images with different image qualities for each region thereof, and method and apparatus capable of decoding the images by adjusting the image quality |
KR100971834B1 (ko) * | 2004-10-29 | 2010-07-22 | 산요덴키가부시키가이샤 | 화상 부호화 방법 및 장치 |
KR100971835B1 (ko) * | 2004-10-29 | 2010-07-22 | 산요덴키가부시키가이샤 | 화상 복호 방법 및 장치 |
KR100971833B1 (ko) * | 2004-10-29 | 2010-07-22 | 산요덴키가부시키가이샤 | 화상 부호화 방법 및 장치 |
US8150173B2 (en) | 2004-10-29 | 2012-04-03 | Sanyo Electric Co., Ltd. | Image coding method and apparatus, and image decoding method and apparatus |
US8208738B2 (en) | 2004-10-29 | 2012-06-26 | Sanyo Electric Co., Ltd. | Image coding method and apparatus, and image decoding method and apparatus |
US7590294B2 (en) | 2004-11-29 | 2009-09-15 | Sony Corporation | Image compression apparatus and method, and program and recording medium |
JP2011045138A (ja) * | 2010-11-18 | 2011-03-03 | Sanyo Electric Co Ltd | 画像復号方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI414183B (zh) | Information processing apparatus and method and non-temporary computer-readable recording medium | |
JP4270230B2 (ja) | 撮像装置および方法、画像処理装置および方法、並びにプログラム | |
KR20080066408A (ko) | 3차원 영상 처리 장치 및 방법 | |
JP2010206593A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
KR20060051064A (ko) | 기록 장치 및 기록 방법, 재생 장치 및 재생 방법, 및프로그램 | |
JP2004180052A (ja) | 映像信号記録送信装置および監視システムならびに監視装置 | |
US6845214B1 (en) | Video apparatus and re-encoder therefor | |
JP4174960B2 (ja) | 信号処理装置及び方法並びにファイル生成方法 | |
JP2004228680A (ja) | 多重化装置、多重化方法及びプログラム | |
JP4262139B2 (ja) | 信号処理装置 | |
WO2003036967A1 (fr) | Appareil et procede de traitement de signaux video, programme et moyen d'enregistrement | |
JP2004158913A (ja) | 音声画像処理装置 | |
JPH10210465A (ja) | 符号列編集装置、画像符号化信号復号化装置、および、動画符号化信号復号化装置 | |
US20040208481A1 (en) | Apparatus and method for image processing, and image processing system using the same and program | |
JP4767916B2 (ja) | 動画像符号化データ変換装置 | |
JP2007036468A (ja) | 動画像符号化装置 | |
JP2004080094A (ja) | 情報処理装置及び情報処理方法並びにプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP2000152235A (ja) | データ処理装置及びその方法、及びデータ処理システム | |
JP4136403B2 (ja) | 画像処理装置、画像処理方法、プログラム、記憶媒体 | |
JP2004165800A (ja) | 画像処理装置 | |
JP2001218208A (ja) | 画像復号装置及びその方法 | |
JP2002094996A (ja) | 受信装置 | |
JP3880597B2 (ja) | マルチメディア情報編集装置 | |
JP3716977B2 (ja) | 動画像ファイル生成装置 | |
JP2004032573A (ja) | 動画像再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060404 |