以下、本発明の一実施形態を、図面を参照して説明する。
A.第1実施形態
まず、本発明の第1実施形態について説明する。
図1は、本発明の第1実施形態による階層映像符号化装置の構成を示すブロック図である。図1において、階層映像符号化装置は、下位階層符号化部103、階層符号化中間部106、第1の上位階層符号化部109、及び第2の上位階層符号化部112からなる。
下位階層符号化部103は、下位階層の映像D101を入力して符号化し、少なくとも第1の上位階層の映像と第2の上位階層の映像との符号化に必要な情報D102を出力する。階層符号化中間部106は、下位階層符号化部103から第1の上位階層の映像と第2の上位階層の映像との符号化に必要な情報D102を入力し、少なくとも第1の上位階層の映像の符号化に必要な情報D104を第1の上位階層符号化部(第1の出力先)109に出力し、少なくとも第2の上位階層の映像の符号化に必要な情報D105を第2の上位階層符号化部(第2の出力先)112に出力する。
第1の上位階層符号化部109は、第1の上位階層の映像D107を入力し、かつ、階層符号化中間部106から少なくとも第1の上位階層の映像D107の符号化に必要な情報D104を入力し、第1の上位階層の映像を符号化して第1の符号化ストリームD108を出力する。第2の上位階層符号化部112は、第2の上位階層の映像D110を入力し、かつ、階層符号化中間部106から少なくとも第2の上位階層の映像D110の符号化に必要な情報D105を入力し、第2の上位階層の映像を符号化して第2の符号化ストリームD111を出力する。
ここで、「上位階層の映像の符号化に必要な情報」とは、例えば、ISO/IEC 14496−10 Annex G においては、下位階層の映像のうち、当該上位階層の映像を縮小した領域に該当する部分を含む映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードである。また、「上位階層の映像の符号化に必要な情報」とは、MPEG−2やMPEG−4においては、下位階層の映像のうち、当該上位階層の映像を縮小した領域に該当する部分を含む映像領域の復号画像である。
本第1実施形態における階層符号化中間部106が第1の上位階層符号化部(第1の出力先)109に出力する情報D104は、少なくとも第1の上位階層の映像の符号化に必要な情報を含んでいれば十分である。また、階層符号化中間部106が第2の上位階層符号化部(第2の出力先)112に出力する情報D105は、少なくとも第2の上位階層の映像の符号化に必要な情報を含んでいれば十分であるが、本発明は、これら最小限の情報に限定されない。
例えば、(A1)下位階層の映像を符号化したストリームを含む情報を第1の上位階層符号化部(第1の出力先)109、または第2の上位階層符号化部(第2の出力先)112、あるいは第1の上位階層符号化部(第1の出力先)109と第2の上位階層符号化部(第2の出力先)112の双方に出力しても良いし、(A2)第1の上位階層符号化部(第1の出力先)109に出力する情報D104と第2の上位階層符号化部(第2の出力先)112に出力する情報D105とが同一でも良い。
上記(A1)のように、階層符号化中間部106が下位階層の映像D101を符号化したストリームを含む情報D104を、第1の上位階層符号化部(第1の出力先)109に出力することで、第1の上位階層符号化部109からの出力において下位階層の映像を符号化したストリームを多重化させておくことができ、このストリームから下位階層の映像と第1の上位階層の映像との双方を復号することができる。
また、階層符号化中間部106が下位階層の映像D101を符号化したストリームを含む情報D105を、第2の上位階層符号化部(第2の出力先)112に出力することで、第2の上位階層符号化部112からの出力において下位階層の映像を符号化したストリームを多重化させておくことができ、このストリームから下位階層の映像と第2の上位階層の映像との双方を復号することができる。
上記(A2)のように、第1の上位階層符号化部(第1の出力先)109に出力する情報D104と第2の上位階層符号化部(第2の出力先)112に出力する情報D105とを同一にすることにより、階層符号化中間部106の実装を簡素化することができる。
階層符号化中間部106から、第1の上位階層符号化部(第1の出力先)109、または第2の上位階層符号化部(第2の出力先)112への出力の詳細については、例えば、以下のような方式が考えられる。
第1の方式としては、第1の上位階層の映像D107の符号化に必要な情報D104と第2の上位階層の映像D110の符号化に必要な情報D105とを、階層符号化中間部106にあるメモリ(図示略)内の別々のアドレスに保持し、階層符号化中間部106は、第1の上位階層符号化部109から要求を受けた後に、第1の上位階層の映像D107の符号化に必要な情報D104を、第1の上位階層符号化部109にマクロブロックなど特定画素数領域単位毎に出力し、一方、第2の上位階層符号化部112から要求を受けた後に、第2の上位階層の映像D110の符号化に必要な情報D105を、第2の上位階層符号化部112にマクロブロックなど特定画素数領域単位毎に出力する方式がある。
また、第2の方式としては、階層符号化中間部106は、下位階層符号化部103から入力された情報D102のうち、第1の上位階層の映像D107の符号化に必要な情報を含む第1の上位階層符号化部109に出力すべき情報D104があることを、第1の上位階層符号化部109に通知した後に、該第1の上位階層符号化部109に出力し、該第1の上位階層符号化部109にあるメモリ(図示略)内に保持し、一方、下位階層符号化部103から入力された情報D102のうち、第2の上位階層の映像D110の符号化に必要な情報を含む第2の上位階層符号化部112に出力すべき情報D105があることを、第2の上位階層符号化部112に通知した後に、第2の上位階層符号化部112に出力し、該第2の上位階層符号化部112にあるメモリ(図示略)内に保持する方式がある。
階層符号化中間部106から第1の上位階層符号化部109、または第2の上位階層符号化部112への出力の詳細については、上記に限定されるものではなく、例えば、階層符号化中間部106、第1の上位階層符号化部109、または第2の上位階層符号化部112の全てがメモリ(図示略)を備えていても良い。
上述した第1実施形態によれば、「第1の符号化ストリームD108」には、下位階層の映像D101を符号化したストリームの情報が含まれていても良い。このように、第1の上位階層符号化部109からの出力において下位階層の映像D101を符号化したストリームを多重化させておくことで、下位階層と上位階層との二階層分の復号化器で構成される通常の階層映像復号化器を用いて、第1の符号化ストリームD108から下位階層の映像D101と第1の上位階層の映像D107との双方を復号することができる。
また、第1実施形態によれば、「第2の符号化ストリームD111」には、下位階層の映像D101を符号化したストリームの情報が含まれていても良い。このように、第2の上位階層符号化部112からの出力において下位階層の映像D101を符号化したストリームを多重化させておくことで、下位階層と上位階層との二階層分の復号化器で構成される通常の階層映像復号化器を用いて、第2の符号化ストリームD111から下位階層の映像D101と第2の上位階層の映像D110との双方を復号することができる。
B.第2実施形態
次に、本発明の第2実施形態について説明する。
図2は、本第2実施形態による階層映像符号化装置の構成を示すブロック図である。なお、図1に対応する部分には同一の符号を付けて説明を省略する。図2において、本第2実施形態による階層映像符号化装置は、図1の構成に対して、抽出前上位階層映像D213を入力し、該抽出前上位階層映像D213から第1の部分領域を抽出し、第1の上位階層の映像D107として第1の上位階層符号化部109に出力し、抽出前上位階層映像D213から第2の部分領域を抽出し、第2の上位階層の映像D110として第2の上位階層符号化部D112に出力する映像抽出部214を更に備えている。
第1実施形態で説明した第1の上位階層符号化部109に入力される第1の上位階層の映像D107と、第1実施形態で説明した第2の上位階層符号化部112に入力される第2の上位階層の映像D110とが、同一の映像から別々の領域を抽出した2つの映像である場合には、該同一の映像D213を入力して第1の領域と第2の領域とを抽出する映像抽出部214を備えることで、装置全体に入力される上位階層の映像の数を減じ、装置実装コストを削減することができる。
また、下位階層の映像D101の全ての領域、あるいは大部分の領域を上位階層として細かい情報へと階層的に符号化する場合には、通常は、上位階層の映像の方が下位階層の映像に比べて符号化すべき画素数が増大するため、符号化に必要な演算量が上位階層の方が多くなることがある。しかしながら、上位階層の映像D213を第1の上位階層の映像D107と第2の上位階層の映像D110とに分割して、各上位階層の映像を符号化すべき画素数を低減することで、各上位階層の映像符号化に必要な演算量と下位階層の映像符号化に必要な演算量との差を減らし、単位時間当たりに符号化する上位階層と下位階層との映像を増やすことができるという効果が生じる。
C.第3実施形態
次に、本発明の第3実施形態について説明する。
図3は、本第3実施形態による階層映像符号化装置の構成を示すブロック図である。なお、図1に対応する部分には同一の符号を付けて説明を省略する。図3において、本第3実施形態による階層映像符号化装置における下位階層符号化部303は、更に、下位階層の映像符号化結果を含む第3の符号化ストリームD315を出力する。
第1の上位階層符号化部109が出力する第1の符号化ストリームD108に下位階層の映像D101を符号化したストリームの情報が含まれておらず、かつ第2の上位階層符号化部112が出力する第2の符号化ストリームD111に下位階層の映像D101を符号化したストリームの情報が含まれておらず、かつ下位階層の映像D101を符号化したストリームの情報を送信する他の装置がない場合には、本第3実施形態のように、下位階層符号化部303が下位階層の映像符号化結果を含む第3の符号化ストリームD315を出力することで、第1の上位階層の映像D107も、第2の上位階層の映像D110も共に復号化することができる。
また、本第3実施形態によれば、第1の符号化ストリームD108と第2の符号化ストリームD111と第3の符号化ストリームD315の3つの符号化ストリームを出力することで、伝送路の帯域に制限がある場合でも、3つの伝送路に分けて符号化ストリームを送出することができる。
なお、複数の伝送路に分けて符号化ストリームを送出した場合には、各符号化ストリームD108、D111、D315に含まれる映像を表示するタイミングを同期・調整する必要があるが、以下の既知の技術によって解決できる。
(B1)映像信号の付加情報であるタイムコードを符号化器において、ビットストリームのフィールドに埋め込み、復号化器側で、ビットストリームからその値を読み出し、出力映像と共に出力することで、フレーム同期化装置がこの時刻情報を元に各チャネルの同期を取る。
(B2)各チャネルの符号化前の映像の有効領域内にフレーム時刻情報を示す映像マーカを符号化器側で埋め込み、復号化器側のフレーム同期化装置で、各チャネルのデコーダの出力映像から映像マーカを読み込み、フレーム時刻情報を検出して、その情報を元に各チャネルの同期を取る。
(B3)符号化器・復号化器において、チャネル間のSTC(System Time Clock)を共通化し、同一PTS(Presentation Time Stamp)、DTS(Decoding Time Stamp)のピクチャを同一タイミングで出力する。
D.第4実施形態
次に、本発明の第4実施形態について説明する。
図4は、本第4実施形態による階層映像符号化装置の構成を示すブロック図である。なお、図1に対応する部分には同一の符号を付けて説明を省略する。図4において、本第4実施形態による階層映像符号化装置は、第1実施形態に構成に対して、第1の符号化ストリームD108と第2の符号化ストリームD111とを入力し、多重化した符号化ストリームD416を出力するストリーム多重化部417を更に備えている。
伝送路の帯域が十分大きくとれる場合には、本第4実施形態のように、少なくとも第1の符号化ストリームD108と第2の符号化ストリームD111をストリーム多重化部417によって多重化することで、装置全体から出力されるストリームの数を減じて装置実装コストを削減することができる。
具体的な多重化については、(C1)MPEG2システム(ISO/IEC 13818-1、AMENDMENTの記述も含む)のTransport Stream、(C2)MP4ファイルフォーマット形式(ISO/IEC 14496-14)、(C3)AVCファイルフォーマット形式(ISO/IEC 14496-15)など既知の方式を利用する。
なお、本第4実施形態によるストリーム多重化部417は、第1の符号化ストリームD108と第2の符号化ストリームD111を入力して多重化しているが、本発明は、これら最小限の多重化に限定されない。例えば、(D1)第3実施形態と組み合わせて、下位階層符号化部303が出力する第3の符号化ストリームD315もストリーム多重化部417に入力し、第1の符号化ストリームD108と第2の符号化ストリームD111と第3の符号化ストリームD315とを多重化してストリームD416として出力しても良いし、(D2)音声や、ユーザーデータなどの映像以外の情報も多重化してストリームD416として出力して良い。
上記(D1)のように、下位階層符号化部303が出力する第3の符号化ストリームD315もストリーム多重化部417に入力し、第1の符号化ストリームD108と第2の符号化ストリームD111と第3の符号化ストリームD315とを多重化し、ストリームD416として出力することで、装置全体から出力されるストリームの数を更に減じることができ、この多重化ストリームD416から下位階層の映像D101と第1の上位階層の映像D107と第2の上位階層の映像D110とを復号することができる。また、上記(D2)のように、音声や、ユーザーデータなど映像以外の情報も多重化し、ストリームD416として出力することで、映像以外の情報もストリームに統合して伝送することができる。
E.第5実施形態
次に、本発明の第5実施形態について説明する。
図5は、本第5実施形態による階層映像符号化装置の構成を示すブロック図である。なお、図1に対応する部分には同一の符号を付けて説明を省略する。図5において、本第5実施形態による階層映像符号化装置は、第1実施形態に構成に対して、第1の映像縮小部519、第2の映像縮小部521、及び下位階層映像合成部522を更に備えている。
第1の映像縮小部519は、第1の上位階層の映像D107を入力し、該第1の上位階層の映像D107を縮小した第1の縮小映像D518を出力する。第2の映像縮小部521は、第2の上位階層の映像D110を入力し、該第2の上位階層の映像D110を縮小した第2の縮小映像D520を出力する。下位階層映像合成部522は、第1の映像縮小部519から第1の縮小映像D518を入力し、第2の映像縮小部521から第2の縮小映像D520を入力し、第1の縮小映像D518と第2の縮小映像D520とを含む映像を、下位階層の映像D101として、下位階層符号化部103に出力する。
本第5実施形態によれば、複数の上位階層の映像が入力されるが、それらの下位階層の映像が入力されない場合でも、映像の階層符号化を行うことができる。
なお、第5実施形態による下位階層映像合成部522は、第1の縮小映像D518と第2の縮小映像D520のみを入力しているが、これら最小限の入力に限定されない。例えば、下位階層映像合成部522に装置外部から別の映像を入力して、その映像と第1の縮小映像D518と第2の縮小映像を含む映像D520とを、下位階層の映像D101として出力しても良いし、縮小映像の数が2つ以上入力されても良い。
また、第2実施形態と組み合わせて、抽出前上位階層映像D213から第1の部分領域を抽出し、第1の上位階層の映像D107として第1の上位階層符号化部109に出力し、抽出前上位階層映像D213から第2の部分領域を抽出し、第2の上位階層の映像D110として第2の上位階層符号化部112に出力する映像抽出部214を備えていても良いし、第1の映像縮小部519と第2の映像縮小部521とが同一部であっても良い。
F.第6実施形態
次に、本発明の第6実施形態について説明する。
図6は、本第6実施形態による階層映像符号化装置が出力する第1の符号化ストリームD108の構成を示す概念図である。また、図7は、本第6実施形態による階層映像符号化装置が出力する第2の符号化ストリームD111の構成を示す概念図である。
本第6実施形態による階層映像符号化装置の構成は、前述した第1実施形態の構成(図1参照)と同様であり、符号化ストリームとしてISO/IEC 14496−10 Annex Gを利用している。
本第6実施形態による第1の上位階層符号化部109は、ISO/IEC 14496−10 Annex Gにおけるdependency_id シンタックス要素の同じ第1の値「1」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットを第1の符号化ストリームとして出力する。
また、本第6実施形態による第2の上位階層符号化部112は、ISO/IEC 14496−10 Annex Gにおけるdependency_idシンタックス要素の同じ第2の値「2」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットであり、かつ第1の符号化ストリームにおけるVCL NALユニットのサブセット中に含まれているref_layer_dq_idシンタックス要素の値と同一の値「0」を、ref_layer_dq_idシンタックス要素として含むVCL NALユニットのサブセットを第2の符号化ストリームとして出力する。
第1の上位階層符号化部109は、図6に示すように、第1の上位階層に対応するシーケンスパラメータセット601、第1の上位階層に対応するピクチャパラメータセット602、第1の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)603、第1の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)604、及び第1の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)605の順に第1の符号化ストリームD108を出力する。
第2の上位階層符号化部112は、図7に示すように、第2の上位階層に対応するシーケンスパラメータセット701、第2の上位階層に対応するピクチャパラメータセット702、第2の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)703、第2の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)704、及び第2の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)705の順に第2の符号化ストリームD111を出力する。
本第6実施形態は、符号化ストリームとして、ISO/IEC 14496−10 Annex Gを利用しているが、本発明は、あくまでISO/IEC 14496−10 Annex Gを「利用」するものであり、必ずしもストリームの全ての構造において必ずしも完全にISO/IEC 14496−10 Annex Gに準拠することを必須の条件としない。
例えば、バッファリング期間SEIメッセージ(Buffering period SEI message)については、あらかじめ装置から出力される最終のビットストリームにおいて、ISO/IEC 14496−10 Annex Gに適合するように第1の上位階層符号化部109や、第2の上位階層符号化部112で設定しても良いし、特に設定しなくても良い。設定していない場合には、独自シンタックス要素を用いたり、符号化器側と復号化器側で別途取り決めを行ったりなどして対応しても良い。
G.第7実施形態
次に、本発明の第7実施形態について説明する。
図8は、本第7実施形態による階層映像符号化装置の構成を示すブロック図である。なお、図1に対応する部分には同一の符号を付けて説明を省略する。図8において、本第7実施形態による階層映像符号化装置は、上述した第6実施形態による階層映像符号化装置(構成は図1と同じ)に対し、下位階層符号化部803は、ISO/IEC 14496−10 Annex Gにおけるベースレイヤを第3の符号化ストリームD815として出力し、第2の上位階層符号化部112は、第6実施形態に記載したdependency_id シンタックス要素の第1の値「1」より大きな値である、dependency_id シンタックス要素の第2の値「2」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットを、第2の符号化ストリームD111として出力する。
更に、本第7実施形態による階層映像符号化装置は、ストリーム多重化部817を更に備えている。ストリーム多重化部817は、第1の符号化ストリームD108と、第2の符号化ストリームD111と、第3の符号化ストリームD815とを入力し、同一のアクセスユニット内で、ベースレイヤ、dependency_idシンタックス要素の第1の値に関連付けられたVCL NALユニット、dependency_id シンタックス要素の第2の値に関連付けられたVCL NALユニットの順にVCL NALユニットを配置して多重化した符号化ストリームD816を出力する。
図9は、本第7実施形態による下位階層符号化部803が出力する第3の符号化ストリームD815の構成を示す概念図である。図9において、下位階層符号化部803は、下位階層に対応するシーケンスパラメータセット901、下位階層に対応するピクチャパラメータセット902、下位階層の映像の一番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)903、下位階層の映像の2番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)904、下位階層の映像の三番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)905の順に第3の符号化ストリームD815を出力する。
図10は、本第7実施形態によるストリーム多重化部817が出力する多重化した符号化ストリームD816の構成を示す概念図である。ストリーム多重化部817は、下位階層に対応するシーケンスパラメータセット901、第1の上位階層に対応するシーケンスパラメータセット601、第2の上位階層に対応するシーケンスパラメータセット701、下位階層に対応するピクチャパラメータセット902、第1の上位階層に対応するピクチャパラメータセット602、第2の上位階層に対応するピクチャパラメータセット702、下位階層の映像の1番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)903、第1の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)603、第2の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)703、下位階層の映像の2番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)904、第1の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)604、第2の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)704、下位階層の映像の3番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)905、第1の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)605、第2の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)705の順に多重化した符号化ストリーム0816を出力する。
本第7実施形態においては、下位階層符号化部803は、ISO/IEC 14496−10 Annex Gにおけるベースレイヤを第3の符号化ストリームD815として出力し、第3の符号化ストリームにおけるdependency_idシンタックス要素の値は0であり、ref_layer_dq_idは符号化されていない。
しかし、第2の上位階層符号化部112は、第1の符号化ストリームD108におけるVCL NALユニットのサブセット中に含まれているref_layer_dq_idシンタックス要素の値と同一の値をref_layer_qd_idシンタックス要素として含むVCL NALユニットのサブセットを、第2の符号化ストリームD111として出力することが必要であるが、このref_layer_qd_idシンタックス要素の値が0である必要はない。
したがって、第3の符号化ストリームD815におけるdependency_idシンタックス要素の値が0である必要ないことは容易に類推される。すなわち、下位階層符号化部803は、ISO/IEC 14496−10 Annex Gにおけるベースレイヤを第3の符号化ストリームD815として出力する必要はなく、第1の符号化ストリームD108と第2の符号化ストリームD111とが共に第3の符号化ストリームD815を下位階層とする上位階層のストリームであれば十分である。
本第7実施形態は、符号化ストリームとして、ISO/IEC 14496−10 Annex Gを利用しているが、本発明はあくまでISO/IEC 14496−10 Annex Gを「利用」するものであり、必ずしもストリームの全ての構造において必ずしも完全にISO/IEC 14496−10 Annex Gに準拠することを必須の条件としない。
例えば、バッファリング期間SEIメッセージ(Buffering period SEI message)については、あらかじめ装置から出力される最終のビットストリームにおいて、ISO/IEC 14496−10 Annex Gに適合するように第1の上位階層符号化部109や、第2の上位階層符号化部112や、下位階層符号化部803や、ストリーム多重化部817で設定しても良いし、特に設定しなくても良い。設定していない場合には、独自シンタックス要素を用いたり、符号化器側と復号化器側で別途取り決めを行ったりなどして対応しても良い。
H.第8実施形態
次に、本発明の第8実施形態について説明する。
図11は、本発明の第8実施形態による階層映像符号化装置の構成を示すブロック図である。図11において、映像抽出部1122は、輝度が横3840×縦2160のサンプル数である抽出前上位階層映像D1121を入力する。
また、映像抽出部1122は、抽出前上位階層映像D1121を、縦と横とにそれぞれ等分に2分割して計4分割し、抽出前上位階層映像D1121から分割された左上の映像を抽出して輝度が横1920×縦1080のサンプル数である第1の上位階層の映像D1109として第1の上位階層符号化部1111に出力する。また、映像抽出部1122は、抽出前上位階層映像D1121から分割された右上の映像を抽出して輝度が横1920×縦1080のサンプル数である第2の上位階層の映像D1112として第2の上位階層符号化部1114に出力する。
また、映像抽出部1122は、抽出前上位階層映像D1121から分割された左下の映像を抽出して輝度が横1920×縦1080のサンプル数である第3の上位階層の映像D1115として第3の上位階層符号化部1117に出力する。また、映像抽出部1122は、抽出前上位階層映像D1121から分割された右下の映像を抽出して輝度が横1920×縦1080のサンプル数である第4の上位階層の映像D1118として第4の上位階層符号化部1120に出力する。
図12は、本第8実施形態による抽出前上位階層映像D1121を示す概念図である。また、図13は、本第8実施形態による第1の上位階層の映像D1109〜第4の上位階層の映像D1118の位置関係を示す概念図である。本第8実施形態による階層映像符号化装置における下位階層符号化部1103は、輝度が横1920×縦1080サンプル数である下位階層の映像D1101を入力して符号化し、少なくとも第1の上位階層の映像D1104と第2の上位階層の映像D1105と第3の上位階層の映像D1106と第4の上位階層の映像D1107の符号化に必要な情報D1102を出力する。ここで、本第8実施形態による抽出前上位階層映像D1121の解像度は、下位階層の映像D1101に対して、縦と横がそれぞれ2倍である。
図14は、本第8実施形態による下位階層の映像D1101を示す概念図である。また、図15は、下位階層の映像D1101を縦と横にそれぞれ等分に2領域に分けて計4領域に分けた映像の位置関係をに示す概念図である。抽出前上位階層映像D1121から分割された左上の映像である第1の上位階層の映像D1109は、下位階層の映像D1101のうち、左上の映像領域である第1の下位階層映像領域1501から階層間予測を行うことで効率的な符号化が可能である。また、抽出前上位階層映像D1121から分割された右上の映像である第2の上位階層の映像D1112は、下位階層映像D1101のうち、右上の映像領域である第2の下位階層映像領域1502から階層間予測を行うことで効率的な符号化が可能である。
同様に、抽出前上位階層映像D1121から分割された左下の映像である第3の上位階層の映像D1115は、下位階層映像D1101のうち、左下の映像領域である第3の下位階層映像領域1503から階層間予測を行うことで効率的な符号化が可能であり、抽出前上位階層映像D1121から分割された右下の映像である第4の上位階層の映像D1118は、下位階層の映像D1101のうち、右下の映像領域である第4の下位階層映像領域1504から階層間予測を行うことで効率的な符号化が可能である。
本第8実施形態による階層符号化中間部1108は、下位階層符号化部1103から第1の上位階層の映像D1109と第2の上位階層の映像D1112と第3の上位階層の映像D1115と第4の上位階層の映像D1118の符号化に必要な情報D1102を入力し、第1の上位階層の映像D1109の符号化に必要な情報D1104を第1の上位階層符号化部1111に出力し、第2の上位階層の映像D1112の符号化に必要な情報D1105を第2の上位階層符号化部1114に出力し、第3の上位階層の映像D1115の符号化に必要な情報D1106を第3の上位階層符号化部1117に出力し、第4の上位階層の映像D1118の符号化に必要な情報D1107を第4の上位階層符号化部1120に出力する。
第1の上位階層符号化部1111は、映像抽出部1122から第1の上位階層の映像D1109を入力し、階層符号化中間部1108から第1の上位階層の映像D1109の符号化に必要な情報D1104を入力し、第1の上位階層の映像D1109を符号化して第1の符号化ストリームD1110をストリーム多重化部1125に出力する。
第2の上位階層符号化部1114は、映像抽出部1122から第2の上位階層の映像D1112を入力し、階層符号化中間部1108から第2の上位階層の映像D1112の符号化に必要な情報D1105を入力し、第2の上位階層の映像D1112を符号化して第2の符号化ストリームD1113をストリーム多重化部1125に出力する。
第3の上位階層符号化部1117は、映像抽出部1122から第3の上位階層の映像D1115を入力し、階層符号化中間部1108から第3の上位階層の映像D1115の符号化に必要な情報D1106を入力し、第3の上位階層の映像D1115を符号化して第3の符号化ストリームD1116をストリーム多重化部1125に出力する。
第4の上位階層符号化部1120は、映像抽出部1122から第4の上位階層の映像D1118を入力し、階層符号化中間部1108から第4の上位階層の映像D1118の符号化に必要な情報D1107を入力し、第4の上位階層の映像を符号化して第4の符号化ストリームD1119をストリーム多重化部1125に出力する。
ストリーム多重化部1125は、第1の上位階層符号化部1111から第1の符号化ストリームD1110を、第2の上位階層符号化部1114から第2の符号化ストリームD1113を、第3の上位階層符号化部1117から第3の符号化ストリームD1116を、第4の上位階層符号化部1120から第4の符号化ストリームD1119を入力し、多重化した符号化ストリームD1124を出力する。
本第8実施形態では、符号化ストリームとしては、ISO/IEC 14496−10 Annex Gを利用している。本第8実施形態による第1の上位階層符号化部1111は、ISO/IEC 14496−10 Annex Gにおけるdependency_idシンタックス要素の同じ第1の値「1」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットを第1の符号化ストリームとして出力する。
第2の上位階層符号化部1114は、ISO/IEC 14496−10 Annex Gにおけるdependency_id シンタックス要素の同じ第2の値「2」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットであり、かつ第1の符号化ストリームD1110におけるVCL NALユニットのサブセット中に含まれているref_layer_dq_idシンタックス要素の値と同一の値「0」をref_layer_dq_idシンタックス要素として含むVCL NALユニットのサブセットを第2の符号化ストリームD1113として出力する。
第3の上位階層符号化部1117は、ISO/IEC 14496−10 Annex Gにおけるdependency_id シンタックス要素の同じ第3の値「3」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットであり、かつ第1の符号化ストリームD1110におけるVCL NALユニットのサブセット中に含まれているref_layer_dq_idシンタックス要素の値と同一の値「0」をref_layer_dq_idシンタックス要素として含むVCL NALユニットのサブセットを第3の符号化ストリームD1116として出力する。
第4の上位階層符号化部1120は、ISO/IEC 14496−10 Annex Gにおけるdependency_idシンタックス要素の同じ第4の値「4」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットであり、かつ第1の符号化ストリームD1110におけるVCL NALユニットのサブセット中に含まれているref_layer_dq_idシンタックス要素の値と同一の値「0」をref_layer_dq_idシンタックス要素として含むVCL NALユニットのサブセットを第4の符号化ストリームD1119として出力する。
図16は、本第8実施形態による第1の符号化ストリームD1110の構成を示す概念図である。第1の上位階層符号化部1111は、第1の上位階層に対応するシーケンスパラメータセット1601、第1の上位階層に対応するピクチャパラメータセット1602、第1の上位階層の映像D1109の1番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)1603、第1の上位階層の映像D1109の2番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)1604、第1の上位階層の映像D1109の3番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)1605の順に第1の符号化ストリームD1110を出力する。
図17は、本第8実施形態による第2の符号化ストリームD1113の構成を示す概念図である。第2の上位階層符号化部1114は、第2の上位階層に対応するシーケンスパラメータセット1701、第2の上位階層に対応するピクチャパラメータセット1702、第2の上位階層の映像D1112の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)1703、第2の上位階層の映像D1112の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)1704、第2の上位階層の映像D1112の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)1705の順に第2の符号化ストリームD1113を出力する。
図18は、本第8実施形態による第3の符号化ストリームD1116の構成を示す概念図である。第3の上位階層符号化部1117は、第3の上位階層に対応するシーケンスパラメータセット1801、第3の上位階層に対応するピクチャパラメータセット1802、第3の上位階層の映像D1115の1番目のアクセスユニットのスライス(dependency_id=3,ref_layer_dq_id=0)1803、第3の上位階層の映像D1115の2番目のアクセスユニットのスライス(dependency_id=3,ref_layer_dq_id=0)1804、第3の上位階層の映像D1115の3番目のアクセスユニットのスライス(dependency_id=3,ref_layer_dq_id=0)1805の順に第3の符号化ストリームD1116を出力する。
図19は、本第8実施形態による第4の符号化ストリームD1119の構成を示す概念図である。第4の上位階層符号化部1120は、第4の上位階層に対応するシーケンスパラメータセット1901、第4の上位階層に対応するピクチャパラメータセット1902、第四の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=4,ref_layer_dq_id=0)1903、第4の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=4,ref_layer_dq_id=0)1904、第4の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=4,ref_layer_dq_id=0)1905の順に第4の符号化ストリームD1119を出力する。
下位階層符号化部1103は、ISO/IEC 14496−10 Annex G におけるベースレイヤを第5の符号化ストリームD1123として出力する。ストリーム多重化部1125は、第1の符号化ストリームD1110と、第2の符号化ストリームD1113と、第3の符号化ストリームD1116と、第4の符号化ストリームD1119と、第5の符号化ストリームD1123を入力し、同一のアクセスユニット内で、ベースレイヤ、dependency_id シンタックス要素の第1の値に関連付けられたVCL NALユニット、dependency_idシンタックス要素の第2の値に関連付けられたVCL NALユニット、dependency_idシンタックス要素の第3の値に関連付けられたVCL NALユニット、dependency_idシンタックス要素の第4の値に関連付けられたVCL NALユニットの順にVCL NALユニットを配置して多重化した符号化ストリームD1124を出力する。
図20は、本第8実施形態による下位階層符号化部1103が出力する第5の符号化ストリームの構成を示す概念図である。下位階層符号化部1103は、下位階層に対応するシーケンスパラメータセット2001、下位階層に対応するピクチャパラメータセット2002、下位階層の映像D1101の1番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)2003、下位階層の映像D1101の二番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)2004、下位階層の映像D1101の三番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)2005の順に第5の符号化ストリームD1123を出力する。
図21は、本第8実施形態によるストリーム多重化部1125が出力する多重化した符号化ストリーム1124の構成を示す概念図である。ストリーム多重化部1125は、下位階層に対応するシーケンスパラメータセット2001、第1の上位階層に対応するシーケンスパラメータセット1601、第2の上位階層に対応するシーケンスパラメータセット1701、第3の上位階層に対応するシーケンスパラメータセット1801、第4の上位階層に対応するシーケンスパラメータセット1901、下位階層に対応するピクチャパラメータセット2002、第1の上位階層に対応するピクチャパラメータセット1602、第2の上位階層に対応するピクチャパラメータセット1702、第3の上位階層に対応するピクチャパラメータセット1802、第4の上位階層に対応するピクチャパラメータセット1902、続いて、下位階層の映像D1101の1番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)2003、第1の上位階層の映像D1109の1番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)1603、第2の上位階層の映像D1112の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)1703、第3の上位階層の映像D1115の1番目のアクセスユニットのスライス(dependency_id=3,ref_layer_dq_id=0)1803、第4の上位階層の映像D1118の1番目のアクセスユニットのスライス(dependency_id=4,ref_layer_dq_id=0)1903、続いて、下位階層の映像D1101の2番目のアクセスユニットのスライス(dependency_id=0, ref_layer_dq_idは符号化されていない)2004、第1の上位階層の映像D1109の2番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)1604、第2の上位階層の映像D1112の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)1704、第3の上位階層の映像D1115の2番目のアクセスユニットのスライス(dependency_id=3,ref_layer_dq_id=0)1804、第4の上位階層の映像D1118の2番目のアクセスユニットのスライス(dependency_id=4,ref_layer_dq_id=0)1904、続いて、下位階層の映像D1101の3番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)2005、第1の上位階層の映像D1109の3番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)1605第2の上位階層の映像D1112の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)1705、第3の上位階層の映像D1115の3番目のアクセスユニットのスライス(dependency_id=3,ref_layer_dq_id=0)1805、第4の上位階層の映像D1118の3番目のアクセスユニットのスライス(dependency_id=4,ref_layer_dq_id=0)1905の順に多重化した符号化ストリームD1124を出力する。
ここで、「上位階層の映像の符号化に必要な情報」とは、ISO/IEC 14496−10 Annex Gにおいては、下位階層の映像D1101のうち、当該上位階層の映像を縮小した領域に該当する部分を含む映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードである。先に述べたとおり、抽出前上位階層映像D1121から分割された左上の映像である第1の上位階層の映像D1109は、下位階層の映像D1101のうち、左上の映像領域である第1の下位階層映像領域1501から階層間予測を行うことで効率的な符号化が可能であるので、第1の符号化ストリームD1110においては、下位階層のピクチャと上位階層のピクチャとの位置関係を表すシンタックス要素である、scaled_ref_layer_left_offset、scaled_ref_layer_top_offset、scaled_ref_layer_right_offset、scaled_ref_layer_bottom_offsetを、以下のようにシーケンスパラメータセットまたはスライスヘッダで記述する。
scaled_ref_layer_left_offset=0
scaled_ref_layer_top_offset=0
scaled_ref_layer_right_offset=-960
scaled_ref_layer_bottom_offset=-270
scaled_ref_layer_left_offsetは、レイヤ間予測に対して使用される再サンプリングされたレイヤピクチャの左上輝度サンプルと、現ピクチャ、あるいは現レイヤピクチャの左上輝度サンプルとの間の水平方向のオフセットを2輝度サンプルを単位として規定している。
scaled_ref_layer_top_offsetは、レイヤ間予測に対して使用される再サンプリングされたレイヤピクチャの左上輝度サンプルと、現ピクチャ、あるいは現レイヤピクチャの左上輝度サンプルとの間の垂直方向のオフセットを、2*(2−frame_mbs_only_flag)輝度サンプルを単位として規定している(本第8実施形態では、frame_mbs_only_flag=0とする)。
scaled_ref_layer_right_offsetは、レイヤ間予測に対して使用される再サンプリングされたレイヤピクチャの右下輝度サンプルと、現ピクチャ、あるいは現レイヤピクチャの右下輝度サンプルとの間の水平方向のオフセットを2輝度サンプルを単位として規定している。
scaled_ref_layer_bottom_offsetは、レイヤ間予測に対して使用される再サンプリングされたレイヤピクチャの右下輝度サンプルと、現ピクチャ、あるいは現レイヤピクチャの右下輝度サンプルとの間の垂直方向のオフセットを、2*(2−frame_mbs_only_flag)輝度サンプルを単位として規定している。
さらに、ScaledRefLayerPicWidthInSamplesL=PicWidthInMbs*16-2*(scaled_ref_layer_left_offset+scaled_ref_layer_right_offset)、ScaledRefLayerPicHeightInSamplesL=PicHeightWidthInMbs*16-2*(scaled_ref_layer_top_offset+scaled_ref_layer_bottom_offset)*(2-frame_mbs_only_flag)/(1+field_pic_flag)であるため、上記のように、scaled_ref_layer_left_offset、scaled_ref_layer_top_offset、scaled_ref_layer_right_offset、scaled_ref_layer_bottom_offsetを、シーケンスパラメータセット、またはスライスヘッダで記述することにより、下位階層の映像D1101のうち、左上の映像領域である第1の下位階層映像領域1501を、解像度比で縦横それぞれ2倍で再サンプリングを行った映像を階層間予測に用いることができる。
ここで、第1の上位階層の映像D1109の符号化に必要な情報D1104としては、第1の下位階層映像領域1501の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含めば十分であるが、符号化効率向上などの目的のため、境界付近など、第1の下位階層映像領域1501以外の下位階層映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含んでも良い。
抽出前上位階層映像D1121から分割された右上の映像である第2の上位階層の映像D1112は、下位階層の映像D1101のうち、右上の映像領域である第2の下位階層映像領域1502から階層間予測を行うことで効率的な符号化が可能であるので、第2の符号化ストリームD1113においては、scaled_ref_layer_left_offset、scaled_ref_layer_top_offset、scaled_ref_layer_right_offset、scaled_ref_layer_bottom_offsetを、以下のように、シーケンスパラメータセット、またはスライスヘッダで記述する。
scaled_ref_layer_left_offset=-960
scaled_ref_layer_top_offset=0
scaled_ref_layer_right_offset=0
scaled_ref_layer_bottom_offset=-270
この記述により、下位階層の映像D1101のうち、右上の映像領域である第2の下位階層映像領域1502を、解像度比で縦横それぞれ2倍で再サンプリングを行った映像を階層間予測に用いることができる。ここで、第2の上位階層の映像D1112の符号化に必要な情報D1105としては、第2の下位階層映像領域1502の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含めば十分であるが、符号化効率向上などの目的のため、境界付近など、第2の下位階層映像領域1502以外の下位階層映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含んでも良い。
抽出前上位階層映像D1121から分割された左下の映像である第3の上位階層の映像D1115は、下位階層の映像D1101のうち、左下の映像領域である第3の下位階層映像領域1503から階層間予測を行うことで効率的な符号化が可能であるので、第3の符号化ストリームD1116においては、scaled_ref_layer_left_offset、scaled_ref_layer_top_offset、scaled_ref_layer_right_offset、scaled_ref_layer_bottom_offsetを、以下のようにシーケンスパラメータセット、またはスライスヘッダで記述する。
scaled_ref_layer_left_offset=0
scaled_ref_layer_top_offset=-270
scaled_ref_layer_right_offset=-960
scaled_ref_layer_bottom_offset=0
この記述により、下位階層の映像D1101のうち、左下の映像領域である第3の下位階層映像領域1503を、解像度比で縦横それぞれ2倍で再サンプリングを行った映像を階層間予測に用いることができる。ここで、第3の上位階層の映像D1115の符号化に必要な情報D1106としては、第3の下位階層映像領域1503の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含めば十分であるが、符号化効率向上などの目的のため、境界付近など、第3の下位階層映像領域1503以外の下位階層映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含んでも良い。
抽出前上位階層映像1121から分割された右下の映像である第4の上位階層の映像D1118は、下位階層の映像D1101のうち、右下の映像領域である第4の下位階層映像領域1504から階層間予測を行うことで効率的な符号化が可能であるので、第4の符号化ストリームD1119においては、scaled_ref_layer_left_offset、scaled_ref_layer_top_offset、scaled_ref_layer_right_offset、scaled_ref_layer_bottom_offsetを、以下のように、シーケンスパラメータセット、またはスライスヘッダで記述する。
scaled_ref_layer_left_offset = -960
scaled_ref_layer_top_offset = -270
scaled_ref_layer_right_offset = 0
scaled_ref_layer_bottom_offset=0
この記述により、下位階層の映像D1101のうち、右下の映像領域である第4の下位階層映像領域D1504を、解像度比で縦横それぞれ2倍で再サンプリングを行った映像を階層間予測に用いることができる。ここで、第4の上位階層の映像D1118の符号化に必要な情報D1107としては、第4の下位階層映像領域1504の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含めば十分であるが、符号化効率向上などの目的のため、境界付近など、第4の下位階層映像領域D1504以外の下位階層映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含んでも良い。
本第8実施形態においては、抽出前上位階層映像D1121の輝度が横3840×縦2160サンプル数であり、抽出前上位階層映像D1121を縦と横にそれぞれ等分に2分割して計4分割した輝度が横1920×縦1080サンプル数である各映像を第1の上位階層の映像D1109〜第4の上位階層の映像D1118としたが、本発明における抽出前上位階層映像D1121の輝度のサンプル数や、分割の数、下位階層の映像D1101の輝度のサンプル数は、上記の例に限らないことは言うまでもない。
また、ストリーム多重化部1125を備えず、第1の符号化ストリームD1110、第2の符号化ストリームD1113、第3の符号化ストリームD1116、第4の符号化ストリームD1119を個々に装置外部に出力してもよいし、第1の符号化ストリームD1110には、下位階層の映像D1101を符号化したストリームの情報が含まれていても良いし、第2の符号化ストリームD1113には、下位階層の映像D1101を符号化したストリームの情報が含まれていても良いし、第3の符号化ストリームD1116には、下位階層の映像D1101を符号化したストリームの情報が含まれていても良いし、第4の符号化ストリームD1119には、下位階層の映像D1101を符号化したストリームの情報が含まれていても良い。
第1の符号化ストリームD1110と第2の符号化ストリームD1113と第3の符号化ストリームD1116と第4の符号化ストリームD1119の4つの符号化ストリームを出力することで、伝送路の帯域に制限がある場合でも、4つの伝送路に分けて符号化ストリームを送出することができる。
また、第1の上位階層符号化部1111からの出力において、下位階層の映像D1101を符号化したストリームを多重化させておくことで、下位階層と上位階層の二階層分の復号化器で構成される通常の階層映像復号化器を利用して、第1の符号化ストリームD1110から下位階層の映像D1101と第1の上位階層の映像D1109の双方を復号することができる。
また、第2の上位階層符号化部1114からの出力において、下位階層の映像D1101を符号化したストリームを多重化させておくことで、下位階層と上位階層の二階層分の復号化器で構成される通常の階層映像復号化器を利用して、第2の符号化ストリームD1113から下位階層の映像D1101と第2の上位階層の映像D1112の双方を復号することができる。
また、第3の上位階層符号化部1117からの出力において、下位階層の映像D1101を符号化したストリームを多重化させておくことで、下位階層と上位階層の二階層分の復号化器で構成される通常の階層映像復号化器を利用して、第3の符号化ストリームD1116から下位階層の映像D1101と第3の上位階層の映像D1115の双方を復号することができる。
また、第4の上位階層符号化部1120からの出力において、下位階層の映像D1101を符号化したストリームを多重化させておくことで、下位階層と上位階層の二階層分の復号化器で構成される通常の階層映像復号化器を利用して、第4の符号化ストリームD1119から下位階層の映像D1101と第4の上位階層の映像D1118の双方を復号することができる。
I.第9実施形態
次に、本発明の第9実施形態について説明する。
図22は、本発明の第9実施形態による階層映像復号化装置の構成を示すブロック図である。図22において、階層映像復号化装置は、下位階層復号化部2203、階層復号化中間部2206、第1の上位階層復号化部2209、及び第2の上位階層復号化部2212からなる。
下位階層復号化部2203は、下位階層の映像の符号化結果を含む第1の符号化ストリームD2201を入力し、少なくとも第1の上位階層の映像と第2の上位階層の映像の復号化に必要な情報D2202を出力する。階層復号化中間部2206は、下位階層復号部2203から第1の上位階層の映像と第2の上位階層の映像の復号化に必要な情報D2202を入力し、少なくとも第1の上位階層の映像の復号化に必要な情報D2204を第1の上位階層復号化部(第1の出力先)2209に出力し、少なくとも第2の上位階層の映像の復号化に必要な情報D2205を第2の上位階層復号化部(第2の出力先)2212に出力する。
第1の上位階層復号化部2209は、第1の上位階層の映像の符号化結果を含む第2の符号化ストリームD2207を入力し、かつ、階層復号化中間部2206から少なくとも第1の上位階層の映像の復号化に必要な情報D2204を入力し、第2の上位階層の映像を復号化して第1の復号映像D2208を出力する。第2の上位階層復号化部2212は、第2の上位階層の映像の符号化結果を含む第3の符号化ストリームD2210を入力し、かつ、階層復号化中間部2206から少なくとも第2の上位階層の映像の復号化に必要な情報D2205を入力し、第2の上位階層の映像を復号化して第2の復号映像D2211を出力する。
ここで、「上位階層の映像の復号化に必要な情報」とは、例えば、ISO/IEC 14496−10 Annex Gにおいては、下位階層の映像のうち、当該上位階層の映像を縮小した領域に該当する部分を含む映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードである。また、「上位階層の映像の復号化に必要な情報」とは、MPEG−2やMPEG−4においては、下位階層の映像のうち、当該上位階層の映像を縮小した領域に該当する部分を含む映像領域の復号画像である。
本第9実施形態における階層復号化中間部2206が第1の上位階層復号化部(第1の出力先)2209に出力する情報D2204は、少なくとも第1の上位階層の映像の復号化に必要な情報が含まれていれば十分であり、また、階層復号化中間部2206が第2の上位階層復号化部(第2の出力先)2212に出力する情報D2205は、少なくとも第2の上位階層の映像の復号化に必要な情報が含まれていれば十分であるが、本発明は、これら最小限の情報に限定されない。
例えば、(E1)下位階層の映像を符号化したストリームを含む情報を第1の上位階層復号化部(第1の出力先)2209、または第2の上位階層復号化部(第2の出力先)2212、あるいは第1の上位階層復号化部(第1の出力先)2209と第2の上位階層復号化部(第2の出力先)2212の双方に出力しても良いし、(E2)第1の上位階層復号化部(第1の出力先)2209に出力する情報と第2の上位階層復号化部(第2の出力先)2212に出力する情報とが同一でも良い。
上記(E1)のように、階層復号化中間部2206が下位階層の映像を符号化したストリームを含む情報を第1の上位階層復号化部(第1の出力先)2209に出力することで、第1の上位階層復号化部2209において下位階層の映像と第1の上位階層の映像との双方を復号することができる。
また、階層復号化中間部2206が下位階層の映像を符号化したストリームを含む情報を第2の上位階層復号化部(第2の出力先)2212に出力することで、第2の上位階層復号化部2212において下位階層の映像と第2の上位階層の映像との双方を復号することができる。
上記(E2)のように、第1の上位階層復号化部(第1の出力先)2209に出力する情報D2204と第2の上位階層復号化部(第2の出力先)2212に出力する情報D2205とを同一にすることにより、階層復号化中間部2206の実装を簡素化することができる。
階層復号化中間部2206から、第1の上位階層復号化部2209、または第2の上位階層復号化部2212への出力の詳細については、例えば、以下のような方式が考えられる。
第1の方式としては、第1の上位階層の映像の復号化に必要な情報D2204と第2の上位階層の映像の復号化に必要な情報D2205とを、階層復号化中間部2206にあるメモリ(図示略)内の別々のアドレスに保持し、階層復号化中間部2206は、第1の上位階層復号化部2209から要求を受けた後に、第1の上位階層の映像の復号化に必要な情報D2204を、第1の上位階層復号化部2209にマクロブロックなど特定画素数領域単位毎に出力し、一方、第2の上位階層復号化部3312から要求を受けた後に、第2の上位階層の映像の復号化に必要な情報D2205を、第2の上位階層復号化部2212にマクロブロックなど特定画素数領域単位毎に出力する方式がある。
また、第2の方式としては、階層復号化中間部2206は、下位階層復号化部2203から入力された情報のうち、第1の上位階層の映像の復号化に必要な情報を含む第1の上位階層復号化部2209に出力すべき情報D2204があることを、第1の上位階層復号化部2209に通知した後に、第1の上位階層復号化部2209に出力し、第1の上位階層復号化部2209にあるメモリ(図示略)内に保持し、一方、下位階層復号化部2203から入力された情報のうち、第2の上位階層の映像の復号化に必要な情報を含む第2の上位階層復号化部2212に出力すべき情報D2205があることを、第2の上位階層復号化部2212に通知した後に、第2の上位階層復号化部2212に出力し、第2の上位階層復号化部2212にあるメモリ(図示略)内に保持する方式がある。
階層復号化中間部2206が第1の上位階層の映像の復号化に必要な情報であることを判別する方法や、階層復号化中間部2206が第1の上位階層の映像の復号化に必要な情報であることを判別する方法については、例えば(F1)符号化器側であらかじめ判別のために必要な情報(下位階層の映像のうち、第1の上位階層の映像を縮小した領域に該当する部分の位置座標や、下位階層の映像のうち、第2の上位階層の映像を縮小した領域に該当する部分の位置座標)を、第1の符号化ストリームD2201中に独自シンタックス要素として入れておく、(F2)本装置の前段においてあらかじめ判別のために必要な情報(下位階層の映像のうち、第1の上位階層の映像を縮小した領域に該当する部分の位置座標や、下位階層の映像のうち、第2の上位階層の映像を縮小した領域に該当する部分の位置座標)を、第1の符号化ストリームD2201中に独自シンタックス要素として入れておく、(F3)判別のために必要な情報を既知の映像符号化方式のシンタックス要素(例えば、ISO/IEC 14496−10 Annex GにおけるシーケンスパラメータセットSVC拡張シンタックスに含まれるseq_scaled_ref_layer_left_offset、seq_scaled_ref_layer_top_offset、seq_scaled_ref_layer_right_offset、seq_scaled_ref_layer_bottom_offset)を流用して第1の符号化ストリームD2201中に入れておく、(F4)符号化器側と復号化器側とで別途取り決めを行う、などの方法がある。
階層復号化中間部2206から第1の上位階層復号化部2209、または第2の上位階層復号化部2212への出力の詳細については、上記に限定されるものではなく、例えば、階層復号化中間部2206、第1の上位階層復号化部2209、または第2の上位階層復号化部2212の全てがメモリ(図示略)が備えていても良い。
上述した第9実施形態によれば、「第2の符号化ストリームD2207」には、下位階層の映像を符号化したストリームの情報が含まれていても良い。このように、第1の上位階層復号化部2209への入力において下位階層の映像を符号化したストリームを多重化させておくことで、下位階層と上位階層との二階層分の復号化器で構成される通常の階層映像復号化器を用いて、第2の符号化ストリームD2207から下位階層の映像と第2の上位階層の映像との双方を復号することができる。
また、本第9実施形態によれば、「第3の符号化ストリームD2210」には、下位階層の映像を符号化したストリームの情報が含まれていても良い。このように、第2の上位階層復号化部2212への入力において下位階層の映像を符号化したストリームを多重化させておくことで、下位階層と上位階層との二階層分の復号化器で構成される通常の階層映像復号化器を用いて、第3の符号化ストリームD2210から下位階層の映像と第2の上位階層の映像との双方を復号することができる。
J.第10実施形態
次に、本発明の第10実施形態について説明する。
図23は、本発明の第10実施形態による階層映像復号化装置の構成を示すブロック図である。なお、図22に対応する部分には同一の符号を付けて説明を省略する。本第10実施形態では、上述した第9実施形態における第3の符号化ストリームD2210が第1の符号化ストリームD2201と同一である場合である。図23において、第1の符号化ストリームD2201は、下位階層復号化部2203と第2の上位階層復号化部2212との双方に入力される。
本第10実施形態は、前述した第1実施形態による階層映像符号化装置が出力する第1の符号化ストリームD108に下位階層の映像D101を符号化したストリームが含まれており、かつ、第1実施形態による階層映像符号化装置が出力する第2の符号化ストリームD111に下位階層の映像D101を符号化したストリームが含まれていない場合には、この2つの第1の符号化ストリームD108、及び第2の符号化ストリームD111を、本第10実施形態の階層映像復号化装置に、第1の符号化ストリームD2201、及び第2の符号化ストリームD2207として入力することで復号化が可能になる。
K.第11実施形態
次に、本発明の第11実施形態について説明する。
図24は、本発明の第11実施形態による階層映像復号化装置の構成を示すブロック図である。なお、図22に対応する部分には同一の符号を付けて説明を省略する。図24において、本第11実施形態による階層映像復号化装置における下位階層符号化部2403は、更に、下位階層の映像符号化結果を含む第3の復号映像D2414を出力する。
下位階層の映像を復号化する他の装置がない場合には、本第11実施形態のように、下位階層復号化部2403が下位階層の映像を復号化して第3の復号映像D2414を出力することで、本階層映像復号化装置のみで下位階層の映像を復号化することができる。
なお、複数の伝送路に分けて符号化ストリームを入力する場合には、各符号化ストリームに含まれる映像を表示するタイミングを同期・調整する必要があるが、以下の既知の技術によって解決できる。
(G1)映像信号の付加情報であるタイムコードを符号化器において、ビットストリームのフィールドに埋め込み、復号化器側で、ビットストリームからその値を読み出し、出力映像と共に出力することで、フレーム同期化装置がこの時刻情報を元に各チャネルの同期を取る。
(G2)各チャネルの符号化前の映像の有効領域内にフレーム時刻情報を示す映像マーカを符号化器側で埋め込み、復号化器側のフレーム同期化装置で、各チャネルのデコーダの出力映像から映像マーカを読み込み、フレーム時刻情報を検出して、その情報を元に各チャネルの同期を取る。
(G3)符号化器・復号化器において、チャネル間のSTC(System Time Clock)を共通化し、同一PTS(Presentation Time Stamp)、DTS(Decoding Time Stamp)のピクチャを同一タイミングで出力する。
L.第12実施形態
次に、本発明の第12実施形態について説明する。
図25は、本第12実施形態による階層映像復号化装置の構成を示すブロック図である。なお、図22に対応する部分には同一の符号を付けて説明を省略する。図25において、本第12実施形態による階層映像復号化装置は、図22の構成に対して、第2の符号化ストリームD2207と第3の符号化ストリームD2210とが多重化されている入力多重化ストリームD2515を入力し、第2の符号化ストリームD2207を分離して第1の上位階層復号化部2209に出力し、第3の符号化ストリームD2210を分離して第2の上位階層復号化部2212に出力するストリーム逆多重化部2516を更に備えている。
第4実施形態の階層映像符号化装置が出力する多重化した符号化ストリームD416を、本第12実施形態の階層映像復号化装置のストリーム逆多重化部2516に入力し、複数のストリームに分離することで、装置全体に入力されるストリームの数を減じて装置実装コストを削減することができる。
具体的な逆多重化については、(H1)MPEG2システム(ISO/IEC 13818-1、AMENDMENTの記述も含む)のTransport Stream、(H2)MP4ファイルフォーマット形式(ISO/IEC 14496-14)、(H3)AVCファイルフォーマット形式(ISO/IEC 14496-15)など既知の方式を利用する。
なお、本第12実施形態によるストリーム逆多重化部2516は、第2の符号化ストリームD2207と第3の符号化ストリームD2210とを分離して出力しているが、本発明は、これら最小限の逆多重化に限定されない。例えば、(G1)第10実施形態と組み合わせて、第1の符号化ストリームD2201と第2の符号化ストリームD2207と第3の符号化ストリームD2210とが多重化されている入力多重化ストリームD2515を、ストリーム逆多重化部2516において第1の符号化ストリームD2207と第2の符号化ストリームD2207と第3の符号化ストリームD2210とに分離してストリームを出力しても良いし、(G2)音声や、ユーザーデータなどの映像以外の情報も分離してストリームをとして出力して良い。
上記(G1)のように、第1の符号化ストリームD2201と第2の符号化ストリームD2207と第3の符号化ストリームD2210とを多重化したストリームD2515を入力し、ストリーム逆多重化部2516が第1の符号化ストリームD2201も分離して下位階層復号化部2203へ出力することで、装置全体に入力されるストリームの数を更に減じることができ、この入力多重化ストリームD2515から下位階層の映像と第1の上位階層の映像と第2の上位階層の映像を復号することができる。また、上記(G2)のように、音声や、ユーザーデータなど映像以外の情報も多重化されているストリームを入力することで、映像以外の情報もストリームに統合して伝送することができる。
M.第13実施形態
次に、本発明の第13実施形態について説明する。
図26は、本第13実施形態による階層映像復号化装置に入力される第2の符号化ストリームの構成を示す概念図である。また、図27は、本第13実施形態による階層映像復号化装置に入力される第3の符号化ストリームの構成を示す概念図である。
本第13実施形態による階層映像復号化装置の構成は、前述した第9実施形態の構成(図22参照)と同様であり、符号化ストリームとしてISO/IEC 14496−10 Annex Gを利用している。
本第13実施形態による第1の上位階層復号化部2209は、ISO/IEC 14496−10 Annex Gにおけるdependency_idシンタックス要素の同じ第1の値「1」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットを第2の符号化ストリームD2207として入力する。
また、第2の上位階層復号化部2212は、ISO/IEC 14496−10 Annex Gにおけるdependency_idシンタックス要素の同じ第2の値「2」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットであり、かつ第2の符号化ストリームD2207におけるVCL NALユニットのサブセット中に含まれているref_layer_idシンタックス要素の値と同一の値0をref_layer_idシンタックス要素として含むVCL NALユニットのサブセットを第3の符号化ストリームD2210として入力する。
第1の上位階層復号化部2209は、図26に示すように、第1の上位階層に対応するシーケンスパラメータセット2601、第1の上位階層に対応するピクチャパラメータセット2602、第1の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)2603、第1の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)2604、第1の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)2605の順に第2の符号化ストリームD2207を入力する。
第2の上位階層符号化部2212は、図27に示すように、第2の上位階層に対応するシーケンスパラメータセット2701、第2の上位階層に対応するピクチャパラメータセット2702、第2の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)2703、第2の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)2704、第2の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)2705の順に第3の符号化ストリームD2210を入力する。
本第13実施形態は、符号化ストリームとしてISO/IEC 14496−10 Annex Gを利用しているが、本発明は、あくまでISO/IEC 14496−10 Annex Gを「利用」するものであり、必ずしもストリームの全ての構造において必ずしも完全にISO/IEC 14496−10 Annex Gに準拠することを必須の条件としない。
例えば、バッファリング期間SEIメッセージ(Buffering period SEI message)については、装置に入力されるビットストリームにおいて、ISO/IEC 14496−10 Annex Gに適合するように第1の上位階層復号化部2209や、第2の上位階層復号化部2212に入力されても良いし、特に適合していなくても良い。適合していない場合には、独自シンタックス要素を用いたり、符号化器側と復号化器側で別途取り決めを行ったりなどして対応しても良い。
N.第14実施形態
次に、本発明の第14実施形態について説明する。
図28は、本第14実施形態による階層映像復号化装置の構成を示すブロック図である。なお、図22に対応する部分には同一の符号を付けて説明を省略する。図28において、本第14実施形態による階層映像復号化装置は、ストリーム逆多重化部2816を更に備えている。ストリーム逆多重化部2816は、同一のアクセスユニット内で、ベースレイヤ、dependency_id シンタックス要素の第1の値「1」に関連付けられたVCL NALユニット、dependency_idシンタックス要素の第2の値「2」に関連付けられたVCL NALユニットの順にVCL NALユニットを配置して多重化されている入力多重化ストリーム2815を入力する。
また、ストリーム逆多重化部2816は、同一のアクセスユニット内で、ベースレイヤを含み、かつdependency_id シンタックス要素の第1の値「1」に関連付けられたVCL NALユニットとdependency_idシンタックス要素の第2の値「2」に関連付けられたVCL NALユニットを除去してVCL NALユニットを再配置した符号化ストリームを第1の符号化ストリームD2801として下位階層復号化部2203に出力する。
また、ストリーム逆多重化部2816は、同一のアクセスユニット内で、dependency_idシンタックス要素の第1の値「1」に関連付けられたVCL NALユニットを含み、かつベースレイヤとdependency_idシンタックス要素の第2の値「2」に関連付けられたVCL NALユニットを除去してVCL NALユニットを再配置した符号化ストリームを、第2の符号化ストリームD2207として第1の上位階層復号化部2209に出力する。
さらに、ストリーム逆多重化部2816は、同一のアクセスユニット内で、dependency_idシンタックス要素の第2の値「2」に関連付けられたVCL NALユニットを含み、かつベースレイヤとdependency_id シンタックス要素の第1の値「1」に関連付けられたVCL NALユニットを除去してVCL NALユニットを再配置した符号化ストリームを、第3の符号化ストリームD2210として第2の上位階層復号化部2212に出力する。
また、下位階層復号化部2203は、ISO/IEC 14496−10 Annex Gにおけるベースレイヤを第1の符号化ストリームD2801として入力し、第2の上位階層復号化部2212は、第13実施形態で説明したdependency_id シンタックス要素の第1の値「1」より大きな値である、dependency_id シンタックス要素の第2の値「2」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットを第3の符号化ストリームD2210として入力する。
図29は、本第14実施形態によるストリーム逆多重化部2816に入力される入力多重化ストリーム2815の構成を示す概念図である。ストリーム逆多重化部2816は、下位階層に対応するシーケンスパラメータセット3001、第1の上位階層に対応するシーケンスパラメータセット2601、第2の上位階層に対応するシーケンスパラメータセット2701、下位階層に対応するピクチャパラメータセット3002、第1の上位階層に対応するピクチャパラメータセット2602、第2の上位階層に対応するピクチャパラメータセット2702、続いて、下位階層の映像の1番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3003、第1の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)2603、第2の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)2703、続いて、下位階層の映像の2番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3004、第1の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)2604、第2の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)2704、更に、下位階層の映像の3番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3005、
第1の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)2605、第2の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)2705の順に多重化されている入力多重化ストリームD2815を入力する。
図30は、本第14実施形態によるストリーム逆多重化部2816が下位階層復号化部2203に出力する第1の符号化ストリームD2801の構成を示す概念図である。図30において、ストリーム逆多重化部2816は、下位階層に対応するシーケンスパラメータセット3001、下位階層に対応するピクチャパラメータセット3002、下位階層の映像の1番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3003、下位階層の映像の2番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3004、下位階層の映像の2番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3005の順に第1の符号化ストリームD2801を出力する。
本第14実施形態においては、下位階層復号化部2203は、ISO/IEC 14496−10 Annex Gにおけるベースレイヤを第1の符号化ストリームD2801として入力し、第1の符号化ストリームD2801におけるdependency_idシンタックス要素の値は0であり、ref_layer_dq_idは符号化されていない。
しかし、第2の上位階層復号化部2212は、第2の符号化ストリームD2207におけるVCL NALユニットのサブセット中に含まれているref_layer_dq_idシンタックス要素の値と同一の値をref_layer_qd_idシンタックス要素として含むVCL NALユニットのサブセットを、第3の符号化ストリームD2210として入力することが必要であるが、このref_layer_qd_idシンタックス要素の値が0である必要はない。
したがって、第1の符号化ストリームD2801におけるdependency_idシンタックス要素の値が0である必要はないことは容易に類推される。すなわち、下位階層復号化部2203は、ISO/IEC 14496−10 Annex Gにおけるベースレイヤを第1の符号化ストリームD2801として入力する必要はなく、第2の符号化ストリームD2207と第3の符号化ストリームD2210とが共に第1の符号化ストリームD2801を下位階層とする上位階層のストリームであれば十分である。
本第14実施形態は、符号化ストリームとして、ISO/IEC 14496−10 Annex Gを利用しているが、本発明はあくまでISO/IEC 14496−10 Annex Gを「利用」するものであり、必ずしもストリームの全ての構造において必ずしも完全にISO/IEC 14496−10 Annex Gに準拠することを必須の条件としない。
例えば、バッファリング期間SEIメッセージ(Buffering period SEI message)については、装置に入力されるビットストリームにおいてISO/IEC 14496−10 Annex Gに適合するように第1の上位階層復号化部2209や、第2の上位階層復号化部2212や、下位階層復号化部2203や、ストリーム逆多重化部28016に入力されても良いし、特に適合していなくても良い。適合していない場合には、独自シンタックス要素を用いたり、符号化器側と復号化器側で別途取り決めを行ったりなどして対応しても良い
O.第15実施形態
次に、本発明の第15実施形態について説明する。
図31は、本第15実施形態による階層映像復号化装置に入力される符号化ストリームの構成を示す概念図である。なお、本第15実施形態による階層映像復号化装置の構成は、前述した第12実施形態の構成(図25参照)と同様であるので説明を省略する。
本第15実施形態によるストリーム逆多重化部2516は、下位階層に対応するシーケンスパラメータセット3101、第1の上位階層に対応するシーケンスパラメータセット3201、第2の上位階層に対応するシーケンスパラメータセット3301、下位階層に対応するピクチャパラメータセット3102、第1の上位階層に対応するピクチャパラメータセット3202、第2の上位階層に対応するピクチャパラメータセット3302、続いて、下位階層の映像の1番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3103、第1の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)3203、第2の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3303、続いて、下位階層の映像の2番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3104、第1の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)3204、第2の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3304、更に、下位階層の映像の3番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3105、第1の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)3205、第2の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3305の順に多重化されている入力多重化ストリームD2515を入力する。
図32は、本第15実施形態によるストリーム逆多重化部2516が出力する第2の符号化ストリームD2207の構成を示す概念図である。ストリーム逆多重化部2516は、図32に示すように、下位階層に対応するシーケンスパラメータセット3101、第1の上位階層に対応するシーケンスパラメータセット3201、下位階層に対応するピクチャパラメータセット3102、第1の上位階層に対応するピクチャパラメータセット3202、下位階層の映像の1番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3103、第1の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)3203、下位階層の映像の2番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3104、第1の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)3204、下位階層の映像の3番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3105、第1の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)3205の順に多重化されている第2の符号化ストリームD2207を、第1の上位階層復号化部(第1の出力先)2209に出力する。
図33は、本第15実施形態によるストリーム逆多重化部2516が出力する第3の符号化ストリームD2210の構成を示す概念図である。ストリーム逆多重化部2516は、図33に示すように、下位階層に対応するシーケンスパラメータセット3101、第2の上位階層に対応するシーケンスパラメータセット3301、下位階層に対応するピクチャパラメータセット3102、第2の上位階層に対応するピクチャパラメータセット3302、下位階層の映像の1番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3103、第2の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3303、下位階層の映像の2番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3104、第2の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3304、下位階層の映像の3番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)3105、第2の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3305の順に多重化されている第3の符号化ストリームD2210を、第2の上位階層復号化部(第2の出力先)2212に出力する。
本第15実施形態によれば、ISO/IEC 14496−10 Annex G における同一のアクセスユニット内で、ベースレイヤ、dependency_id シンタックス要素の第1の値に関連付けられたVCL NALユニット、dependency_idシンタックス要素の第2の値に関連付けられたVCL NALユニットの順にVCL NALユニットを配置して多重化した符号化ストリームであり、かつdependency_id シンタックス要素の第1の値に関連付けられたVCL NALユニットに含まれているref_layer_idシンタックス要素の値とdependency_id シンタックス要素の第2の値に関連付けられたVCL NALユニットに含まれているref_layer_idシンタックス要素の値とが同一であり、かつdependency_id シンタックス要素の第1の値よりdependency_id シンタックス要素の第2の値のほうが大きい符号化ストリームを入力された場合に、本第15実施形態による階層映像復号化装置を用いて2つの符号化ストリームを出力することで、出力された符号化ストリームについては、下位階層と上位階層との二階層分の復号化器で構成される通常の階層映像復号化器を用いて、下位階層の映像と上位階層の映像との双方うを復号することができるという利点がある。
P.第16実施形態
次に、本発明の第16実施形態について説明する。
図34は、本第13実施形態による階層映像復号化装置の構成を示すブロック図である。図34において、ストリーム逆多重化部3423は、第1の符号化ストリームD3401と第2の符号化ストリームD3409と第3の符号化ストリームD3412と第4の符号化ストリーム3415と第5の符号化ストリームD3418とが多重化されている入力多重化ストリームD3422を入力する。
また、ストリーム逆多重化部3423は、入力多重化ストリームD3422から、第1の符号化ストリームD3401を分離して下位階層復号化部3403に出力し、第2の符号化ストリームD3409を分離して第1の上位階層復号化部3411に出力し、第3の符号化ストリームD3412を分離して第2の上位階層復号化部3414に出力し、第4の符号化ストリームD3415を分離して第3の上位階層復号化部3417に出力し、第5の符号化ストリームD3418を分離して第4の上位階層復号化部3420に出力する。
下位階層復号化部3403は、下位階層の映像の符号化結果を含む第1の符号化ストリームD3401を入力し、少なくとも第1の上位階層の映像と第2の上位階層の映像と第3の上位階層の映像と第4の上位階層の映像の復号化に必要な情報D3402を出力する。また、下位階層復号化部3403は、下位階層の映像を復号化して輝度が横1920×縦1080サンプル数である第五の復号映像3421を出力する。
階層復号化中間部3408は、下位階層復号部3403から第1の上位階層の映像と第2の上位階層の映像と第3の上位階層の映像と第4の上位階層の映像の復号化に必要な情報D3402を入力し、第1の上位階層の映像の復号化に必要な情報D3404を第2の上位階層復号化部3411に出力し、第2の上位階層の映像の復号化に必要な情報D3405を第2の上位階層復号化部3414に出力し、第3の上位階層の映像の復号化に必要な情報D3406を第3の上位階層復号化部3417に出力し、第4の上位階層の映像の復号化に必要な情報D3407を第4の上位階層復号化部3420に出力する。
第1の上位階層復号化部3411は、第1の上位階層の映像の符号化結果を含む第2の符号化ストリームD3409を入力し、階層復号化中間部3408から第1の上位階層の映像の復号化に必要な情報D3404を入力し、第2の上位階層の映像を復号化して輝度が横1920×縦1080サンプル数である第1の復号映像D3410を出力する。
第2の上位階層復号化部3414は、第2の上位階層の映像の符号化結果を含む第3の符号化ストリームD3412を入力し、階層復号化中間部3408から第2の上位階層の映像の復号化に必要な情報D3405を入力し、第2の上位階層の映像を復号化して輝度が横1920×縦1080サンプル数である第2の復号映像3413を出力する。
第3三の上位階層復号化部3417は、第3の上位階層の映像の符号化結果を含む第4の符号化ストリームD3415を入力し、階層復号化中間部3408から第3の上位階層の映像の復号化に必要な情報D3406を入力し、第3の上位階層の映像を復号化して輝度が横1920×縦1080サンプル数である第3の復号映像3416を出力する。
第4の上位階層復号化部3420は、第4の上位階層の映像の符号化結果を含む第5の符号化ストリームD3418を入力し、階層復号化中間部3408から第4の上位階層の映像の復号化に必要な情報D3407を入力し、第4の上位階層の映像を復号化して輝度が横1920×縦1080サンプル数である第4の復号映像D3419を出力する。
映像合成部3425は、輝度が横1920×縦1080サンプル数である第1の復号映像D3410を第1の上位階層復号化部3411から入力し、輝度が横3840×縦2160サンプル数である合成後上位階層映像D3424の左上1/4の領域に合成し、
輝度が横1920×縦1080サンプル数である第2の復号映像D3413を第2の上位階層復号化部3414から入力し、輝度が横3840×縦2160サンプル数である合成後上位階層映像D3424の右上1/4の領域に合成し、輝度が横1920×縦1080サンプル数である第3の復号映像D3416を第3の上位階層復号化部1117から入力し、輝度が横3840×縦2160サンプル数である合成後上位階層映像D3424の左下1/4の領域に合成し、輝度が横1920×縦1080サンプル数である第4の復号映像D3419を第4の上位階層復号化部1120から入力し、輝度が横3840×縦2160サンプル数である合成後上位階層映像D3424の右下1/4の領域に合成し、最終的に、輝度が横3840×縦2160サンプル数である合成後上位階層映像D3424を出力する。
図35は、本第16実施形態による第2の符号化ストリームD3409の構成を示す概念図である。また、図36は、本第16実施形態による第3の符号化ストリームD3412の構成を示す概念図である。また、図37は、本第16実施形態による第4の符号化ストリームD3415の構成を示す概念図である。また、図38は、本第16実施形態による第5の符号化ストリームD3418の構成を示す概念図である。なお、本第16実施形態では、符号化ストリームとしてISO/IEC 14496−10 Annex Gを利用している。
第1の上位階層復号化部3411は、ISO/IEC 14496−10 Annex Gにおけるdependency_idシンタックス要素の同じ第1の値「1」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットを第2の符号化ストリームD3409として入力する。
第2の上位階層復号化部3414は、ISO/IEC 14496−10 Annex Gにおけるdependency_idシンタックス要素の同じ第2の値「2」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットであり、かつ第2の符号化ストリームD3409におけるVCL NALユニットのサブセット中に含まれているref_layer_dq_idシンタックス要素の値と同一の値「0」をref_layer_dq_idシンタックス要素として含むVCL NALユニットのサブセットを第3の符号化ストリームD3412として入力する。
第3の上位階層復号化部3417は、ISO/IEC 14496−10 Annex Gにおけるdependency_idシンタックス要素の同じ第3の値「3」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットであり、かつ第2の符号化ストリームD3409におけるVCL NALユニットのサブセット中に含まれているref_layer_dq_idシンタックス要素の値と同一の値「0」をref_layer_dq_idシンタックス要素として含むVCL NALユニットのサブセットを第4の符号化ストリームD3415として入力する。
第4の上位階層復号化部3420は、ISO/IEC 14496−10 Annex Gにおけるdependency_idシンタックス要素の同じ第4の値「4」に関連付けられたアクセスユニット内のVCL NALユニットのサブセットであり、かつ第2の符号化ストリームD3409におけるVCL NALユニットのサブセット中に含まれているref_layer_dq_idシンタックス要素の値と同一の値「0」をref_layer_dq_idシンタックス要素として含むVCL NALユニットのサブセットを第5の符号化ストリームD3418として入力する。
第1の上位階層復号化部3411は、図35に示すように、第1の上位階層に対応するシーケンスパラメータセット3501、第1の上位階層に対応するピクチャパラメータセット3502、第1の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)3503、第1の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)3504、第1の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)3505の順に第2の符号化ストリームD3409を入力する。
第2の上位階層復号化部3414は、図36に示すように、第2の上位階層に対応するシーケンスパラメータセット3601、第2の上位階層に対応するピクチャパラメータセット3602、第2の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3603、第2の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3604、第2の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3605の順に第3の符号化ストリームD3412を入力する。
第3の上位階層復号化部3417は、図37に示すように、第3の上位階層に対応するシーケンスパラメータセット3701、第3の上位階層に対応するピクチャパラメータセット3702、第3の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3703、第3の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3704、第3の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3705の順に第4の符号化ストリームD3415を入力する。
第4の上位階層復号化部3420は、図38に示すように、第4の上位階層に対応するシーケンスパラメータセット3801、第4の上位階層に対応するピクチャパラメータセット3802、第4の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3803、第4の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3804、第4の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3805の順に第5の符号化ストリームD3418を入力する。
下位階層復号化部3403は、ISO/IEC 14496−10 Annex Gにおけるベースレイヤを第1の符号化ストリームD3401として入力する。ストリーム逆多重化部3423は、同一のアクセスユニット内で、ベースレイヤ、dependency_idシンタックス要素の第1の値「1」に関連付けられたVCL NALユニット、dependency_idシンタックス要素の第2の値「2」に関連付けられたVCL NALユニット、dependency_idシンタックス要素の第3の値「3」に関連付けられたVCL NALユニット、dependency_idシンタックス要素の第4の値「4」に関連付けられたVCL NALユニットの順にVCL NALユニットを配置して多重化されている入力多重化ストリームD3422を入力する。
また、ストリーム逆多重化部3423は、同一のアクセスユニット内で、ベースレイヤを含み、かつdependency_idシンタックス要素の第1の値「1」に関連付けられたVCL NALユニットと、dependency_idシンタックス要素の第2の値「2」に関連付けられたVCL NALユニットと、dependency_idシンタックス要素の第3の値「3」に関連付けられたVCL NALユニットと、dependency_id シンタックス要素の第4の値「4」に関連付けられたVCL NALユニットとを除去して、VCL NALユニットを再配置した符号化ストリームを第1の符号化ストリームD3401として下位階層復号化部3403に出力する。
また、ストリーム逆多重化部3423は、同一のアクセスユニット内で、dependency_idシンタックス要素の第1の値「1」に関連付けられたVCL NALユニットを含み、かつベースレイヤとdependency_idシンタックス要素の第2の値「2」に関連付けられたVCL NALユニットと、dependency_idシンタックス要素の第3の値「3」に関連付けられたVCL NALユニットと、dependency_idシンタックス要素の第4の値「4」に関連付けられたVCL NALユニットとを除去して、VCL NALユニットを再配置した符号化ストリームを第2の符号化ストリームD3409として第2の上位階層復号化部3411に出力する。
また、ストリーム逆多重化部3423は、同一のアクセスユニット内で、dependency_idシンタックス要素の第2の値「2」に関連付けられたVCL NALユニットを含み、かつベースレイヤとdependency_idシンタックス要素の第1の値「1」に関連付けられたVCL NALユニットと、dependency_idシンタックス要素の第3の値「3」に関連付けられたVCL NALユニットと、dependency_idシンタックス要素の第4の値「4」に関連付けられたVCL NALユニットとを除去して、VCL NALユニットを再配置した符号化ストリームを第3の符号化ストリームD3412として第2の上位階層復号化部3414に出力する。
また、ストリーム逆多重化部3423は、同一のアクセスユニット内で、dependency_idシンタックス要素の第3の値「3」に関連付けられたVCL NALユニットを含み、かつベースレイヤとdependency_idシンタックス要素の第1の値「1」に関連付けられたVCL NALユニットと、dependency_idシンタックス要素の第2の値「2」に関連付けられたVCL NALユニットと、dependency_id シンタックス要素の第4の値「4」に関連付けられたVCL NALユニットとを除去して、VCL NALユニットを再配置した符号化ストリームを第4の符号化ストリームD3415として第3の上位階層復号化部3417に出力する。
さらに、ストリーム逆多重化部3423は、同一のアクセスユニット内で、dependency_idシンタックス要素の第4の値「4」に関連付けられたVCL NALユニットを含み、かつベースレイヤとdependency_idシンタックス要素の第1の値「1」に関連付けられたVCL NALユニットと、dependency_idシンタックス要素の第2の値「2」に関連付けられたVCL NALユニットと、dependency_idシンタックス要素の第3の値「3」に関連付けられたVCL NALユニットとを除去して、VCL NALユニットを再配置した符号化ストリームを第5の符号化ストリームD3418として第4の上位階層復号化部3420に出力する。
図39は、本第16実施形態によるストリーム逆多重化部3423に入力される入力多重化ストリーム3422の構成を示す概念図である。ストリーム逆多重化部3423は、図39に示すように、下位階層に対応するシーケンスパラメータセット4001、第1の上位階層に対応するシーケンスパラメータセット3501、第2の上位階層に対応するシーケンスパラメータセット3601、第3の上位階層に対応するシーケンスパラメータセット3701、第4の上位階層に対応するシーケンスパラメータセット3801、下位階層に対応するピクチャパラメータセット4002、第1の上位階層に対応するピクチャパラメータセット3502、第2の上位階層に対応するピクチャパラメータセット3602、第3の上位階層に対応するピクチャパラメータセット3702、第4の上位階層に対応するピクチャパラメータセット3802、続いて、下位階層の映像の1番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)4003、第1の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=1,1 ref_layer_dq_id=0)3503、第2の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3603、第3の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=3,ref_layer_dq_id=0)3703、第4の上位階層の映像の1番目のアクセスユニットのスライス(dependency_id=4,ref_layer_dq_id=0)3803、続いて、下位階層の映像の2番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)4004、第1の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)3504、第2の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3604、第3の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=3,ref_layer_dq_id=0)3704、第4の上位階層の映像の2番目のアクセスユニットのスライス(dependency_id=4,ref_layer_dq_id=0)3804、更に、下位階層の映像の3番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)4005、第1の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=1,ref_layer_dq_id=0)3505、第2の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=2,ref_layer_dq_id=0)3605、第3の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=3,ref_layer_dq_id=0)3705、第4の上位階層の映像の3番目のアクセスユニットのスライス(dependency_id=4,ref_layer_dq_id=0)3805の順に多重化されている入力多重化ストリームD3422を入力する。
図40は、本第16実施形態によるストリーム逆多重化部3423が下位階層復号化部3403に出力する第1の符号化ストリームD3401の構成を示す概念図である。ストリーム逆多重化部3423は、図40に示すように、下位階層に対応するシーケンスパラメータセット4001、下位階層に対応するピクチャパラメータセット4002、下位階層の映像の1番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)4003、下位階層の映像の2番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)4004、下位階層の映像の3番目のアクセスユニットのスライス(dependency_id=0,ref_layer_dq_idは符号化されていない)4005の順に第1の符号化ストリームD3401を出力する。
図41は、本第16実施形態による合成後上位階層映像D3424を示す概念図である。また、図42は、本第16実施形態による第1の復号映像D3410〜第4の復号映像D3419の位置関係を示す概念図である。ここで、本第16実施形態による合成後上位階層映像D3424の解像度は、下位階層の映像である第5の復号映像D3421に対して、縦と横にそれぞれ2倍である。
また、図43は、本第16実施形態による下位階層の映像D4301を示す概念図である。また、図44は、本第16実施形態による下位階層の映像を縦と横にそれぞれ等分に2領域に分けて計4領域に分けた映像の位置関係を示す概念図である。
合成後上位階層映像D3424から分割された左上の映像である第1の復号映像D3410は、下位階層の映像D4301のうち、左上の映像領域である第1の下位階層映像領域4401から階層間予測を行うことで効率的な符号化が可能である。また、合成後上位階層映像D3424から分割された右上の映像である第2の復号映像D3413は、下位階層の映像D4301のうち、右上の映像領域である第2の下位階層映像領域4402から階層間予測を行うことで効率的な符号化が可能である。
同様に、合成後上位階層映像D3424から分割された左下の映像である第3の復号映像D3416は、下位階層の映像D4301のうち、左下の映像領域である第3の下位階層映像領域4403から階層間予測を行うことで効率的な符号化が可能である。また、合成後上位階層映像D3424から分割された右下の映像である第4の上位階層の映像D3419は、下位階層の映像D4301のうち、右下の映像領域である第4の下位階層映像領域4404から階層間予測を行うことで効率的な符号化が可能である。
ここで、「上位階層の映像の復号化に必要な情報」とは、ISO/IEC 14496−10 Annex Gにおいては、下位階層の映像D4301のうち、当該上位階層の映像を縮小した領域に該当する部分を含む映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードである。上述したように、合成後上位階層映像D3424から分割された左上の映像である第1の復号映像D3410は、下位階層の映像4301のうち、左上の映像領域である第1の下位階層映像領域4401から階層間予測を行うことで効率的な符号化が可能であるので、第1の符号化ストリームD3401においては、下位階層のピクチャと上位階層のピクチャとの位置関係を表すシンタックス要素である、scaled_ref_layer_left_offset、scaled_ref_layer_top_offset、scaled_ref_layer_right_offset、scaled_ref_layer_bottom_offsetは、以下のようにシーケンスパラメータセット、またはスライスヘッダで記述されている。
scaled_ref_layer_left_offset=0
scaled_ref_layer_top_offset=0
scaled_ref_layer_right_offset=-960
scaled_ref_layer_bottom_offset=-270
この記述により、下位階層の映像D4301のうち、左上の映像領域である第1の下位階層映像領域4401を、解像度比で縦横をそれぞれ2倍で再サンプリングを行った映像を階層間予測に用いることができる。ここで、第1の復号映像D3410の復号化に必要な情報3404としては、第1の下位階層映像領域4401の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含めば十分であるが、符号化効率向上などの目的のため、境界付近など第1の下位階層映像領域4401以外の下位階層映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含んでも良い。
合成後上位階層映像D3424から分割された右上の映像である第2の復号映像D3413は、下位階層の映像D4301のうち、右上の映像領域である第2の下位階層映像領域4402から階層間予測を行うことで効率的な符号化が可能であるので、第2の符号化ストリームにおいては、scaled_ref_layer_left_offset、scaled_ref_layer_top_offset、scaled_ref_layer_right_offset、scaled_ref_layer_bottom_offsetは、以下のようにシーケンスパラメータセット、またはスライスヘッダで記述されている。
scaled_ref_layer_left_offset=-960
scaled_ref_layer_top_offset=0
scaled_ref_layer_right_offset=0
scaled_ref_layer_bottom_offset=-270
この記述により、下位階層の映像D4301のうち、右上の映像領域である第2の下位階層映像領域4402を、解像度比で縦横をそれぞれ2倍で再サンプリングを行った映像を階層間予測に用いることができる。ここで、第2の復号映像D3413の復号化に必要な情報3405としては、第2の下位階層映像領域4402の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含めば十分であるが、符号化効率向上などの目的のため、境界付近など第2の下位階層映像領域4402以外の下位階層映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含んでも良い。
合成後上位階層映像D3424から分割された左下の映像である第3の復号映像D3416は、下位階層の映像D4301のうち、左下の映像領域である第3の下位階層映像領域4403から階層間予測を行うことで効率的な符号化が可能であるので、第3の符号化ストリームD3412においては、scaled_ref_layer_left_offset、scaled_ref_layer_top_offset、scaled_ref_layer_right_offset、scaled_ref_layer_bottom_offsetは、以下のようにシーケンスパラメータセット、またはスライスヘッダで記述されている。
scaled_ref_layer_left_offset=0
scaled_ref_layer_top_offset=-270
scaled_ref_layer_right_offset=-960
scaled_ref_layer_bottom_offset=0
この記述により、下位階層の映像D4301のうち、左下の映像領域である第3の下位階層映像領域4403を、解像度比で縦横をそれぞれ2倍で再サンプリングを行った映像を階層間予測に用いることができる。ここで、第3の復号映像D3416の復号化に必要な情報D3406としては、第3の下位階層映像領域4403の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含めば十分であるが、符号化効率向上などの目的のため、境界付近など第3の下位階層映像領域4403以外の下位階層映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含んでも良い。
合成後上位階層映像D3424から分割された右下の映像である第4の復号映像D349は、下位階層映像4301のうち、右下の映像領域である第4の下位階層映像領域4404から階層間予測を行うことで効率的な符号化が可能であるので、第4の符号化ストリームD3419においては、scaled_ref_layer_left_offset、scaled_ref_layer_top_offset、scaled_ref_layer_right_offset、scaled_ref_layer_bottom_offsetは、以下のようにシーケンスパラメータセット、またはスライスヘッダで記述されている。
scaled_ref_layer_left_offset=-960
scaled_ref_layer_top_offset=-270
scaled_ref_layer_right_offset=0
scaled_ref_layer_bottom_offset=0
この記述により、下位階層の映像D4301のうち、右下の映像領域である第4の下位階層映像領域4404を、解像度比で縦横をそれぞれ2倍で再サンプリングを行った映像を階層間予測に用いることができる。ここで、第4の復号映像D3419の復号化に必要な情報D3407としては、第4の下位階層映像領域4404の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含めば十分であるが、符号化効率向上などの目的のため、境界付近など第4の下位階層映像領域4404以外の下位階層映像領域の復号画像、予測誤差信号、動きベクトル、マクロブロックの符号化モードを含んでも良い。
本第16実施形態においては、合成後上位階層映像D3424の輝度が横3840×縦2160サンプル数であり、合成後上位階層映像D3424を縦と横にそれぞれ等分に2分割して計4分割した輝度が横1920×縦1080サンプル数である各映像を第1の復号映像D3410〜第四の復号映像D3419としたが、本発明における合成後上位階層映像D3424の輝度のサンプル数や、分割の数、下位階層映像の輝度のサンプル数は、上記の例に限らないことは言うまでもない。
また、ストリーム逆多重化部3423を備えず、第2の符号化ストリームD3409、第3の符号化ストリームD3412、第4の符号化ストリームD3415、第5の符号化ストリームD3418が個々に装置に入力されても良いし、第2の符号化ストリームD3409には、下位階層の映像D4301を符号化したストリームの情報が含まれていても良いし、第3の符号化ストリームD3412には、下位階層の映像D4301を符号化したストリームの情報が含まれていても良いし、第4の符号化ストリームD3415には、下位階層の映像D4301を符号化したストリームの情報が含まれていても良いし、第5の符号化ストリームD3418には、下位階層の映像D4301を符号化したストリームの情報が含まれていても良い。
また、第2の符号化ストリームD3409と第3の符号化ストリームD3412と第4の符号化ストリームD3415と第5の符号化ストリームD348の4つの符号化ストリームを入力することで、伝送路の帯域に制限がある場合でも、4つの伝送路に分けて符号化ストリームを入力することができる。
また、第1の上位階層復号部3411への入力において、下位階層の映像D4301を符号化したストリームを多重化させておくことで、下位階層と上位階層との二階層分の復号化器で構成される通常の階層映像復号化器を利用して、第2の符号化ストリームD3409から下位階層の映像と第1の上位階層の映像との双方を復号することができる。
また、第2の上位階層復号部3414への入力において、下位階層の映像D4301を符号化したストリームを多重化させておくことで、下位階層と上位階層との二階層分の復号化器で構成される通常の階層映像復号化器を利用して、第3の符号化ストリームD3412から下位階層の映像と第2の上位階層の映像との双方を復号することができる。
また、第3の上位階層復号部3417への入力において、下位階層の映像D4301を符号化したストリームを多重化させておくことで、下位階層と上位階層との二階層分の復号化器で構成される通常の階層映像復号化器を利用して、第4の符号化ストリームD3415から下位階層の映像と第3の上位階層の映像との双方を復号することができる。
同様に、第4の上位階層復号部3420への入力において、下位階層の映像D4301を符号化したストリームを多重化させておくことで、下位階層と上位階層との二階層分の復号化器で構成される通常の階層映像復号化器を利用して、第5の符号化ストリームD3418から下位階層の映像と第4の上位階層の映像との双方を復号することができる。
上述した第1乃至第16実施形態によれば、階層映像符号化においては、上位階層の映像の解像度が下位階層の映像の解像度より大きい場合であっても、第1の上位階層符号化部と第2の上位階層符号化部に分かれて映像符号化するため、上位階層を映像符号化するために必要な演算量が下位階層を映像符号化するために必要な演算量よりも増大しても、階層映像符号化器全体の性能が上位階層の符号化器の性能の上限で制限されることなく、映像符号化を行うことができる。
また、同じ下位階層の映像を参照する複数の上位階層の映像がある場合でも、単一の下位階層符号化部で下位階層の符号化を行うため、下位階層と上位階層の二階層分の符号化器で構成される通常の階層映像符号化器を2つ用いた場合に比べて、下位階層の映像符号化器が冗長になることはなく、出力されるストリームも下位階層のストリーム1つ分余分にすることなく、映像符号化を行うことができる。
また、階層映像復号化においては、上位階層の映像の解像度が下位階層の映像の解像度より大きい場合であっても、第1の上位階層復号化部と第2の上位階層復号化部に分かれて映像復号化するため、上位階層を映像復号化するために必要な演算量が下位階層を映像復号化するために必要な演算量よりも増大しても、階層映像復号化器全体の性能が上位階層の復号化器の性能の上限で制限されることなく、映像復号化を行うことができる。
また、同じ下位階層の映像を参照する複数の上位階層の映像がある場合でも、単一の下位階層復号化部で下位階層の復号化を行うため、下位階層と上位階層の二階層分の復号化器で構成される通常の階層映像復号化器を2つ用いた場合に比べて、下位階層の映像復号化器が冗長になることはなく、入力されるストリームも下位階層のストリーム1つ分余分にすることなく、映像復号化を行うことができる。