JP2013016902A - 画像変換装置 - Google Patents

画像変換装置 Download PDF

Info

Publication number
JP2013016902A
JP2013016902A JP2011146364A JP2011146364A JP2013016902A JP 2013016902 A JP2013016902 A JP 2013016902A JP 2011146364 A JP2011146364 A JP 2011146364A JP 2011146364 A JP2011146364 A JP 2011146364A JP 2013016902 A JP2013016902 A JP 2013016902A
Authority
JP
Japan
Prior art keywords
prediction
layer
inter
unit
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011146364A
Other languages
English (en)
Inventor
yi-qing Huang
異青 黄
Hiroomi Motohashi
弘臣 本橋
Takeshi Ikenaga
剛 池永
Lei Son
磊 孫
Chieh Leng
傑 冷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2011146364A priority Critical patent/JP2013016902A/ja
Publication of JP2013016902A publication Critical patent/JP2013016902A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】エンハンスメントレイヤの符号化時に行うレイヤ間予測の負荷を低減することができる、画像変換装置を提供する。
【解決手段】画像変換装置10では、SVCエンハンスメントレイヤ符号化部34のレイヤ間予測部40が行うレイヤ間予測(ILP)における、レイヤ間動き予測、レイヤ間イントラ予測、及び残差予測の内、モードチェック部18で有効と設定された予測処理を実行する。このため、レイヤ間予測部40の負荷の低減を図ることができる。
【選択図】図1

Description

本発明の実施形態は、画像変換装置に関する。
映像圧縮符号化規格として、H.264/SVC(Scalable Video Coding)(以下、単にSVC規格と称する場合がある)というスケーラブル映像符号化が知られている。このSVC規格では、1つのビデオストリームに複数の空間、時間、又は画質サッブセットストリームを含むことができる。このSVC規格を用いた技術は、ビデオ通信システム等に用いられている。
また、映像圧縮符号化規格としては、SVC規格の他にも種々の公知の規格が定められている。特に、H.264/AVC(Advanced Video Coding)(以下、単に、AVC規格と称する場合がある)に準拠した符号化方式で符号化する装置が広く用いられている。
このAVC規格に準拠した符号化方式で符号化する装置と、SVC規格に準拠した符号化方式で符号化する装置と、を接続する場合には、AVC規格に準拠した符号化方式で符号化されたストリームを、SVC規格に準拠した符号化方式で符号化されたストリームに変換する、変換技術が重要となる。
具体的には、AVC規格に準拠した符号化方式で符号化されたストリームを復号化した後に、再度、SVC規格に準拠した符号化方式で符号化することによって、ストリームの変換を行う。
SVC規格に準拠した符号化方式を用いてストリームを符号化する場合には、ベースレイヤと複数のエンハンスメントレイヤを受信し、ベースレイヤについては、公知のインター予測とイントラ予測を用いて符号化を行う。一方、エンハンスメントレイヤについては、解像度の低い下位階層における符号化処理で生成された情報を参照して符号化を行うレイヤ間予測(Inter Layer Prediction:以下、ILPと称する場合がある)を用いる。このレイヤ間予測を用いることによって、圧縮率の向上を図ることができるが、レイヤ間予測の負荷が大きかった。
一方、レイヤ間予測を用いずに、ベースレイヤとエンハンスメントレイヤとを別々に符号化する独立符号化技術も知られている。この独立符号化技術を用いることによって、負荷の低減を図ることはできるが、レイヤ間予測を用いた場合にくらべて圧縮率が低下するという問題があった。
ここで、特許文献1には、MPEG2規格に準拠した符号化方式で符号化された映像を復号化するデコーダと、該復号化された映像情報をH.264/AVC規格に準拠した符号化方式で符号化するエンコーダと、を有するトランスコーダが開示されている。特許文献1では、MPEG2規格に準拠した符号化方式で符号化されたストリームに適用された符号化方式を示す情報を用いて、該エンコーダが符号化を行うことが開示されている。
しかしながら、特許文献1の技術を用いても、エンハンスメントレイヤの符号化時に行うレイヤ間予測の負荷軽減を図ることは困難であった。
本発明は、エンハンスメントレイヤの符号化時に行うレイヤ間予測の負荷を低減することができる、画像変換装置を提供することを課題とする。
本発明の画像変換装置は、H.264/AVC規格に準拠した符号化方式で符号化された入力画像を復号化し、復号画像信号を出力する復号手段と、前記復号画像信号に対して、予め定められた解像度比に応じて該復号画像信号より解像度の低い低解像度信号を生成するダウンサンプリング手段と、前記復号画像信号及び前記低解像度信号をH.264/SVC規格に準拠した符号化方式で符号化する符号化手段と、前記符号化手段が前記復号画像信号に対して行うレイヤ間予測に含まれる、複数の予測処理の各々について、各予測処理を有効とするか無効とするかを示す制御情報を生成する生成手段と、を備え、前記符号化手段は、前記復号画像信号を第1の解像度のエンハンスメントレイヤの符号化対象信号として受け付けると共に、前記低解像度信号を、前記第1の解像度より解像度の低いベースレイヤの符号化対象信号として受け付け、前記低解像度信号の符号化によって得られるベースレイヤ情報に基づいて、前記エンハンスメントレイヤの符号化対象信号に対して前記制御情報によって有効とされた予測処理を実行する、画像変換装置である。
H.264/AVC規格に準拠した符号化方式で符号化された入力画像を復号化し、復号画像信号を出力する復号手段と、前記復号画像信号に対して、予め定められた解像度比に応じて該復号画像信号より解像度の低い低解像度信号を生成するダウンサンプリング手段と、前記入力画像のシンタックスを解析し、該入力画像のシンタックスへのSVC規格専用のシンタックス要素の挿入場所を設定する解析手段と、前記入力画像のシンタックスにおける前記挿入場所にSVC規格専用のシンタックス要素を挿入し、SVC規格に準拠したシンタックスを生成する挿入手段と、前記SVC規格に準拠したシンタックスと、前記低解像度信号をH.264/SVC規格に準拠して符号化した符号化ストリームと、を多重化して出力する符号化手段と、を備えた画像変換装置である。
本発明によれば、エンハンスメントレイヤの符号化時に行うレイヤ間予測の負荷を低減することができる、画像変換装置を提供することができる、という効果を奏する。
図1は、実施の形態1の画像変換装置の機能的構成を示すブロック図である。 図2は、モードチェック部で行う制御情報生成処理の手順を示すフローチャートである。 図3は、レイヤ間動き予測設定部で行うレイヤ間動き予測設定処理の手順を示すフローチャートである。 図4は、分割モードを示す模式図である。 図5は、レイヤ間イントラ予測設定部で行うイントラ予測設定処理の手順を示すフローチャートである。 図6は、残差予測設定部で行う残差予測設定処理の手順を示すフローチャートである。 図7は、実施の形態2の画像変換装置の機能的構成を示すブロック図である。 図8は、AVC入力ストリームと、SVC出力ストリームと、の一例を示す模式図である。
以下に添付図面を参照して、本発明にかかる画像変換装置の一の実施形態を詳細に説明する。
(実施の形態1)
図1は、本実施の形態の画像変換装置10の機能的構成を示すブロック図である。本実施の形態の画像変換装置10は、図1に示すように、AVC復号化部12(復号手段)、SVC符号化部14(符号化手段)、ダウンサンプリング部16(ダウンサンプリング手段)、及びモードチェック部18(生成手段)を備える。
AVC復号化部12は、AVC規格に準拠した符号化方式で符号化されたストリーム(以下、AVC入力ストリームと称する場合がある)S1を受信し、該AVC入力ストリームS1をAVC規格に準拠した方式で復号化する。AVC規格とは、H.264/AVC映像圧縮符号化規格(Adovanced video coding for generic audiovisual services)を示す。
AVC復号化部12は、逆エントロピー符号化部20、逆量子化部22、逆変換部24、動き補償部26、加算部28、フィルタ部30、及びバッファ部32を備える。
逆エントロピー符号化部20は、AVC復号化部12に入力したAVC入力ストリームS1の各シンタクスの符号列を復号化する。これによって、逆エントロピー符号化部20は、AVC入力ストリームS1から、変換係数、フィルタ情報、符号化ブロック分割情報、該AVC入力ストリームS1に含まれるマクロブロック(MB)の動きベクトルの差分を示す情報、及び該マクロブロック(MB)のビット数等を復号化する。
逆量子化部22は、逆エントロピー符号化部20によって復号された変換係数を受け取る。そして、逆量子化部22は、予め設定されている量子化パラメータに従って、該変換係数を逆量子化する。逆変換部24は、逆量子化された変換係数を逆変換(例えば、逆離散コサイン変換)し、誤差画像を生成する。そして、逆変換部24は、該誤差画像を加算部28へ出力する。
一方、バッファ部32は、後述するフィルタ部30によってフィルタ処理の施されたフレームを格納する。動き補償部26は、逆変換部24から出力されてくる誤差画像と、バッファ部32に格納されているフレームとに基づいて、公知の動き補償処理を行って予測画像を生成し、加算部28出力する。
加算部28は、逆変換部24から出力された誤差画像と、動き補償部26から出力された予測画像と、を加算し、復号画像を生成する。フィルタ部30は、加算部28から受け付けた復号画像に公知のフィルタ処理を施し、AVC復号化された画像S2を生成する。そして、フィルタ部30は、AVC復号化された画像S2を、SVC符号化部14、ダウンサンプリング部16、及びモードチェック部18へ出力する。
ダウンサンプリング部16は、AVC復号化部12から出力されたAVC復号化された画像S2をダウンサンプリングする。ダウンサンプリングとは、高解像度画像を低解像度画像へ変換することを意味する。
なお、本実施の形態では、ダウンサンプリング部16は、AVC復号化された画像S2の解像度を、該解像度の1/4の解像度に低解像度化する場合を説明する。なお、この解像度比は、1/4に限られない。そして、ダウンサンプリング部16は、AVC復号化された画像S2の解像度を、予め定めた解像度比に低解像度化したベースレイヤの入力画像S3を生成し、SVC符号化部14へ出力する。
SVC符号化部14は、SVC規格に準拠した符号化方式で符号化を行う。SVC規格とは、H.264/SVC圧縮符号化規格(SVC:Scalable Video Cosing)を示す。SVC符号化部14は、AVC復号化部12から受け付けたAVC復号化された画像(フレーム)S2を、エンハンスメントレイヤの符号化対象となる解像度を有する映像フレームとして受け付ける。また、SVC符号化部14は、ダウンサンプリング部16によって低解像度化されたフレームであるベースレイヤの入力画像(フレーム)S3を、ベースレイヤの符号化対象となる解像度を有する画像(フレーム)として受け付ける。
SVC符号化部14は、SVCベースレイヤ符号化部36、SVCエンハンスメントレイヤ符号化部34、及び多重化部38を備える。
SVCベースレイヤ符号化部36は、SVC規格に準拠した符号化方式を用いてベースレイヤの入力画像S3を符号化し、ベースレイヤの符号ビットストリームS5を生成する。そして、SVCベースレイヤ符号化部36は、生成したベースレイヤの符号ビットストリームS5を、多重化部38へ出力する。
また、SVCベースレイヤ符号化部36は、ベースレイヤ情報S4を、SVCエンハンスメントレイヤ符号化部34へ出力する。ベースレイヤ情報S4は、ベースレイヤにおける符号化時に行われた、動き推定、動き補償予測、画面内予測、デブロック処理等によって得られた、各種情報を含む。具体的には、ベースレイヤ情報S4は、ベースレイヤにおける予測処理によって得られた、復号画像(イントラブロックのみ)、動き補償予測により得られる予測誤差信号(以下、予測情報と称する場合がある)、動きベクトル、及びマクロブロックの分割モード(符号化モード、動き補償の単位、またはブロックサイズと称する場合がある)等の情報を含む。
なお、SVCベースレイヤ符号化部36によるベースレイヤの入力画像S3の符号化は、H.264/SVC規格に準拠した符号化方式を用いたものであるため、詳細な説明を省略する。
SVCエンハンスメントレイヤ符号化部34は、AVC復号化部12から受け付けたAVC復号化された画像S2を、エンハンスメントレイヤの符号化対象となる解像度を有する入力映像として受け付ける。
SVCエンハンスメントレイヤ符号化部34は、レイヤ間予測部40を備えている。レイヤ間予測部40は、SVCベースレイヤ符号化部36から受け付けたベースレイヤ情報S4を、エンハンスメントレイヤとベースレイヤとの解像度の比に応じて、エンハンスメントレイヤの解像度に拡大または伸長する。そして、レイヤ間予測部40は、拡大または伸長後のベースレイヤ情報S4を用いてレイヤ間予測を行う。このレイヤ間予測は、SVC規格で規定されたレイヤ間予測(inter−layer prediction:以下、ILPと称する場合がある)である(詳細後述)。
SVCエンハンスメントレイヤ符号化部34は、レイヤ間予測を行った後に、エンハンスメントレイヤのマクロブロック(MB)毎に周波数変換(DCT:離散コサイン変換)、量子化(Q)、可変長符号化(VLC)を行なう。そして、これらの処理によって得られたエンハンスメントレイヤの符号ビットストリームS6を、多重化部38へ出力する。
多重化部38は、ベースレイヤの符号ビットストリームS5と、エンハンスメントレイヤの符号ビットストリームS6と、を多重化し、SVCストリームS7として出力する。
次に、レイヤ間予測部40について詳細に説明する。レイヤ間予測部40が行うレイヤ間予測には、レイヤ間動き予測、レイヤ間イントラ予測、及び残差予測、の3種類の予測処理が含まれる。
レイヤ間動き予測では、エンハンスメントレイヤにおけるレイヤ間予測部40で符号化対象のマクロブロックに対応する、ベースレイヤのマクロブロック(MB)の動きベクトルと分割モードに基づいて、エンハンスメントレイヤの動き補償予測を行う。なお、このベースレイヤの動きベクトルや分割モードは、SVCベースレイヤ符号化部36から受け付けたベースレイヤ情報S4を読み取ることによって得られる。
レイヤ間イントラ予測では、エンハンスメントレイヤにおけるレイヤ間予測部40で符号化対象のマクロブロックに対応する、ベースレイヤのマクロブロック(MB)がイントラモードMB(intra mode macro block)であるか否かを判別する。そして、レイヤ間イントラ予測では、該ベースレイヤのマクロブロックがイントラモードMBである場合には、このマクロブロック(MB)の解像度をエンハンスメントレイヤの解像度に伸長し、エンハンスメントレイヤのイントラ予測を行う。なお、このエンハンスメントレイヤにおけるレイヤ間予測部40で符号化対象のマクロブロックに対応する、ベースレイヤのマクロブロック(MB)がイントラモードMBであるか否かは、SVCベースレイヤ符号化部36から受け付けたベースレイヤ情報S4から得られる。
また、残差予測では、まず、エンハンスメントレイヤにおけるレイヤ間予測部40で符号化対象のマクロブロックに対応する、ベースレイヤのマクロブロック(MB)の動き補償予測により得られた予測誤差信号を、SVCベースレイヤ符号化部36から受け付けたベースレイヤ情報S4から得る。そして、残差予測では、この予測誤差信号を、エンハンスメントレイヤとベースレイヤとの解像度の比に応じて、エンハンスメントレイヤの解像度に伸長した情報である残差情報を用いて、エンハンスメントレイヤとベースレイヤとの階層間の予測処理を行う。
ここで、レイヤ間予測部40が、上記レイヤ間動き予測、レイヤ間イントラ予測、及び残差予測の3種類の予測処理のすべてを実行すると、レイヤ間の冗長性を効果的に抑制することができる。しかし、これらの3種類の予測処理の全てを実行すると、レイヤ間予測部40における処理時間が膨大となる。具体的には、従来では、3種類の予測処理の全てを実行した後に、ベースレイヤ情報S4に含まれる、最も小さいレート歪みコスト(rate distortion cost:RD cost)の得られるマクロブロックのベースレイヤ情報を、最適なベースレイヤ情報として選定していた。このため、従来では、演算量が多くなり、エンハンスメントレイヤの符号化時に行うレイヤ間予測の負荷が大きかった。
そこで、本実施の形態の画像変換装置10では、モードチェック部18を備えている。モードチェック部18は、詳細を後述する制御情報生成処理を実行し、上述した3種類の予測処理である、レイヤ間動き予測、レイヤ間イントラ予測、及び残差予測の各々について、処理を有効とするか無効とするかを示す制御情報S9を生成する。
モードチェック部18は、逆エントロピー符号化部20から、AVC入力ストリームS1に含まれるマクロブロック(MB)の動きベクトルの差分を示す情報、及び該マクロブロック(MB)のビット数を含む情報S8(以下、逆エントロピー符号化部S20で解析された情報S8と称する)を受け付ける。なお、逆エントロピー符号化部20では、AVC入力ストリームS1の各シンタクスの符号列を復号化することによって得られた、AVC入力ストリームS1に含まれるマクロブロック(MB)の動きベクトルの差分を示す情報、及び各マクロブロック(MB)のビット数等を含む、逆エントロピー符号化部S20で解析された情報S8を、モードチェック部18へ出力する。
また、モードチェック部18は、SVCベースレイヤ符号化部36から、ベースレイヤ情報S4を受け付ける。また、モードチェック部18は、AVC復号化された画像S2をフィルタ部30から受け付ける。
そして、モードチェック部18は、逆エントロピー符号化部S20で解析された情報S8、AVC復号化された画像S2、及びベースレイヤ情報S4に基づいて、詳細を後述する制御信号S9を生成し、レイヤ間予測部40へ出力する。
この制御信号S9は、上述した3種類の予測処理である、レイヤ間動き予測、レイヤ間イントラ予測、及び残差予測の各々を有効とするか無効とするかを示す情報である。
そして、制御信号S9を受け付けたレイヤ間予測部40では、レイヤ間動き予測、レイヤ間イントラ予測、及び残差予測の内、制御信号S9によって有効とされた予測処理を実行する。そして、レイヤ間予測部40では、制御信号S9によって無効とされた予測処理については実行しない。
このように、本実施の形態の画像変換装置10のレイヤ間予測部40では、レイヤ間予測における、レイヤ間動き予測、レイヤ間イントラ予測、及び残差予測の内、モードチェック部18で有効と設定された予測処理を実行する。このため、レイヤ間予測部40では、レイヤ間予測において行う予測処理を軽減することができ、エンハンスメントレイヤの符号化時に行うレイヤ間予測の負荷を低減することができる。
このモードチェック部18について、詳細を説明する。
図1に示すように、モードチェック部18は、レイヤ間動き予測設定部42(レイヤ間動き予測設定手段)、レイヤ間イントラ予測設定部44(レイヤ間イントラ予測設定手段)、及び残差予測設定部46(残差予測設定手段)を備えている。
逆エントロピー符号化部S20で解析された情報S8と、AVC復号化された画像S2、及びベースレイヤ情報S4に基づいて、レイヤ間動き予測設定部42は、レイヤ間動き予測を有効とするか否かを設定する。レイヤ間イントラ予測設定部44は、レイヤ間イントラ予測を有効とするか否かを設定する。残差予測設定部46は、残差予測を有効とするか否かを設定する。
以下、モードチェック部18が実行する制御情報生成処理について詳細を説明する。図2は、モードチェック部18で行う制御情報生成処理の手順を示すフローチャートである。
レイヤ間動き予測設定部42は、逆エントロピー符号化部S20で解析された情報S8と、AVC復号化された画像S2、及びベースレイヤ情報S4に基づいて、レイヤ間動き予測を有効とするか否かを設定する、レイヤ間動き予測設定処理を実行する(ステップS100)(詳細後述)。
次に、レイヤ間イントラ予測設定部44は、逆エントロピー符号化部S20で解析された情報S8と、AVC復号化された画像S2、及びベースレイヤ情報S4に基づいて、レイヤ間イントラ予測を有効とするか否かを設定する、レイヤ間イントラ予測設定処理を実行する(ステップS102)(詳細後述)。
次に、残差予測設定部46は、逆エントロピー符号化部S20で解析された情報S8と、AVC復号化された画像S2、及びベースレイヤ情報S4に基づいて、残差予測を有効とするか否かを設定する、残差予測設定処理を実行する(ステップS104)(詳細後述)。
そして、モードチェック部18は、上記ステップS100〜ステップS104の処理によって設定された、レイヤ間動き予測、レイヤ間イントラ予測、及び残差予測の各々を有効とするか否かを示す情報である制御信号S9を生成し、レイヤ間予測部40を出力する(ステップS106)。
なお、上記ステップS100〜ステップS104の処理は、図2に示す処理順に限られない。
次に、レイヤ間動き予測設定部42が実行するレイヤ間動き予測設定処理(ステップS100)について詳細に説明する。図3は、レイヤ間動き予測設定部42で行うレイヤ間動き予測設定処理の手順を示すフローチャートである。
レイヤ間動き予測設定部42は、レイヤ間予測部40で符号化対象のマクロブロック(MB)に対応する、逆エントロピー符号化部S20で解析された情報S8中の4つのマクロブロック(以下、入力MBと称する)と、ベースレイヤのマクロブロック(以下、BLのMBと称する場合がある)と、の内の少なくとも1個のマクロブロックが、イントラマクロブロック(MB)であるか否かを判断する(ステップS200)。“イントラマクロブロックである”とは、フレーム間予測を行わずに復号画像の得られるマクロブロックであることを意味する。レイヤ間動き予測設定部42は、ベースレイヤ情報S4を読み取ることによって、ステップS200の判断を行う。
なお、本実施の形態では、上述したように、エンハンストメントレイヤとベースレイヤとの解像度の比は、4:1である。すなわち、ダウンサンプリング部16は、AVC復号化された画像S2の解像度を、該解像度の1/4の解像度に低解像度化する。このため、モードチェック部18は、ステップS200において、レイヤ間予測部40で符号化対象のマクロブロック(MB)に対応する、AVC入力ストリームから、逆エントロピー符号化部S20で解析された情報S8の4つのマクロブロック(以下、入力MBと称する場合がある)を読み取る。一方、モードチェック部18は、ベースレイヤについては、レイヤ間予測部40で符号化対象のマクロブロック(MB)に対応する1つのマクロブロック(以下、BLのMBと称する場合がある)のベースレイヤ情報S4を読み取る。
レイヤ間動き予測設定部42では、入力MB、及びBLのMBの少なくとも1個のマクロブロックがイントラマクロブロックである場合には、肯定判断し(ステップS200:Yes)、レイヤ間動き予測を無効に設定する(ステップS201)。
一方、レイヤ間動き予測設定部42は、入力MB、及びBLのMBの双方が全てインターマクロブロックである場合には、否定判断する(ステップS200:No)。そして、レイヤ間動き予測設定部42は、レイヤ間予測部40で符号化対象のマクロブロックに対応する、BLのMBの分割モードを、SVCエンハンスメントレイヤ符号化部34で用いるエンハンスメントレイヤの解像度に伸長する(ステップS202)。
この分割モードとは、動き予測を行うときのブロックサイズを示す。この動き予測を行うときのブロックサイズは、16×16画素から4×4画素までの7種類のブロックサイズがあり、マクロブロック単位とサブマクロブロック単位に階層化されている。
また、BLのMBの分割モードを、SVCエンハンスメントレイヤ符号化部34で用いるエンハンスメントレイヤの解像度に伸長する、とは、レイヤ間予測部40で符号化対象のマクロブロックに対応するBLのMBの分割モードの解像度を、レイヤ間予測部40で処理するエンハンスメントレイヤの解像度に高解像度化することを示している。ここで、上述したように、ダウンサンプリング部16は、AVC復号化された画像S2の解像度を、該解像度の1/4の解像度に低解像度化する。このため、本実施の形態では、レイヤ間動き予測設定部42は、ステップS202の処理において、レイヤ間予測部40で符号化対象のマクロブロックに対応するBLの1つのMBの分割モードを高解像度化処理する。これによって、レイヤ間予測部40は、該BLのMBに対応する、エンハンスメントレイヤの4つのMB用の分割モードを生成する。これによって、モードチェック部18は、BLのMBの分割モードを伸長する。
図4には、分割モードを模式的に示した。図4は、分割モードを示す模式図である。
例えば、レイヤ間予測部40で符号化対象のマクロブロックに対応するBLのMBの分割モードが、図4(A)に示す分割モードであるとする。この場合、レイヤ間動き予測設定部42は、8×8画素を16×16画素に、8×4画素を16×8画素に、4×8画素を8×16画素に、4×4画素をP8×8画素に、各々ブロックサイズを拡大し、BLのMBの分割モードを伸長する(図4(E)参照)。なお、P8×8画素とは、8×8画素、8×4画素、4×8画素、及び4×4画素のいずれかを示す。また、伸長後の最大画素数は16画素とする。
同様に、レイヤ間予測部40で符号化対象のマクロブロックに対応するBLのMBの分割モードが、図4(B)に示す分割モードであるとする。この場合、レイヤ間動き予測設定部42は、16×8画素を16×16画素にブロックサイズを拡大し、16×16画素の4つの分割モードに伸長する(図4(F)参照)。
また、レイヤ間予測部40で符号化対象のマクロブロックに対応するBLのMBの分割モードが、図4(C)に示す分割モードであるとする。この場合、レイヤ間動き予測設定部42は、8×16画素を16×16画素にブロックサイズを拡大し、16×16画素の4つの分割モードに伸長する(図4(G)参照)。
また、レイヤ間予測部40で符号化対象のマクロブロックに対応するBLのMBの分割モードが、図4(D)に示す16×16画素の分割モードであるとする。この場合、レイヤ間動き予測設定部42は、16×16画素の4つの分割モードに伸長する図4(H)参照)。
図3に戻って説明を続ける。次に、レイヤ間動き予測設定部42は、上記ステップS202で伸長した後のBLのMBの分割モード(以下、伸長された分割モードと称する)と、レイヤ間予測部40で符号化対象のマクロブロックに対応するAVC入力ストリームS1の4つのMBの分割モードと、が一致するか否かを判別する(ステップS204)。
すなわち、レイヤ間動き予測設定部42は、伸長された分割モードであるBLの四つのMBの分割モードと、その四つのMBに対応するAVC入力ストリームS1のMBの分割モードとを比較して、分割モードが一致するかどうかを判断する。
例えば、ステップS202で伸長された分割モードが図4(E)に示す分割モードであったとする。そして、符号化対象のBLのMBに対応するAVC入力ストリームS1の4つのMBの分割モードが、図4(I)に示す分割モードであったとする。この場合、モードチェック部18は、これらの分割モードが一致すると判別する(ステップS204:Yes)。
同様に、例えば、ステップS202で伸長された分割モードが図4(F)に示す分割モードであったとする。そして、符号化対象のBLのMBに対応するAVC入力ストリームS1の4つのMBの分割モードが、図4(J)に示す分割モードであったとする。この場合、レイヤ間動き予測設定部42は、これらの分割モードが一致すると判別する(ステップS204:Yes)。また、同様に、ステップS202で伸長された分割モードが図4(G)に示す分割モードであったとする。そして、符号化対象のBLのMBに対応するAVC入力ストリームS1の4つのMBの分割モードが、図4(K)に示す分割モードであったとする。この場合、レイヤ間動き予測設定部42は、これらの分割モードが一致すると判別する(ステップS204:Yes)。また、例えば、ステップS202で伸長された分割モードが図4(H)に示す分割モードであったとする。そして、符号化対象のBLのMBに対応するAVC入力ストリームS1の4つのMBの分割モードが、図4(L)に示す分割モードであったとする。この場合、レイヤ間動き予測設定部42は、これらの分割モードが一致すると判別する(ステップS204:Yes)。
そして、上記以外の場合には、レイヤ間動き予測設定部42は、分割モードが不一致であると判断する(ステップS204:No)。
図3に戻り、説明を続ける。
レイヤ間動き予測設定部42は、ステップ204で肯定判断すると(ステップS204:Yes)、ステップS206へ進む。そして、レイヤ間動き予測設定部42は、レイヤ間予測部40で符号化対象のマクロブロックに対応するAVC入力ストリームS1のMB(入力MB)の、予測動きベクトルと、該入力MBの動きベクトルと、の差分(MVD:motion vector difference)を、差分1として算出する(ステップS206)。この差分の算出は、公知の方法を用いて行う。
レイヤ間動き予測設定部42は、この差分1の算出によって、上記ステップS204で分割モードが一致と判断した場合において、レイヤ間動き予測を行わなかった場合の、入力MBの動きベクトルの推測値を算出する。
次に、レイヤ間動き予測設定部42は、差分1に基づいて、レイヤ間予測部40で符号化対象のマクロブロックに対応する、入力MBの動きベクトルを算出する(ステップS208)。この動きベクトルの算出は、公知の方法を用いて行う。
次に、レイヤ間動き予測設定部42は、符号化対象のMBに対応する、ベースレイヤのMBの動き予測子(Motion Vector Predictor:以下、MVPと称する場合がある)を算出し、算出したMVPを、上記解像度の比に応じて2倍(解像度の比の平方根(ルート))に伸長した伸長MVPを算出する(ステップS210)。この動き予測子を2倍に伸長する、とは、動き予測子によって示されるベクトル情報を、X座標方向及びY座標方向の各々の方向に2倍にしたベクトル情報によって示される長さに伸長することを意味する。
次に、レイヤ間動き予測設定部42は、ステップS210で算出した伸長MVPと、入力MBと称する場合がある)の動きベクトルと、の差分を差分2として算出する(ステップS212)。
レイヤ間動き予測設定部42は、この差分2の算出によって、上記ステップS204で分割モードが一致と判断した場合において、レイヤ間動き予測を行なった場合の入力MBの動きベクトルの推測値を算出する。
次に、レイヤ間動き予測設定部42は、ステップS212で算出した差分2が、ステップS206で算出した差分1より大きいか否かを判断する(ステップS214)。すなわち、レイヤ間動き予測設定部42は、ステップS214の判断によって、レイヤ間動き予測を行なった場合の入力MBの動きベクトルの推測値である差分2が、レイヤ間動き予測を行わなかった場合の入力MBの動きベクトルの推測値である差分1より大きいか否かを判断する。
そして、レイヤ間動き予測設定部42は、差分2が差分1より大きい場合は、肯定判断し(ステップS214:Yes)、動き予測を無効に設定する(ステップS216)。
一方、レイヤ間動き予測設定部42は、差分2が差分1以下である場合には、否定判断し(ステップS214:No)、動き予測を有効に設定する(ステップS218)。
一方、レイヤ間動き予測設定部42は、上記ステップS204の判断において、分割モードが不一致であると判断すると(ステップS204:No)、ステップS220へ進む。
レイヤ間動き予測設定部42は、符号化対象のMBに対応する入力MBのビット数を、ビット数1として抽出する(ステップS220)。ビット数の抽出は、公知の変換処理、量子化処理、及びエントロピー復号化処理によって行う。以下、同様とする。
レイヤ間動き予測設定部42は、このビット数1の算出によって、上記ステップS204で分割モードが不一致と判断した場合において、レイヤ間動き予測を行わなかった場合の、入力MBの動きベクトルの推測値を、ビット数1として算出する。
次に、レイヤ間動き予測設定部42は、符号化対象のMBに対応する、ベースレイヤ(BL)のMBの動き予測ベクトルを、上記解像度の比に応じて2倍(解像度の比の平方根(ルート))に伸長して伸長ベクトルを算出する(ステップS222)。この動き予測ベクトルを2倍に伸長する、とは、動き予測ベクトルを、X方向及びY方向の各々の方向に2倍にしたベクトル情報によって示される長さに伸長することを意味する。
次に、レイヤ間動き予測設定部42は、符号化対象のMBと、該符号化対象MBを伸長ベクトル分移動した位置に対応する参照フレーム上のMBと、の残差を求める(ステップS224)。そして、レイヤ間動き予測設定部42は、ステップS224で求めた残差のビット数をビット数2として求める(ステップS226)。
レイヤ間動き予測設定部42は、このビット数2の算出によって、上記ステップS204で分割モードが不一致と判断した場合にレイヤ間動き予測を行った場合の、入力MBの動きベクトルの推測値を、ビット数2として算出する。
次に、レイヤ間動き予測設定部42は、ステップS226で算出したビット数2が、ステップS220で算出したビット数1より大きいか否かを判断する(ステップS228)。すなわち、レイヤ間動き予測設定部42は、ステップS228の判断によって、レイヤ間動き予測を行なわなかった場合の入力MBの動きベクトルの推測値であるビット数1が、レイヤ間動き予測を行なった場合の入力MBの動きベクトルの推測値であるビット数2より大きいか否かを判断する。
そして、レイヤ間動き予測設定部42は、ビット数2がビット数1より大きい場合は、肯定判断し(ステップS228:Yes)、動き予測を無効に設定する(ステップS230)。
一方、レイヤ間動き予測設定部42は、ビット数2がビット数1以下である場合には、否定判断し(ステップS228:No)、動き予測を有効に設定する(ステップS218)。
以上説明したように、レイヤ間動き予測設定部42では、レイヤ間動き予測を行なった場合の入力MBの動きベクトルの推測値が、レイヤ間動き予測を行わなかった場合の入力MBの動きベクトルの推測値より大きいか否かを判断する。そして、レイヤ間動き予測設定部42は、推測値の小さい処理を有効に設定する。すなわち、モードチェック部18は、レイヤ間動き予測を行なった場合の入力MBの動きベクトルの推測値が、レイヤ間動き予測を行わなかった場合の入力MBの動きベクトルの推測値以上であるときには、レイヤ間動き予測を無効に設定する。このため、レイヤ間動き予測設定部42は、レイヤ間動き予測を行わなかった場合に比べて、レイヤ間動き予測を行った場合の方が圧縮率の高い予測処理を行うことができると推測できる場合に、レイヤ間動き予測を有効に設定することができる。また、レイヤ間動き予測設定部42では、該推測ができない場合には、レイヤ間動き予測を無効に設定することができる。
次に、レイヤ間イントラ予測設定部44が実行する、レイヤ間イントラ予測設定処理(ステップS102)について詳細に説明する。図5は、レイヤ間イントラ予測設定部44で行うイントラ予測設定処理の手順を示すフローチャートである。
レイヤ間イントラ予測設定部44は、BLのMBが、イントラマクロブロックであるか否かを判断する(ステップS300)。モードチェック部18は、ベースレイヤ情報S4を読み取ることによって、ステップS300の判断を行う。
BLのMBがイントラマクロブロックではない場合には(ステップS300:No)、レイヤ間イントラ予測設定部44は、レイヤ間イントラ予測を無効に設定する(ステップS302)。
一方、BLのMBがイントラマクロブロックである場合には(ステップS300:Yes)、ステップS304へ進む。レイヤ間イントラ予測設定部44は、符号化対象のMBに対応する入力MBのビット数を、ビット数1として算出する(ステップS304)。
レイヤ間イントラ予測設定部44は、このビット数1の算出によって、レイヤ間イントラ予測を行わなかった場合の、入力MBに対する予測画像の推測値を、ビット数1として算出する。
次に、レイヤ間イントラ予測設定部44は、符号化MBと、符号化対象のMBに対応するBLのMBと、における8×8画素の分割ブロックの残差を、16×16画素に伸長する(ステップS306)。
次に、レイヤ間イントラ予測設定部44は、ステップS306で伸長した16×16画素の残差のビット数を、ビット数2として算出する(ステップS308)。
レイヤ間イントラ予測設定部44は、このビット数2の算出によって、レイヤ間イントラ予測を行った場合の、入力MBに対する予測画像の推測値を、ビット数2として算出する。
次に、レイヤ間イントラ予測設定部44は、ステップS308で算出したビット数2が、ステップS304で算出したビット数1より大きいか否かを判断する(ステップS310)。すなわち、レイヤ間イントラ予測設定部44は、ステップS310の判断によって、レイヤ間イントラ予測を行なわなかった場合の入力MBの予測画像の推測値であるビット数1が、レイヤ間イントラ予測を行った場合の入力MBの予測画像の推測値であるビット数2より大きいか否かを判断する。
そして、レイヤ間イントラ予測設定部44は、ビット数2がビット数1より大きい場合は、肯定判断し(ステップS310:Yes)、レイヤ間イントラ予測を無効に設定する(ステップS302)。
一方、レイヤ間イントラ予測設定部44は、ビット数2がビット数1以下である場合には、否定判断し(ステップ310:No)、レイヤ間イントラ予測を有効に設定する(ステップS312)。
以上説明したように、レイヤ間イントラ予測設定部44では、レイヤ間イントラ予測を行なった場合の入力MBの予測画像の推測値が、レイヤ間イントラ予測を行わなかった場合の入力MBの予測画像の推測値より大きいか否かを判断する。そして、レイヤ間イントラ予測設定部44は、推測値の小さい処理を有効に設定する。すなわち、レイヤ間イントラ予測設定部44は、レイヤ間イントラ予測を行なった場合の入力MBの予測画像の推測値が、レイヤ間イントラ予測を行わなかった場合の入力MBの予測画像の推測値以上であるときには、レイヤ間イントラ予測を無効に設定する。このため、レイヤ間イントラ予測設定部44は、レイヤ間イントラ予測を行わなかった場合に比べて、レイヤ間イントラ予測を行った場合の方が圧縮率の高い予測処理を行うことができると推測できる場合に、レイヤ間イントラ予測を有効に設定することができる。また、レイヤ間イントラ予測設定部44は、該推測ができない場合には、レイヤ間イントラ予測を無効に設定することができる。
次に、残差予測設定部46が実行する残差予測設定処理(ステップS104)について詳細に説明する。図6は、残差予測設定部46で行う残差予測設定処理の手順を示すフローチャートである。
残差予測設定部46は、SVC符号化部14で符号化対象のマクロブロック(MB)に対応する、逆エントロピー符号化部S20で解析された情報S8中の4つのマクロブロック(入力MB)と、ベースレイヤのマクロブロック(BLのMB)と、の少なくとも一方が、イントラマクロブロックであるか否かを判断する(ステップS400)。残差予測設定部46は、ベースレイヤ情報S4を読み取ることによって、ステップS400の判断を行う。
残差予測設定部46では、入力MB、及びBLのMBの少なくとも一方がイントラマクロブロックである場合には、肯定判断し(ステップS400:Yes)、残差予測を無効に設定する(ステップS428)。
一方、残差予測設定部46は、入力MB、及びBLのMBの双方がイントラマクロブロックである場合には、否定判断する(ステップS400:No)。そして、残差予測設定部46は、符号化対象のBLのMBの分割モードを、SVCエンハンスメントレイヤ符号化部34で用いるエンハンスメントレイヤの解像度に伸長する(ステップS402)。なお、このステップS402の処理は、上述したステップS202の処理と同様であるため、詳細な説明を省略する。
次に、残差予測設定部46は、上記ステップS402で伸長した後のBLのMBの分割モード(以下、伸長された分割モードと称する)と、符号化対象のBLのMBに対応するAVC入力ストリームS1の4つのMBの分割モードと、が一致するか否かを判別する(ステップS404)。このステップS404の処理は、上述したステップS204の処理と同様であるため、詳細な説明を省略する。
そして、残差予測設定部46は、伸長された分割モードである四つのMBの分割モードと、その四つのMBに対応するAVC入力ストリームS1のMBの分割モードと、が一致する場合には(ステップS404:Yes)、ステップS406へ進む。
残差予測設定部46は、符号化対象のMBに対応するAVC入力ストリームS1のMB(入力MB)の動きベクトルと、該入力MBの動きベクトルの予測値と、の差分を、上記ステップS206と同様にして算出する(ステップS406)。
次に、残差予測設定部46は、ステップS406で算出した差分に基づいて、符号化対象のMBに対応する入力MBの動きベクトルを、ステップS208と同様にして算出する(ステップS408)。そして、ステップS410へ進む。
一方、上記ステップS404において、分割モードが不一致である場合には(ステップS404:No)、ステップS412へ進む。そして、残差予測設定部46は、上記ステップS222と同様にして、符号化対象のMBに対応する、ベースレイヤ(BL)のMBの動き予測ベクトルを2倍に伸長した伸長ベクトルを算出する(ステップS412)。
次に、ステップS410において、残差予測設定部46は、符号化対象のMBから、上記ステップS408で求めた動きベクトル、または上記ステップ412で求めた伸長ベクトルによって求められる参照フレーム中のMBである予測画像と、符号化対象のMBと、の残差を、近似値残差1として算出する(ステップS410)。
なお、該近似値残差1の算出時に用いる参照フレームは、AVC入力ストリームS1を復号化することによって得られる画像である、AVC復号化された画像S2を用いればよい。
次に、残差予測設定部46は、ステップS410で算出した近似値残差1のビット数を、ビット数1として算出する(ステップS414)。
次に、残差予測設定部46は、BLの残差フレームを伸長する(ステップS416)。BLの残差フレームを伸長する、とは、ベースレイヤにおける予測誤差信号を、エンハンスメントレイヤとベースレイヤとの解像度の比に応じて伸長した情報である残差情報を生成することを意味する。
次に、残差予測設定部46は、伸長したBLの残差フレームである残差情報と、符号化対象のMBの参照フレームと、の残差を用いて、該参照フレームを修正する(ステップS418)。参照フレームを修正する、とは、参照フレームとBLから伸長した残差フレームとの差分を求め、差分に基づいて修正した参照フレームを求めることを意味する。
次に、残差予測設定部46は、この修正した参考フレーム上の、符号化対象のMBに対応するMBと、符号化対象のMBと、の残差を、近似値残差2として算出する(ステップS420)。
そして、残差予測設定部46は、上記ステップS420で算出した近似値残差2のビット数を、ビット数2として算出する(ステップS422)。
次に、残差予測設定部46は、ステップS422で算出した差分2が、ステップS414で算出した差分1より大きいか否かを判断する(ステップS424)。すなわち、残差予測設定部46は、ステップS424の判断によって、残差予測を行なった場合の入力MBの残差の推測値である近似値残差2が、残差予測を行わなかった場合の入力MBの残差である近似値残差1より大きいか否かを判断する。
そして、残差予測設定部46は、近似値残差2が近似値残差1より大きい場合は、肯定判断し(ステップS424:Yes)、残差予測を無効に設定する(ステップS428)。
一方、残差予測設定部46は、近似値残差2が近似値残差1以下である場合には、否定判断し(ステップS424:No)、近似値予測処理を有効に設定する(ステップS426)。
以上説明したように、残差予測設定部46では、残差予測を行なった場合の入力MBの予測画像に対する残差の推測値が、残差予測を行わなかった場合の入力MBの予測画像に対する残差の推測値より大きいか否かを判断する。そして、モードチェック部18は、推測値の小さい処理を有効に設定する。すなわち、モードチェック部18は、残差予測を行なった場合の入力MBの予測画像に対する残差の推測値が、残差予測を行わなかった場合の入力MBの予測画像に対する残差の推測値以上であるときには、残差予測を無効に設定する。このため、残差予測設定部46は、残差予測を行わなかった場合に比べて、残差予測を行った場合の方が圧縮率の高い予測処理を行うことができると推測できる場合に、残差予測を有効に設定し、それ以外の場合には、残差予測を無効に設定することができる。
図1に戻り、レイヤ間予測部40は、モードチェック部18から制御信号S9を受け付ける。そして、レイヤ間予測部40は、レイヤ間動き予測、レイヤ間イントラ予測、及び残差予測の内、制御信号S9によって有効とされた予測処理を実行する。
このように、本実施の形態の画像変換装置10では、SVCエンハンスメントレイヤ符号化部34のレイヤ間予測部40が行うレイヤ間予測(ILP)における、レイヤ間動き予測、レイヤ間イントラ予測、及び残差予測の内、モードチェック部18で有効と設定された予測処理を実行するので、レイヤ間予測部40の負荷の低減を図ることができる。
従って、本実施の形態の画像変換装置10は、エンハンスメントレイヤの符号化処理の負荷の低減を図ることができる。
(実施の形態2)
実施の形態2の画像変換装置では、実施の形態1の画像変換装置10におけるSVCエンハンスメントレイヤ符号化部34を備えない構成としている。
図7は、本実施の形態の画像変換装置10Aの機能的構成を示すブロック図である。本実施の形態の画像変換装置10Aは、図7に示すように、AVC復号化部13、ダウンサンプリング部16、SVC符号化部15、及び解析部19を備える。ダウンサンプリング部16は、実施の形態1と同様である。
AVC復号化部13は、AVC規格に準拠した符号化方式で符号化されたストリーム(以下、AVC入力ストリームと称する場合がある)S1を受信し、該ストリームS1をAVC規格に準拠して復号化する。
SVC符号化部15は、AVC復号化部13から出力された、AVC規格に準拠して復号化された、AVC復号化された画像S2を、SVC規格に準拠して符号化する。そして、SVC規格に準拠した符号化方式で符号化されたストリーム(以下、SVCストリームと称する場合がある)S7を出力する。
なお、本実施の形態2での画像変換装置10Aは、実施の形態1におけるモードチェック部18に代えて解析部19を備え、SVC符号化部14に代えてSVC符号化部15を備え、更に挿入部21を備えた以外は、実施の形態1の画像変換装置10と同じ構成である。このため、同じ機能を有する部分には同じ符号を付与して詳細な説明を省略する。
AVC復号化部13は、逆エントロピー符号化部20、逆量子化部22、逆変換部24、動き補償部26、加算部28、フィルタ部30、及びバッファ部32を備える。AVC復号化部13は、実施の形態1のAVC復号化部12と異なる点は、フィルタ部30が、AVC復号化された画像S2を、SVC符号化部15に出力しない点である。
ダウンサンプリング部16は、AVC復号化された画像S2の解像度を低解像度化したベースレイヤの入力画像S3を生成し、SVC符号化部15のSVCベースレイヤ符号化部36へ出力する。
SVC符号化部15は、SVCベースレイヤ符号化部36と、多重化部39と、を備える。SVCベースレイヤ符号化部36は、ダウンサンプリング部16によって低解像度化された映像であるベースレイヤの入力画像S3を、ベースレイヤの符号化対象となる解像度を有する入力映像として受け付ける。すなわち、本実施の形態では、SVC符号化部15は、エンハンスメントレイヤの入力画像を受け付けず、ベースレイヤの入力画像をダウンサンプリング部16から受け付ける。
多重化部39は、SVCベースレイヤ符号化部36から出力されたベースレイヤの符号ビットストリームS5と、挿入部21から受け付けた後述するシンタックスS12と、を多重化し、SVCストリームS7として出力する。
ここで、AVC入力ストリームS1の解像度は、SVC規格で用いるエンハンスメントレイヤの内の最も解像度の高いエンハンスメントレイヤの解像度と同じである。本実施の形態の画像変換装置10Aは、この点に着目した構成となっている。
そして、SVC規格は、AVC規格を拡張した規格である。そして、SVC規格に準拠した符号化方式で符号化されたストリームのシンタックスは、AVC規格に準拠した符号化方式で符号化されたストリームのシンタックスに加えて、SVC規格専用のシンタックスを有する。
そこで、解析部19は、AVC入力ストリームS1のシンタックスを解析し、該AVC入力ストリームのシンタックス中の、SVC規格専用のシンタックス要素の挿入場所を設定する。そして、この挿入場所を示す場所情報S11を、挿入部21へ出力する。
挿入部21は、AVC入力ストリームS1のシンタックスの、上記場所情報S11によって示される挿入場所に、SVC規格専用のシンタックス要素を挿入する。これによって、挿入部21は、AVC入力ストリームS1のシンタックスを、SVC出力ストリームS7用のシンタックスに変更する。
そして、変更後のシンタックスS12を、多重化部39へ出力する。
多重化部39では、SVCベースレイヤ符号化部36から出力されたベースレイヤの符号ビットストリームS5と、挿入部21から受け付けた後述するシンタックスS12と、を多重化し、SVCストリームS7として出力する。
図8には、AVC入力ストリームS1と、SVC出力ストリームS7と、の一例を模式的に示した。なお、図8では、ビットストリームの形式が、NAL(Network Abstract Layer:NAL)ユニットである場合の例を示した。
図8(A)に示すように、AVC入力ストリームS1は、スライスヘッダとスライスデータ部分とを含んだ構成である。スライスヘッダにはS1、S2〜Sn(nは3以上の整数)とAVCシンタックス要素が存在している。これらのAVCシンタックス要素としては、first_mb_in_slice、slice_type等の公知の要素が挙げられる。スライスデータ部分が、AVC規格で符号化されたストリームに相当する。
本実施の形態では、解析部19は、シンタックスの解析として、AVC入力ストリームS1のスライスヘッダを解析し、SVC規格専用のシンタックス要素であるSsvcの挿入場所を設定する。詳細には、解析部19は、AVC入力ストリームS1のNALユニット中のスライスヘッダ(シンタックス)を先頭から解析し、Ssvcの挿入場所を設定する。なお、SVC規格では、各シンタックス要素の並べ順が規定されている。このため、解析部19は、該規定によって定められた順番に基づいて、AVC入力ストリームS1のNALユニット中のスライスヘッダ(シンタックス)を先頭から解析することによって、Ssvcの挿入場所を設定することができる(例えば、図8中、シンタックス要素S3とシンタックス要素S4との間)。
そして、解析部19は、この挿入場所を示す場所情報S11を、挿入部21へ出力する。挿入部21は、AVC入力ストリームS1のシンタックスの、上記場所情報S11によって示される挿入場所(例えば、図8中、シンタックス要素S3とシンタックス要素S4との間)に、SVC規格専用のシンタックス要素であるSsvcを挿入する。これによって、挿入部21は、図8(B)に示すように、AVC入力ストリームS1のシンタックスを、SVC出力ストリームS7用のシンタックスに変更する。
以上説明したように、本実施の形態の画像変換装置10Aでは、エンハンスメントレイヤの符号化処理を実行せずに、解析部19と挿入部21とを設けた構成としている。そして、本実施の形態の画像変換装置10Aでは、AVC入力ストリームS1のシンタックス中の、SVC規格専用のシンタックス要素の挿入場所を設定し、この挿入場所に、SVC規格専用のシンタックス要素を挿入する。これによって、挿入部21が、AVC入力ストリームS1のシンタックスを、SVC出力ストリームS7用のシンタックスに変更する。そして、多重化部39では、SVCベースレイヤ符号化部36から出力されたベースレイヤの符号ビットストリームS5と、挿入部21から受け付けた後述するシンタックスS12と、を多重化し、SVCストリームS7として出力する。
すなわち、本実施の形態の画像変換装置10Aでは、エンハンスメントレイヤの符号化処理で行われる上述した各種予測処理を実行せずに、SVC出力ストリームS7を出力することができる。
このため、本実施の形態の画像変換装置10Aでは、エンハンスメントレイヤの符号化処理の負荷の低減を図ることができる。
10、10A 画像変換装置
12、13 AVC復号化部
14、15 SVC符号化部
16 ダウンサンプリング部
18 モードチェック部
19 解析部
21 挿入部
34 SVCエンハンスメントレイヤ符号化部
36 SVCベースレイヤ符号化部
38、39 多重化部
40 レイヤ間予測部
42 レイヤ間動き予測設定部
44 レイヤ間イントラ予測設定部
46 残差予測設定部
特開2010−200357号公報

Claims (6)

  1. H.264/AVC規格に準拠した符号化方式で符号化された入力画像を復号化し、復号画像信号を出力する復号手段と、
    前記復号画像信号に対して、予め定められた解像度比に応じて該復号画像信号より解像度の低い低解像度信号を生成するダウンサンプリング手段と、
    前記復号画像信号及び前記低解像度信号をH.264/SVC規格に準拠した符号化方式で符号化する符号化手段と、
    前記符号化手段が前記復号画像信号に対して行うレイヤ間予測に含まれる、複数の予測処理の各々について、各予測処理を有効とするか無効とするかを示す制御情報を生成する生成手段と、
    を備え、
    前記符号化手段は、前記復号画像信号を第1の解像度のエンハンスメントレイヤの符号化対象信号として受け付けると共に、前記低解像度信号を、前記第1の解像度より解像度の低いベースレイヤの符号化対象信号として受け付け、前記低解像度信号の符号化によって得られるベースレイヤ情報に基づいて、前記エンハンスメントレイヤの符号化対象信号に対して前記制御情報によって有効とされた予測処理を実行する、
    画像変換装置。
  2. 前記レイヤ間予測は、
    前記復号画像信号の符号化対象のマクロブロックに対応する、前記低解像度信号のマクロブロックの動きベクトル及び分割モードに基づいて、動き補償予測を行うレイヤ間動き予測と、
    前記復号画像信号の符号化対象のマクロブロックに対応する、前記低解像度信号のマクロブロックの解像度を、該復号画像信号の解像度に伸長して予測画像を生成するレイヤ間イントラ予測と、
    前記復号画像信号の符号化対象のマクロブロックに対応する、前記低解像度信号のマクロブロックの動き補償予測によって得られた予測誤差信号の解像度を、前記復号画像信号の解像度に伸長した残差情報を用いて、階層間予測を行う残差予測と、
    を含む、請求項1に記載の画像変換装置。
  3. 前記生成手段は、
    前記レイヤ間動き予測を有効とするか無効とするかを設定するレイヤ間動き予測設定手段、を有し、
    前記レイヤ間動き予測設定手段は、
    前記レイヤ間動き予測を行わなかった場合の前記入力画像におけるマクロブロックの動きベクトルの推測値が、前記レイヤ間動き予測を行った場合の前記入力画像におけるマクロブロックの動きベクトルの推測値より小さい場合に、前記レイヤ間動き予測を無効とすることを示す前記制御情報を生成する、請求項2に記載の画像変換装置。
  4. 前記生成手段は、
    前記レイヤ間イントラ予測を有効とするか無効とするかを設定するレイヤ間イントラ予測設定手段、を有し、
    前記レイヤ間イントラ予測設定手段は、
    前記レイヤ間イントラ予測を行わなかった場合の前記入力画像におけるマクロブロックの動きベクトルの推測値が、前記レイヤ間イントラ予測を行った場合の前記入力画像におけるマクロブロックの動きベクトルの推測値より小さい場合に、前記レイヤ間イントラ予測を無効とすることを示す前記制御情報を生成する、請求項2または請求項3に記載の画像変換装置。
  5. 前記生成手段は、
    前記残差予測を有効とするか無効とするかを設定する残差予測設定手段、を有し、
    前記残差予測設定手段は、
    前記残差予測を行わなかった場合の前記入力画像におけるマクロブロックの動きベクトルの推測値が、前記残差予測を行った場合の前記入力画像におけるマクロブロックの動きベクトルの推測値より小さい場合に、前記残差予測を無効とすることを示す前記制御情報を生成する、請求項2〜請求項4の何れか1項に記載の画像変換装置。
  6. H.264/AVC規格に準拠した符号化方式で符号化された入力画像を復号化し、復号画像信号を出力する復号手段と、
    前記復号画像信号に対して、予め定められた解像度比に応じて該復号画像信号より解像度の低い低解像度信号を生成するダウンサンプリング手段と、
    前記入力画像のシンタックスを解析し、該入力画像のシンタックスへのSVC規格専用のシンタックス要素の挿入場所を設定する解析手段と、
    前記入力画像のシンタックスにおける前記挿入場所にSVC規格専用のシンタックス要素を挿入し、SVC規格に準拠したシンタックスを生成する挿入手段と、
    前記SVC規格に準拠したシンタックスと、前記低解像度信号をH.264/SVC規格に準拠して符号化した符号化ストリームと、を多重化して出力する符号化手段と、
    を備えた画像変換装置。
JP2011146364A 2011-06-30 2011-06-30 画像変換装置 Withdrawn JP2013016902A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011146364A JP2013016902A (ja) 2011-06-30 2011-06-30 画像変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011146364A JP2013016902A (ja) 2011-06-30 2011-06-30 画像変換装置

Publications (1)

Publication Number Publication Date
JP2013016902A true JP2013016902A (ja) 2013-01-24

Family

ID=47689165

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011146364A Withdrawn JP2013016902A (ja) 2011-06-30 2011-06-30 画像変換装置

Country Status (1)

Country Link
JP (1) JP2013016902A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016028478A (ja) * 2015-09-04 2016-02-25 株式会社リコー 通信管理システム、通信システム、通信管理方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016028478A (ja) * 2015-09-04 2016-02-25 株式会社リコー 通信管理システム、通信システム、通信管理方法、及びプログラム

Similar Documents

Publication Publication Date Title
US11089324B2 (en) Method and apparatus for encoding and decoding an image with inter layer motion information prediction according to motion information compression scheme
US9224215B2 (en) Apparatus and method for encoding/decoding images for intra-prediction
US7499495B2 (en) Extended range motion vectors
JP2017216698A (ja) ビデオビットストリームをトランスコーディングする方法及び構成
JP2005506815A5 (ja)
JP2005506815A (ja) 空間拡張可能圧縮のための方法及び装置
JP4226172B2 (ja) 適応的変換方法を用いる映像圧縮符号化装置および復号化装置ならびにその方法
KR20110008653A (ko) 움직임 벡터 예측 방법과 이를 이용한 영상 부호화/복호화 장치 및 방법
JP2009530960A (ja) 照明変化補償動き予測符号化および復号化方法とその装置
KR20120028843A (ko) 계층적 영상 부호화/복호화 방법 및 장치
JP2006518568A (ja) ビデオ符号化
US20140269920A1 (en) Motion Estimation Guidance in Transcoding Operation
JP2013016902A (ja) 画像変換装置
JP5401909B2 (ja) トランスコード装置およびトランスコード方法
JP4301495B2 (ja) 動画像圧縮符号化装置
WO2006024988A2 (en) A method and apparatus for motion estimation
US20120093425A1 (en) Entropy encoding/decoding method and apparatus for hierarchical image processing and symbol encoding/decoding apparatus for the same
JP4390009B2 (ja) 符号化装置及び方法、画像処理システム
WO2011077524A1 (ja) 動画像符号化装置及び動画像復号装置
JP2005191898A (ja) 動き補償符号化方法及び動き補償符号化装置
JP2010288096A (ja) 動画像符号化方法、動画像符号化装置及び動画像符号化プログラム
JP2002135785A (ja) 動きベクトル変換方法及び変換装置
JP2008092328A (ja) 動画像符号化の動き情報変換装置及び動き情報変換プログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140902