WO2021100085A1

WO2021100085A1 - 符号化方法、符号化装置及びプログラム

Info

Publication number: WO2021100085A1
Application number: PCT/JP2019/045083
Authority: WO
Inventors: 誠之高村; 木全　英明
Original assignee: 日本電信電話株式会社
Priority date: 2019-11-18
Filing date: 2019-11-18
Publication date: 2021-05-27
Also published as: JP7348549B2; US20220417523A1; JPWO2021100085A1

Abstract

参照画像を用いて符号化対象画像の符号化を行う符号化方法であって、符号化対象画像を分割した領域である符号化対象領域と対応する、参照画像の一部である参照領域を特定する特定ステップと、参照領域を用いて予測することで、符号化対象領域に対する予測領域を得る予測ステップと、を有し、符号化対象領域と参照領域は、異なるサイズ若しくは／及び異なる形状であり、特定ステップでは、符号化対象画像と参照画像を取得する際に、カメラに対して行われた動きに起因する符号化対象領域と参照領域に対応する被写体の写り方の差異を利用して参照領域を特定する符号化方法。

Description

符号化方法、符号化装置及びプログラム

　本発明は、符号化方法、符号化装置及びプログラムに関する。

　絵画、タブレット端末又は地面等の平面状の形状を外観に有する物体（以下「平面状の物体」という。）をカメラが動画撮影する場合がある。動画像のフレームに撮影された物体の画像の形状、大きさ及び位置は、物体の動きとカメラの動きとに応じて、動画像のフレームごとに変化する。撮影された平面状の物体の画像の形状、大きさ及び位置が動画像の各フレームにおいて同じになるように、符号化装置が物体の画像の動きを補償（動き補償）する場合がある。

　動画像符号化の規格の一つであるＭＰＥＧ－４のＡＳＰ（Advanced Simple Profile）には、グローバル動き補償（Global Motion Compensation : GMC）と呼ばれる動き補償の方式が採用されている。符号化装置は、動画像のフレームの隅ごとに２次元動きベクトルを定めることによって動き補償を実行する。

　図１５は、シンタクス要素の一つである「no_of_sprite_warping_points」に関する図である。「no_of_sprite_warping_points」の値が４である場合、符号化装置は、射影変換を用いてグローバル動き補償を実行する。１本の２次元動きベクトルは、２個のパラメータを持つ。したがって、符号化装置は、グローバル動き補償の処理単位ごとに、８（＝２×４）個のパラメータを復号装置に伝送する。図１５に示す参考文献１～３は、以下の通りである。
（参考文献１：ISO/IEC 14496-2:2004 Information technology -- Coding of audio-visual objects -- Part 2: Visual）
（参考文献２：F. Zou, J. Chen, M. Karczewicz, X. Li, H.-C. Chuang, W.-J. Chien “Improved affine Motion Prediction”, JVET-C0062, May 2016）
（参考文献３：M. Narroschke, R. Swoboda, “Extending HEVC by an affine motion model”, Picture coding symposium 2013）

　「no_of_sprite_warping_points」の値が３である場合、符号化装置は、アフィン変換（Affine transformation）を用いて動き補償を実行する。アフィン変換の自由度も、射影変換の自由度より低い。
　「no_of_sprite_warping_points」の値が２である場合、符号化装置は、相似変換を用いて動き補償を実行する。相似変換の自由度は、射影変換の自由度よりも低い。
　そこで、「no_of_sprite_warping_points」の値を２又は３で適応的に切り替える方法が、ＪＶＥＴ(Joint Exploration team on Future Video Coding)の規格案として提案されている。

　「no_of_sprite_warping_points」の値が３である場合のアフィン変換と等価である変換を用いた動き補償が提案されている。Ｈ．２６４／ＡＶＣ（Advanced Video Coding）と、Ｈ．２６５／ＨＥＶＣ（High Efficiency Video Coding）とでは、符号化装置は、フレームの間で平行移動（非回転移動）する物体の画像の変形のみを動き補償する。この動き補償は、「no_of_sprite_warping_points」の値が１である場合の動き補償に相当する。

　３次元空間に存在する平面状の物体（剛体）をカメラが移動しながら撮影した２次元画像（フレーム）における座標の関係式は、式（１）のように表される。

　図１６は、４本の動きベクトルに基づく射影変換の例を示す図である。フレーム４００の４点「（ｘ_１,ｙ_１），…，（ｘ_４,ｙ_４）」が、フレーム４０１の４点「（ｘ’_１,ｙ’_１），…，（ｘ’_４,ｙ’_４）」に対応する場合、符号化装置は、式（１）の線型方程式を解くことで、「ｈ_１１，…，ｈ_３２」を導出することができる。ここで、フレーム４００の４点「（ｘ_１,ｙ_１）…（ｘ_４,ｙ_４）」は、矩形であるフレーム４００の頂点でなくてもよい。

　符号化装置は、「ｈ_１１，…，ｈ_３２」と式（２）～（５）とに基づく射影変換によって、フレーム４００の点（ｘ,ｙ）に対応するフレーム４０１の点（ｘ’,ｙ’）を導出する。式（２）の３×３行列「Ｈ」は、ホモグラフィ行列である。

　フレーム４００における既知の４点の移動先を表す８個のパラメータ（ｘ’_１,ｙ’_１,…,ｘ’_４,ｙ’_４）は、符号化装置が点（ｘ,ｙ）を点（ｘ’,ｙ’）に変換するために必要なパラメータである。このことは、ホモグラフィ行列Ｈの変数「ｈ_１１，…，ｈ_３２」が８個であることと、ＭＰＥＧ－４のＡＳＰのグローバル動き補償が「no_of_sprite_warping_points＝４（パラメータ数＝８）であることとに対応している。

"Versatile Video Coding (Draft 6)"，Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11，15th Meeting Gothenburg, SE, 3-12 July 2019

　このように、移動するカメラから撮影された平面状の物体の画像がカメラ及び物体の相対位置等に応じて変形する場合、符号化装置は、８個のパラメータに基づく射影変換を用いて動き補償する。また、位置が固定されたカメラによって撮影された静止中の任意形状の物体の画像がカメラのカメラパラメータに応じて変形する場合も、符号化装置は、８個のパラメータに基づく射影変換を用いて動き補償する。

　しかしながら、平面状の物体の物理的な変形には制約がある。このため、平面状の物体の物理的な変形の自由度は、射影変換が表現し得る変形の自由度（８個のパラメータ）よりも少ない。

　図１７は、平面状の板（剛体）の例を示す図である。図１８から図２３は、図１７に示された平面状の板の変形の第１例から第６例を示す図である。図１７から図２３では、平面状の板は、市松模様の板（チェッカーボード）として表現されている。位置が固定されたカメラの向きがカメラパラメータに応じて変化した場合、図１７に示された平面状の板の画像は、図１８又は図１９に示された平面状の板の画像のように変形する。移動するカメラの姿勢が変化した場合、図１７に示された平面状の板の画像は、図２０に示された平面状の板の画像のように回転及び縮小する。

　図１７に示された平面状の板が剛体であることから、図２１から図２３に示された平面状の板の画像の異常な変形は、明らかに不自然である。しかしながら、符号化装置は、図２１から図２３に示された平面状の板の画像の変形を、８個のパラメータ（自由度）の射影変換を用いて表現している。このように、従来の符号化装置は、画像の符号化効率を向上させることができない場合がある。言い換えると、略同一の位置から撮像された現実空間における被写体の画像への写り方には制約があるものの、従来の符号化装置は該被写体と撮像装置との関係ではありえないような写り方の変化までも表現できるだけのパラメータを用いているため、符号化効率の向上に改善の余地を残す。

　上記事情に鑑み、本発明は、画像の符号化効率を向上させることが可能である符号化方法、符号化装置及びプログラムを提供することを目的としている。

　本発明の一態様は、参照画像を用いて符号化対象画像の符号化を行う符号化方法であって、前記符号化対象画像を分割した領域である符号化対象領域と対応する、前記参照画像の一部である参照領域を特定する特定ステップと、前記参照領域を用いて予測することで、前記符号化対象領域に対する予測領域を得る予測ステップと、を有し、前記符号化対象領域と前記参照領域は、異なるサイズ若しくは／及び異なる形状であり、前記特定ステップでは、前記符号化対象画像と前記参照画像を取得する際に、カメラに対して行われた動きに起因する前記符号化対象領域と前記参照領域に対応する被写体の写り方の差異を利用して前記参照領域を特定する符号化方法である。

　本発明の一態様は、参照画像を用いて符号化対象画像の符号化を行う符号化装置であって、前記符号化対象画像を分割した領域である符号化対象領域と対応する、前記参照画像の一部である参照領域を特定する特定部と、前記参照領域を用いて予測することで、前記符号化対象領域に対する予測領域を得る予測部と、を備え、前記符号化対象領域と前記参照領域は、異なるサイズ若しくは／及び異なる形状であり、前記特定部は、前記符号化対象画像と前記参照画像を取得する際に、カメラに対して行われた動きに起因する前記符号化対象領域と前記参照領域に対応する被写体の写り方の差異を利用して前記参照領域を特定する符号化装置である。

　本発明の一態様は、上記の符号化装置としてコンピュータを機能させるためのプログラムである。

　本発明により、画像の符号化効率を向上させることが可能である。

本実施形態における符号化装置の構成例を示す図である。本実施形態における動き補償部の構成例を示す図である。本実施形態における符号化装置の動作例を示すフローチャートである。本実施形態における動き補償部の動作例を示すフローチャートである。カメラと撮影対象である被写体との位置関係を示す図である。カメラの画面に映っている画像を表す図である。１パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。１パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。２パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。２パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。３パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。３パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。４パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。４パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。シンタクス要素の一つである「no_of_sprite_warping_points」に関する図である。４本の動きベクトルに基づく射影変換の例を示す図である。平面状の板の例を示す図である。平面状の板の変形の第１例を示す図である。平面状の板の変形の第２例を示す図である。平面状の板の変形の第３例を示す図である。平面状の板の変形の第４例を示す図である。平面状の板の変形の第５例を示す図である。平面状の板の変形の第６例を示す図である。

　以下、本発明の一実施形態を、図面を参照しながら説明する。
（概要）
　現在規格化中であるＶＶＣ(非特許文献１)は、符号化対象ブロックを予測する際に用いる参照領域は同一の形状・サイズである必要がない。これは、ＶＶＣから実装される見込みであるアフィン動き補償予測を利用することができるためである。しかしながらＶＶＣに実装される見込みであるアフィン動き補償予測は、符号化対象ブロックにおける４の頂点に係る動きベクトルを用いて参照領域の特定を行っている。４の頂点に係る動きベクトルを用いるということは、８パラメータ(動きベクトルはｘｙ平面上での動きを規定するので)を用いることになる。つまり、符号化対象ブロックごとに８パラメータを復号装置に伝送している。ＶＶＣでは符号化対象ブロックの形状・サイズと参照領域の形状・サイズの関係がどのようなものであっても、８パラメータを用いて参照領域の特定を行っている。

　しかしながら、上記関係は８パラメータを用いずとも特定することができる場合もあると想定されるため、符号化効率の向上に課題を残していた。それに対して、符号化装置は、物体の画像の変形を、射影変換を用いて表現する。物体の物理的な変形には制約があるので、符号化装置は、８個よりも少ない数のパラメータ（自由度）の射影変換を用いて、動画像のフレームにおける物体の画像の変形を表現する。符号化装置は、８個よりも少ないＮ（Ｎは１～４の整数）個のいずれかのパラメータ（自由度）の射影変換を用いた精度の高い動き補償によって、画像の符号化効率を向上させることができる。

　上記関係を下位概念化し整理することで特定するために必要なパラメータ数を削減することができる。具体的には、形状・サイズの関係を符号化対象画像が撮像されたときから参照画像が撮像されたときまでにカメラに対してなされた変化（操作）がパン・チルト・ロール・ズームのいずれか、もしくはどの組み合わせであるかに基づいて上記関係を特定するために必要となる最小のパラメータ数を決定する。下位概念化した関係は、符号化対象画像と参照画像を取得する際にカメラに対して行われた変化から導き出すことができるため、下位概念化した関係を推定するためにカメラパラメータを利用する。言い換えると、符号化対象画像における所定の被写体の写り方と、参照画像における所定の被写体の写り方の違いによって低くなってしまっている相関を、写り方の違いを特定し補正することで相関を高くするものである。

　符号化装置が１個のパラメータを用いる場合には、パン、チルト、ロール及びズームのいずれか１個により得られる１個のパラメータが用いられる。符号化装置が２個のパラメータを用いる場合には、パン、チルト、ロール及びズームのいずれか２個により得られる２個のパラメータが用いられる。符号化装置が３個のパラメータを用いる場合には、パン、チルト、ロール及びズームのいずれか３個により得られる３個のパラメータが用いられる。符号化装置が４個のパラメータを用いる場合には、パン、チルト、ロール及びズームの全てにより得られる４個のパラメータが用いられる。符号化装置は、符号化対象画像に係るカメラパラメータと、参照画像に係るカメラパラメータとを用いてカメラに対して行われた動きを特定し、特定した動きに応じてパラメータ数を判定する。
　以下、具体的な構成について説明する。

　図１は、符号化装置１の構成例を示す図である。符号化装置１は、動画像を符号化する装置である。符号化装置１に入力される動画像は、設置位置が固定されたカメラによって撮影された動画像である。符号化装置１は、動画像のフレームを分割した得られるブロックごとに、動画像を符号化する。符号化装置１は、符号化データを復号装置に出力する。符号化装置１は、Ｎ個のパラメータを表す信号（以下「Ｎパラメータ信号」という。）と、カメラパラメータを表す信号（以下「カメラパラメータ信号」という。）とを、復号装置等の外部装置（不図示）に出力する。なお、符号化装置１は、Ｎパラメータ信号に、カメラのズーム有無を示す情報を含めてもよい。

　符号化装置１は、カメラパラメータ判定部１０、パラメータ数判定部１１、動きベクトル判定部１２、減算部１３と、変換部１４と、量子化部１５と、エントロピー符号化部１６と、逆量子化部１７と、逆変換部１８と、加算部１９と、歪除去フィルタ２０と、フレームメモリ２１と、フレーム内予測部２２と、動き補償部２３と、切替部２４とを備える。

　符号化装置１における動き補償部２３以外の各機能部は、例えば、「Ｈ．２６５／ＨＥＶＣ」及び「Ｈ．２６４／ＡＶＣ」等の周知の動画像符号化の規格に基づいて動作してもよい。符号化装置１における動き補償部２３の一部は、周知の動画像符号化の規格に基づいて動作してもよい。

　符号化装置１の一部又は全部は、ＣＰＵ（Central Processing Unit）又はＧＰＵ（Graphics Processing Unit）等のプロセッサが、不揮発性の記録媒体（非一時的な記録媒体）であるメモリに記憶されたプログラムを実行することにより、ソフトウェアとして実現される。符号化装置１の一部又は全部は、例えば、ＬＳＩ（Large Scale Integration）又はＦＰＧＡ（Field Programmable Gate Array）等のハードウェアを用いて実現されてもよい。

　カメラパラメータ判定部１０は、符号化対象の動画像を表す信号（以下「動画像信号」という。）に基づいてカメラパラメータを判定する。例えば、カメラパラメータ判定部１０は、カメラの内部行列ＡをカメラパラメータＡとして判定する。カメラの内部行列Ａは、カメラの焦点距離と画素サイズ、画像中心を示す３×３行列で表される。また、カメラがズームの機能を利用して撮影した動画像の場合には、カメラの焦点距離が変化する。したがって、カメラパラメータ判定部１０は、カメラがズームの機能を利用して撮影した動画像の場合には、カメラの内部行列Ａ´をカメラパラメータＡ´として判定する。すなわち、ズームが利用されていない場合にはカメラパラメータＡ´＝Ａである。カメラパラメータ判定部１０は、カメラパラメータの判定結果をカメラパラメータ信号として外部、パラメータ数判定部１１、動きベクトル判定部１２及び動き補償部２３に出力する。

　パラメータ数判定部１１は、動画像信号と、カメラパラメータ信号とに基づいて、動画像信号で示される符号化対象画像を射影変換するために必要となるパラメータ数を判定する。パラメータ数判定部１１は、符号化対象画像に係るカメラパラメータと、参照画像に係るカメラパラメータとを用いてカメラに対して行われた動きを特定し、特定した動きに応じてパラメータ数を判定する。
　動きベクトル判定部１２は、動画像信号と、カメラパラメータ信号と、パラメータ数とに基づいて、動きベクトルを判定する。具体的には、動きベクトル判定部１２は、パラメータ数及びパラメータ数に応じて予め決められた画像内位置に基づいて動きベクトルを出力する。例えば、動きベクトル判定部１２は、パラメータ数が１又は２の場合には、画像の左上隅の動きベクトルを出力し、パラメータ数が３又は４の場合には、画像の左上隅と右下隅の動きベクトルを出力する。なお、これらの画像内位置は、上記に限られない。

　減算部１３は、予測信号を動画像信号から減算する。予測信号は、フレーム内予測部２２又は動き補償部２３によって、所定の処理単位（符号化対象領域）ごとに生成される。所定の処理単位は、Ｈ．２６５／ＨＥＶＣでは、予測単位（prediction unit）である。減算部１３は、減算結果である予測残差信号を、変換部１４に出力する。変換部１４は、予測残差信号に対して離散コサイン変換（Discrete Cosine Transform）を実行する。量子化部１５は、離散コサイン変換の結果を量子化する。エントロピー符号化部１６は、量子化の結果に対してエントロピー符号化を実行する。エントロピー符号化部１６は、エントロピー符号化の結果である符号化データを、復号装置等の外部装置（不図示）に出力する。

　逆量子化部１７は、量子化の結果を逆量子化する。逆変換部１８は、逆量子化の結果に対して逆離散コサイン変換（Inverse Discrete Cosine Transform）を実行する。加算部１９は、逆離散コサイン変換の結果と予測信号とを加算することによって、復号画像を生成する。歪除去フィルタ２０は、復号画像の歪を除去することによって、歪が除去された復号画像信号を生成する。

　フレームメモリ２１は、歪が除去された復号画像信号（参照画像）を記憶する。フレームメモリ２１に記憶された復号画像信号は、復号装置によって生成される復号画像信号と同じである。フレームメモリ２１は、記憶されている時間が所定時間以上となった復号画像信号を、フレームメモリ２１から削除する。なお、フレームメモリ２１は、長時間参照フレームの復号画像信号を、フレームメモリ２１が削除指示を取得するまで記憶してもよい。フレームメモリ２１は、参照されないフレームの復号画像信号を記憶しなくてもよい。

　フレーム内予測部２２は、復号画像信号に対してフレーム内予測処理を実行することによって、フレーム内予測処理の結果に応じた予測信号を生成する。動き補償部２３は、復号画像信号に対して動き補償予測処理を実行することによって、動き補償予測処理の結果に応じた予測信号を生成する。例えば、動き補償部２３は、復号画像信号で表される参照画像の一部である参照領域を特定し、参照領域を用いて予測することで、符号化対象領域に対する予測領域を得る。符号化対象領域と参照領域は、異なるサイズ若しくは／及び異なる形状である。切替部２４は、フレーム内予測処理の結果に応じた予測信号を、減算部１３に出力する。切替部２４は、動き補償予測処理の結果に応じた予測信号を、減算部１３に出力する。

　次に、動き補償部２３の構成例を説明する。
　図２は、動き補償部２３の構成例を示す図である。動き補償部２３は、解析部２３１と、フレーム間予測部２３２と、行列生成部２３３と、射影変換部２３４と、切替部２３５とを備える。

　動き補償のモードには、第１モードと、第２モードとがある。第１モードは、「Ｈ．２６５／ＨＥＶＣ」及び「Ｈ．２６４／ＡＶＣ」等の周知の動画像符号化の規格におけるフレーム間予測処理に基づく動き補償のモードである。第２モードは、1又は複数本の動きベクトル（Ｎパラメータ信号）に基づくホモグラフィ行列を用いて、フレームメモリ２１に記憶された復号画像信号に対して、射影変換を射影変換単位ごとに実行する動き補償のモードである。

　解析部２３１は、所定の期間（時間区間）における動画像の複数のフレーム（以下「フレームグループ」という。）を、動画像信号として取得する。また、解析部２３１は、フレーム毎のカメラパラメータ信号をカメラパラメータ判定部１０から取得する。解析部２３１は、取得されたフレームグループについて、カメラパラメータが不変である期間において撮影されたフレームグループであるか否かを判定する。カメラパラメータが不変である期間において撮影されたフレームグループに対しては、ホモグラフィ行列を用いる射影変換の精度が高いので、第１モードの動き補償よりも第２モードの動き補償が適している。

　カメラパラメータが不変でない期間において撮影されたフレームグループであると判定された場合、解析部２３１は、第１モードを表す動き補償モード信号（以下「第１動き補償モード信号」という。）を生成する。解析部２３１は、第１動き補償モード信号を、フレーム間予測部２３２及び切替部２３５に出力する。

　カメラパラメータが不変である期間において撮影されたフレームグループであると判定された場合、解析部２３１は、第２モードを表す動き補償モード信号（以下「第２動き補償モード信号」という。）を生成する。解析部２３１は、第２動き補償モード信号を、行列生成部２３３及び切替部２３５に出力する。

　フレーム間予測部２３２は、第１動き補償モード信号を解析部２３１から取得した場合、復号画像信号をフレームメモリ２１から取得する。フレーム間予測部２３２は、動画像信号を解析部２３１から取得する。フレーム間予測部２３２は、周知の動画像符号化の規格におけるフレーム間予測処理に基づく動き補償を、復号画像信号に対して実行する。フレーム間予測部２３２は、第１モードの動き補償に基づく予測信号を、切替部２３５に出力する。

　行列生成部２３３は、第２動き補償モード信号を解析部２３１から取得した場合、フレームグループとカメラパラメータ信号とを、解析部２３１から取得する。行列生成部２３３は、第２動き補償モード信号を解析部２３１から取得した場合、復号画像信号をフレームメモリ２１から取得する。行列生成部２３３は、第２動き補償モード信号を解析部２３１から取得した場合、動きベクトルを動きベクトル判定部１２から取得する。

　行列生成部２３３は、Ｎパラメータ信号を、復号装置等の外部装置（不図示）と射影変換部２３４とに、フレームごとに出力する。行列生成部２３３は、Ｎパラメータ信号を、復号装置等の外部装置（不図示）と射影変換部２３４とに、復号画像に定められた射影変換単位ごとに出力する。復号装置等の外部装置は、出力されたカメラパラメータ信号及びＮパラメータ信号を用いて、ホモグラフィ行列を導出することができる。行列生成部２３３は、カメラパラメータ信号と動きベクトルとを用いて、ホモグラフィ行列「Ｈ」を生成する。例えば、行列生成部２３３は、カメラに対して行われた動きに起因する符号化対象領域と参照領域に対応する被写体の写り方の差異を利用して参照領域を特定する。カメラに対して行われた動きとは、上記のパン、チルト、ロール、ズームである。

　射影変換部２３４は、ホモグラフィ行列「Ｈ」を用いる射影変換を、フレームメモリ２１に記憶された復号画像信号に対して実行する。射影変換部２３４は、第２モードの動き補償に基づく予測信号を、切替部２３５に出力する。

　図３は、符号化装置１の動作例を示すフローチャートである。
　カメラパラメータ判定部１０は、入力された動画像を表す信号（以下「動画像信号」という。）に基づいてカメラパラメータを判定する（ステップＳ１０１）。カメラパラメータ判定部１０は、カメラパラメータを外部、パラメータ数判定部１１及び動きベクトル判定部１２に出力する。パラメータ数判定部１１は、動画像信号と、カメラパラメータ信号とに基づいて、射影変換するために必要となるパラメータ数を判定する（ステップＳ１０２）。パラメータ数判定部１１は、パラメータ数の判定結果を動きベクトル判定部１２に出力する。例えば、パラメータ数判定部１１は、射影変換するために必要となるパラメータ数が“１”であると判定した場合には、パラメータ数“１”の情報を含む判定結果を動きベクトル判定部１２に出力する。

　動きベクトル判定部１２は、動画像信号と、カメラパラメータ信号と、パラメータ数とに基づいて、動きベクトルを判定する（ステップＳ１０３）。動きベクトル判定部１２は、動きベクトルの判定結果を動き補償部２３に出力する。減算部１３は、予測残差信号を生成する（ステップＳ１０４）。変換部１４は、予測残差信号に対して離散コサイン変換を実行する。量子化部１５は、離散コサイン変換の結果を量子化する（ステップＳ１０５）。エントロピー符号化部１６は、量子化の結果に対してエントロピー符号化を実行する（ステップＳ１０６）。

　逆量子化部１７は、量子化の結果を逆量子化する。逆変換部１８は、逆量子化の結果に対して逆離散コサイン変換を実行する（ステップＳ１０７）。加算部１９は、逆離散コサイン変換の結果と予測信号とを加算することによって、復号画像を生成する（ステップＳ１０８）。歪除去フィルタ２０は、復号画像の歪を除去することによって、歪が除去された復号画像信号を生成する（ステップＳ１０９）。

　歪除去フィルタ２０は、復号画像信号をフレームメモリ２１に記録する（ステップＳ１１０）。フレーム内予測部２２は、復号画像信号に対してフレーム内予測処理を実行することによって、フレーム内予測処理の結果に応じた予測信号を生成する。動き補償部２３は、復号画像信号に対して動き補償予測処理を実行することによって、動き補償予測処理の結果に応じた予測信号を生成する（ステップＳ１１１）。

　図４は、動き補償部２３の動作例を示すフローチャートである。
　解析部２３１は、フレームグループとカメラパラメータ信号とを取得する（ステップＳ２０１）。解析部２３１は、カメラパラメータ「Ｂ」が不変である期間において撮影されたフレームグループであるか否かを判定する（ステップＳ２０２）。カメラパラメータ「Ｂ」が不変である期間において撮影されたフレームグループである場合（ステップＳ２０２：ＹＥＳ）、解析部２３１は、第２動き補償モード信号を、行列生成部２３３と切替部２３５とに出力する（ステップＳ２０３）。

　行列生成部２３３は、Ｎパラメータ信号を、復号装置等の外部装置（不図示）に対して、フレームごとに出力する（ステップＳ２０４）。また、行列生成部２３３は、Ｎパラメータ信号を、復号装置等の外部装置（不図示）に対して、復号画像に定められた射影変換単位（予測単位）ごとに出力する。

　行列生成部２３３は、カメラパラメータ信号と復号画像信号と動きベクトルを用いて、ホモグラフィ行列「Ｈ」を生成する（ステップＳ２０５）。
　まず以下の説明で利用する式について説明する。カメラがチルト（ｘ軸周りの回転）、パン（ｙ軸周りの回転）、ロール（ｚ軸周りの回転）それぞれを行った場合の回転行列は、以下の式（６）で表される。

　式（６）におけるθ_ｘは、ｘ軸方向の回転角を表す。θ_ｙは、ｙ軸方向の回転角を表す。θ_ｚは、ｚ軸方向の回転角を表す。また、カメラパラメータＡは、以下の式（７）で表される。

　式（６）におけるｏ_ｘは画像横サイズの半分、ｏ_ｙは画像縦サイズの半分を表し、ｆ_ｘ，ｆ_ｙは焦点距離と撮像面の画素の縦横サイズから定まり、通常ｆ_ｘ＝ｆ_ｙ＝ｆを満たしている。空間回転量Ｒは、式（６）を用いて以下の式（８）で表される。

　行列生成部２３３は、以下の式（９）に基づいてホモグラフィ行列「Ｈ」を生成する。

　式（９）におけるＡ´ＲＡ^－１がホモグラフィ行列「Ｈ」に相当する。なお、式（９）におけるＡ´は、符号化対象画像の撮影においてズームが利用されていない場合には、カメラパラメータＡとなる。式（９）において、復号画像信号内の点（ｘ，ｙ）が動画像信号内の点（ｖ_ｘ／ｖ_１，ｖ_ｙ／ｖ_１）に対応する。

　次に、図５～図１４を用いて、行列生成部２３３によるホモグラフィ行列「Ｈ」生成の具体的な処理について説明する。
　図５は、カメラ３１と被写体３２との位置関係を示す図である。図５に示すように、カメラ３１は、被写体３２の正面に固定して設置される。図５に示す例では、カメラ３１に対してはパン、チルト、ロール及びズームのいずれもなされていないものとする。なお、カメラ３１は、動画像の撮影において撮影位置が固定であれば被写体３２を撮影可能な位置から被写体３２を撮影してもよい。図５に示す位置関係でカメラ３１によって動画像の撮影がなされると、被写体３２と、背景３３とが撮影される。

　図６は、カメラ３１の画面３４に映っている画像を表す図である。カメラ３１に対してパン、チルト、ロール及びズームのいずれもなされていない場合には、図６に示すように被写体３２を正面から撮影した動画像が画面３４に映し出される。

　図７及び図８は、１パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。なお、図７及び図８では、カメラに対してパン操作がなされた場合を例に説明する。ただし、１パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理において、カメラに対してチルト操作のみが行われてもよいし、ロール操作のみが行われてもよいし、ズーム操作のみが行われてもよい。
　図７に示すように、カメラ３１は、カメラ３１から見て被写体３２に対して右方向に向きが固定して設置される。図７に示す位置関係でカメラ３１によって動画像の撮影がなされると、図８に示すように被写体３２が撮影される。ここで、行列生成部２３３が、動きベクトル判定部１２から左上の原点（０，０）の動きベクトル（ｘ成分だけでよい）（図８の円３５で示される動きベクトル）を取得している場合、以下の式（１０）に基づいて、ホモグラフィ行列「Ｈ」を生成する。

　式（１０）におけるｖ_ｘ／ｖ_１が原点の動きベクトルのｘ成分であるため、行列生成部２３３は式（１０）を解いてθ（又はｓｉｎθ,ｃｏｓθ）を得て、画面全体のホモグラフィ行列「Ｈ」（ＡＲＡ^－１）を生成する。なお、図８では、左上の原点の動きに注目したが、画面上のどの一点でもよい。このように、行列生成部２３３は、カメラ３１に対してパン、チルト、ロール及びズームのうちいずれか１つの操作がなされた場合、１次元で表現されるパラメータを用いて参照領域を特定する。具体的には、行列生成部２３３は、符号化対象画像の特定の１点における動きベクトルの一次元の成分と、符号化対象画像の取得時のカメラパラメータと、参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列「Ｈ」を生成し、生成したホモグラフィ行列「Ｈ」を用いて参照領域を特定する。

　図９及び図１０は、２パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。なお、図９及び図１０では、カメラに対してパン操作とズーム操作の２つの操作がなされた場合を例に説明する。ただし、２パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理において、２つの操作の組み合わせは上記に限定されず、パン操作、チルト操作、ロール操作及びズーム操作のうちいずれか２つの操作の組み合わせであればどのような組み合わせでもよい。

　図９に示すように、カメラ３１は、カメラ３１から見て被写体３２に対して右方向に向きが固定して設置され、ズーム操作がなされているとする。図９に示す位置関係でカメラ３１によって動画像の撮影がなされると、図１０に示すように被写体３２が撮影される。ここで、行列生成部２３３が、動きベクトル判定部１２から左上の原点（０，０）の動きベクトル（ｘ，ｙ成分）（図１０の円３５で示される動きベクトル）を取得している場合、以下の式（１１）に基づいて、ホモグラフィ行列「Ｈ」を生成する。

　式（１１）における(ｖ_ｘ／ｖ_１,ｖ_ｙ／ｖ_１)が原点の動きベクトルであるため、行列生成部２３３は式（１１）を解いてθ（又はｓｉｎθ,ｃｏｓθ）とｆ´を得て、画面全体のホモグラフィ行列「Ｈ」（Ａ´ＲＡ^－１）を生成する。式（１１）におけるｆ´は、ｆ´＝ｓ・ｆで表される。ここで、ｓは、ｆの変化比率を表す値であり、拡大の場合にはｓ＞１であり、縮小の場合にはｓ＜１である。なお、図１０では、左上の原点の動きに注目したが、画面上のどの一点でもよい。また、２パラメータを用いる場合には、例えば左上の原点（０，０）の動きベクトル（ｘ成分だけでよい）と、右下の点（２ｘ，２ｙ）の動きベクトル（ｘ成分だけでよい）とを用いてもよい。

　このように、行列生成部２３３は、カメラ３１に対してパン、チルト、ロール及びズームのうち２つの操作がなされた場合、１次元の組み合わせ又は２次元で表現されるパラメータを用いて参照領域を特定する。具体的には、行列生成部２３３は、符号化対象画像の特定の１点における動きベクトルの二次元の成分を用いる場合には二次元の成分と、符号化対象画像の取得時のカメラパラメータと、参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列「Ｈ」を生成し、生成したホモグラフィ行列「Ｈ」を用いて特定を行い、符号化対象画像の特定の２点における動きベクトルそれぞれの一次元の成分（例えば、ｘ成分のみ）を用いる場合には複数の一次元の成分と、符号化対象画像の取得時のカメラパラメータと、参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列「Ｈ」を生成し、生成したホモグラフィ行列「Ｈ」を用いて参照領域を特定する。２つ以上のパラメータを用いる場合、１つの画像平面上でできるだけ遠いパラメータを選択するほうが好ましい。

　図１１及び図１２は、３パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。なお、図１１及び図１２では、カメラに対してパン操作、チルト操作及びロール操作の３つの操作がなされた場合を例に説明する。ただし、３パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理において、３つの操作の組み合わせは上記に限定されず、パン操作、チルト操作、ロール操作及びズーム操作のうちいずれか３つの操作の組み合わせであればどのような組み合わせでもよい。

　図１１に示すように、カメラ３１は、カメラ３１から見て被写体３２に対して右方向にパン操作が行われ、チルト操作とロール操作が行われて向きが固定して設置される。図１１に示す位置関係でカメラ３１によって動画像の撮影がなされると、図１２に示すように被写体３２が撮影される。ここで、行列生成部２３３が、動きベクトル判定部１２から左上の原点（０，０）の動きベクトル（図１２の円３５で示される動きベクトル）と右下隅の点（２ｏｘ，２ｏｙ）の動きベクトル（ｘ成分だけでよい）（図１２の円３６で示される動きベクトル）を取得している場合、以下の式（１２）に基づいて、ホモグラフィ行列「Ｈ」を生成する。

　式（１２）における(ｖ_ｘ１／ｖ_１１,ｖ_ｙ１／ｖ_１１)、(ｖ_ｘ２／ｖ_１２,ｖ_ｙ２／ｖ_１２)が画面左上隅と右下隅の動きベクトルであるため、行列生成部２３３は式（１２）を解いてθ_ｘ,θ_ｙ,θ_ｚ(またはそれらの正弦や余弦)とｆ´を得て、画面全体のホモグラフィ行列「Ｈ」（Ａ´ＲＡ^－１）を生成する。このように、行列生成部２３３は、カメラ３１に対してパン、チルト、ロール及びズームのうち３つの操作がなされた場合、１次元で表現されるパラメータと２次元で表現されるパラメータとを用いて参照領域を特定する。具体的には、行列生成部２３３は、符号化対象画像の特定の２点のうちの１点における動きベクトルの二次元の成分（ｘ，ｙ成分）と、特定の２点のうち他の１点における動きベクトルの一次元の成分（例えば、ｘ成分のみ）と、符号化対象画像の取得時のカメラパラメータと、参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列「Ｈ」を生成し、生成したホモグラフィ行列「Ｈ」を用いて参照領域を特定する。

　図１３及び図１４は、４パラメータを用いてホモグラフィ行列「Ｈ」を算出する処理を説明するための図である。なお、図１３及び図１４では、カメラに対してパン操作、チルト操作、ロール操作及びズーム操作の全ての操作がなされた場合を例に説明する。
　図１３に示すように、カメラ３１は、カメラ３１から見て被写体３２に対して右方向にパン操作が行われ、チルト操作とロール操作が行われて向きが固定して設置され、ズーム操作が行われているとする。図１３に示す位置関係でカメラ３１によって動画像の撮影がなされると、図１４に示すように被写体３２が撮影される。ここで、行列生成部２３３が、動きベクトル判定部１２から左上の原点（０，０）の動きベクトル（図１４の円３５で示される動きベクトル）と右下隅の点（２ｏｘ，２ｏｙ）の動きベクトル（図１４の円３６で示される動きベクトル）を取得している場合、以下の式（１３）に基づいて、ホモグラフィ行列「Ｈ」を生成する。

　式（１３）における(ｖ_ｘ１／ｖ_１１,ｖ_ｙ１／ｖ_１１)、(ｖ_ｘ２／ｖ_１２,ｖ_ｙ２／ｖ_１２)が画面左上隅と右下隅の動きベクトルであるため、行列生成部２３３は式（１３）を解いてθ_ｘ,θ_ｙ,θ_ｚ(またはそれらの正弦や余弦)とｆ´を得て、画面全体のホモグラフィ行列「Ｈ」（Ａ´ＲＡ^－１）を生成する。図１４の例では、左上と右下の動きに注目したが、互いに離れている右上と左下でもよい。互いに遠いことが重要である。このように、行列生成部２３３は、カメラ３１に対してパン、チルト、ロール及びズームの全ての操作がなされた場合、２次元で表現されるパラメータを複数用いて参照領域を特定する。具体的には、行列生成部２３３は、符号化対象画像の特定の２点それぞれにおける動きベクトルの二次元の成分と、符号化対象画像の取得時のカメラパラメータと、参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列「Ｈ」を生成し、生成したホモグラフィ行列「Ｈ」を用いて参照領域を特定する。

　射影変換部２３４は、フレームメモリ２１に記憶された復号画像信号に対して、ホモグラフィ行列「Ｈ」を用いる射影変換によって第２モードの動き補償を実行する（ステップＳ２０６）。射影変換部２３４は、第２モードの動き補償に基づく予測信号を、切替部２３５に出力する。切替部２３５は、第２モードの動き補償に基づく予測信号を、減算部１３に出力する（ステップＳ２０７）。

　射影変換部２３４は、取得されたフレームグループにおける全てのフレームに対して第２モードの動き補償が実行されたか否かを判定する（ステップＳ２０８）。いずれかのフレームに対して第２モードの動き補償が実行されていないと判定された場合（ステップＳ２０８：ＮＯ）、射影変換部２３４は、ステップＳ２０４に処理を戻す。全てのフレームに対して第２モードの動き補償が実行されたと判定された場合（ステップＳ２０８：ＹＥＳ）、行列生成部２３３及び射影変換部２３４は、取得されたフレームグループに対する動き補償の処理を終了する。

　カメラパラメータ「Ｂ」が不変でない期間において撮影されたフレームグループ（周知のフレーム間予測処理に適したフレームグループ）である場合（ステップＳ２０２：ＮＯ）、解析部２３１は、第１動き補償モード信号を、フレーム間予測部２３２と切替部２３５とに出力する（ステップＳ２０９）。

　フレーム間予測部２３２は、周知の動画像符号化の規格におけるフレーム間予測処理に基づく動き補償を、フレームメモリ２１に記憶された復号画像信号に対して実行する（ステップＳ２１０）。フレーム間予測部２３２は、第１モードの動き補償に基づく予測信号を、切替部２３５に出力する。切替部２３５は、第１モードの動き補償に基づく予測信号を、減算部１３に出力する（ステップＳ２１１）。

　フレーム間予測部２３２は、取得されたフレームグループにおける全てのフレームに対して第１モードの動き補償が実行されたか否かを判定する（ステップＳ２１２）。いずれかのフレームに対して第１モードの動き補償が実行されていないと判定された場合（ステップＳ２１２：ＮＯ）、フレーム間予測部２３２は、ステップＳ２１０に処理を戻す。全てのフレームに対して第１モードの動き補償が実行されたと判定された場合（ステップＳ２１２：ＹＥＳ）、フレーム間予測部２３２は、取得されたフレームグループに対する動き補償の処理を終了する。

　実施形態の符号化装置１は、物体の画像の射影変換に基づく動き補償によって、高画質の復号画像を生成可能である少ない符号量の符号化データを生成する。これによって、実施形態の符号化装置１は、画像の符号化効率を向上させることが可能である。

　以下、実施形態の符号化装置１に関し、以下の付記を開示する。
　（付記１）
　参照画像を用いて符号化対象画像の符号化を行う符号化方法であって、
　前記符号化対象画像を分割した領域である符号化対象領域と対応する、前記参照画像の一部である参照領域を特定する特定ステップと、
　前記参照領域を用いて予測することで、前記符号化対象領域に対する予測領域を得る予測ステップと、を有し、
　前記符号化対象領域と前記参照領域は、異なるサイズ若しくは／及び異なる形状であり、
　前記特定ステップでは、前記符号化対象画像と前記参照画像を取得する際に、カメラに対して行われた動きに起因する前記符号化対象領域と前記参照領域に対応する被写体の写り方の差異を利用して前記参照領域を特定する符号化方法である。
　（付記２）
　上記の符号化方法であって、前記カメラに対して行われた動きは、パン、チルト、ロール及びズームのうち少なくともいずれか１つ又は少なくとも２つ以上の組み合わせである。
　（付記３）
　上記の符号化方法であって、前記特定ステップは、前記符号化対象画像に係るカメラパラメータと、前記参照画像に係るカメラパラメータと、を用いて前記動きを特定する。
　（付記４）
　上記の符号化方法であって、前記特定ステップは、前記動きが、パン、チルト、ロール及びズームのうち少なくともいずれか１つである場合、１次元で表現されるパラメータを用いて前記参照領域を特定する。
　（付記５）
　上記の符号化方法であって、前記特定ステップは、前記符号化対象画像の特定の１点における動きベクトルの一次元の成分と、前記符号化対象画像の取得時のカメラパラメータと、前記参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列を生成し、生成した前記ホモグラフィ行列を用いて特定を行う。
　（付記６）
　上記の符号化方法であって、前記特定ステップは、前記動きが、パン、チルト、ロール及びズームのうち少なくともいずれか２つの組み合わせである場合、１次元の組み合わせ又は２次元で表現されるパラメータを用いて前記参照領域を特定する。
　（付記７）
　上記の符号化方法であって、前記特定ステップは、前記符号化対象画像の特定の１点における動きベクトルの二次元の成分を用いる場合には前記二次元の成分と、前記符号化対象画像の取得時のカメラパラメータと、前記参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列を生成し、生成した前記ホモグラフィ行列を用いて特定を行い、前記符号化対象画像の特定の２点における動きベクトルそれぞれの一次元の成分を用いる場合には複数の一次元の成分と、前記符号化対象画像の取得時のカメラパラメータと、前記参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列を生成し、生成した前記ホモグラフィ行列を用いて特定を行う。
　（付記８）
　上記の符号化方法であって、前記特定ステップは、前記動きが、パン、チルト、ロール及びズームのうち少なくともいずれか３つの組み合わせである場合、１次元で表現されるパラメータと２次元で表現されるパラメータとを用いて前記参照領域を特定する。
　（付記９）
　上記の符号化方法であって、前記特定ステップは、前記符号化対象画像の特定の２点のうちの１点における動きベクトルの二次元の成分と、前記特定の２点のうち他の１点における動きベクトルの一次元の成分と、前記符号化対象画像の取得時のカメラパラメータと、前記参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列を生成し、生成した前記ホモグラフィ行列を用いて特定を行う。
　（付記１０）
　上記の符号化方法であって、前記特定ステップは、前記動きが、パン、チルト、ロール及びズームの全ての組み合わせである場合、２次元で表現されるパラメータを複数用いて前記参照領域を特定する。
　（付記１１）
　上記の符号化方法であって、前記特定ステップは、前記符号化対象画像の特定の２点それぞれにおける動きベクトルの二次元の成分と、前記符号化対象画像の取得時のカメラパラメータと、前記参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列を生成し、生成した前記ホモグラフィ行列を用いて特定を行う。

　以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

　本発明は、静止画像又は動画像の可逆符号化若しくは非可逆符号化を実行する符号化装置に適用可能である。

１…符号化装置、１０…カメラパラメータ判定部、１１…パラメータ数判定部、１２…動きベクトル判定部、１３…減算部、１４…変換部、１５…量子化部、１６…エントロピー符号化部、１７…逆量子化部、１８…逆変換部、１９…加算部、２０…歪除去フィルタ、２１…フレームメモリ、２２…フレーム内予測部、２３…動き補償部、２４…切替部、２３１…解析部、２３２…フレーム間予測部、２３３…行列生成部、２３４…射影変換部、２３５…切替部

Claims

　参照画像を用いて符号化対象画像の符号化を行う符号化方法であって、
　前記符号化対象画像を分割した領域である符号化対象領域と対応する、前記参照画像の一部である参照領域を特定する特定ステップと、
　前記参照領域を用いて予測することで、前記符号化対象領域に対する予測領域を得る予測ステップと、を有し、
　前記符号化対象領域と前記参照領域は、異なるサイズ若しくは／及び異なる形状であり、
　前記特定ステップでは、前記符号化対象画像と前記参照画像を取得する際に、カメラに対して行われた動きに起因する前記符号化対象領域と前記参照領域に対応する被写体の写り方の差異を利用して前記参照領域を特定する符号化方法。
　前記カメラに対して行われた動きは、パン、チルト、ロール及びズームのうち少なくともいずれか１つ又は少なくとも２つ以上の組み合わせである、
請求項１記載の符号化方法。
　前記特定ステップは、前記符号化対象画像に係るカメラパラメータと、前記参照画像に係るカメラパラメータと、を用いて前記動きを特定する、
請求項２記載の符号化方法。
　前記特定ステップは、前記動きが、パン、チルト、ロール及びズームのうち少なくともいずれか１つである場合、１次元で表現されるパラメータを用いて前記参照領域を特定する、
請求項３記載の符号化方法。
　前記特定ステップは、前記符号化対象画像の特定の１点における動きベクトルの一次元の成分と、前記符号化対象画像の取得時のカメラパラメータと、前記参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列を生成し、生成した前記ホモグラフィ行列を用いて特定を行う、
請求項４記載の符号化方法。
　前記特定ステップは、前記動きが、パン、チルト、ロール及びズームのうち少なくともいずれか２つの組み合わせである場合、１次元の組み合わせ又は２次元で表現されるパラメータを用いて前記参照領域を特定する、
請求項３記載の符号化方法。
　前記特定ステップは、前記符号化対象画像の特定の１点における動きベクトルの二次元の成分を用いる場合には前記二次元の成分と、前記符号化対象画像の取得時のカメラパラメータと、前記参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列を生成し、生成した前記ホモグラフィ行列を用いて特定を行い、前記符号化対象画像の特定の２点における動きベクトルそれぞれの一次元の成分を用いる場合には複数の一次元の成分と、前記符号化対象画像の取得時のカメラパラメータと、前記参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列を生成し、生成した前記ホモグラフィ行列を用いて特定を行う、
請求項６記載の符号化方法。
　前記特定ステップは、前記動きが、パン、チルト、ロール及びズームのうち少なくともいずれか３つの組み合わせである場合、１次元で表現されるパラメータと２次元で表現されるパラメータとを用いて前記参照領域を特定する、
請求項３記載の符号化方法。
　前記特定ステップは、前記符号化対象画像の特定の２点のうちの１点における動きベクトルの二次元の成分と、前記特定の２点のうち他の１点における動きベクトルの一次元の成分と、前記符号化対象画像の取得時のカメラパラメータと、前記参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列を生成し、生成した前記ホモグラフィ行列を用いて特定を行う、
請求項８記載の符号化方法。
　前記特定ステップは、前記動きが、パン、チルト、ロール及びズームの全ての組み合わせである場合、２次元で表現されるパラメータを複数用いて前記参照領域を特定する、
請求項３記載の符号化方法。
　前記特定ステップは、前記符号化対象画像の特定の２点それぞれにおける動きベクトルの二次元の成分と、前記符号化対象画像の取得時のカメラパラメータと、前記参照画像の取得時のカメラパラメータとを用いてホモグラフィ行列を生成し、生成した前記ホモグラフィ行列を用いて特定を行う、
請求項１０記載の符号化方法。
　参照画像を用いて符号化対象画像の符号化を行う符号化装置であって、
　前記符号化対象画像を分割した領域である符号化対象領域と対応する、前記参照画像の一部である参照領域を特定する特定部と、
　前記参照領域を用いて予測することで、前記符号化対象領域に対する予測領域を得る予測部と、
　を備え、
　前記符号化対象領域と前記参照領域は、異なるサイズ若しくは／及び異なる形状であり、
　前記特定部は、前記符号化対象画像と前記参照画像を取得する際に、カメラに対して行われた動きに起因する前記符号化対象領域と前記参照領域に対応する被写体の写り方の差異を利用して前記参照領域を特定する符号化装置。
　請求項１２に記載の符号化装置としてコンピュータを機能させるためのプログラム。