WO2007077989A1

WO2007077989A1 - 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体

Info

Publication number: WO2007077989A1
Application number: PCT/JP2007/050005
Authority: WO
Inventors: Masayuki Tanimoto; Toshiaki Fujii; Kenji Yamamoto; Masaki Kitahara; Hideaki Kimata; Shinya Shimizu; Kazuto Kamikura; Yoshiyuki Yashima
Original assignee: Nippon Telegraph And Telephone Corporation; National University Corporation Nagoya University
Priority date: 2006-01-05
Filing date: 2007-01-04
Publication date: 2007-07-12
Also published as: EP1971155A4; CN101361371B; ES2388080T3; RU2384971C1; CA2634050A1; KR20080078697A; CN101361371A; CA2634050C; BRPI0706214A2; JP5234587B2; EP1971155A1; BRPI0706214B1; RU2008125839A; JPWO2007077989A1; KR100977255B1; TWI364992B; US8451894B2; US20100220784A1; EP1971155B1; TW200806040A

Abstract

複数の映像間の視差を用いて予測する視差補償を用いて、該映像を一つの映像として符号化する。参照画像から推定された、符号化対象画像に対する参照視差を設定し、画面内での領域分割を設定し、設定された各領域に関して、前記参照視差と前記視差補償に用いる視差の差である視差変位を設定し、前記領域分割の情報を符号化し、前記視差変位を示す情報を符号化する。復号時には、参照画像から推定された、復号対象画像に対する参照視差を設定し、符号化情報に含まれる領域分割を示す情報を復号し、該情報が示す各領域に関して、前記符号化情報に含まれる視差変位の情報を復号する。

Description

明細書

映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体

技術分野

[0001] 本発明は、多視点動画像の符号ィ匕及び復号に関する技術である。

本願は、 2006年 1月 5日に出願された特願 2006— 000393号に基づき優先権を主張し、その内容をここに援用する。

背景技術

[0002] 多視点動画像は、様々な位置にあるカメラで同じ被写体と背景を撮影した複数の動画像である。以下では、一つのカメラで撮影された動画像を" 2次元動画像"と呼び、同じ被写体と背景を撮影した 2次元動画像の集合を多視点動画像と呼ぶ。多視点動画像に含まれる各カメラの 2次元動画像は、時間方向に強い相関がある。一方、各カメラが同期されていた場合、同じ時間に対応した各カメラのフレームは全く同じ状態の被写体と背景を撮影しているため、カメラ間で強い相関がある。

[0003] まず、 2次元動画像の符号化方式に関する従来技術を述べる。国際符号化標準である H. 264、 MPEG— 4、 MPEG— 2をはじめとした従来の多くの 2次元動画像符号化方式では、動き補償、直交変換、量子化、可変長符号化という技術を利用して、高効率な符号化を行う。

[0004] 例えば、 H. 264では、 Iフレームにおいてはフレーム内相関を利用して符号化が可能で、 Pフレームでは過去の複数枚のフレームとのフレーム間相関を利用して符号ィ匕が可能で、 Bフレームでは過去あるいは未来の複数毎のフレームとのフレーム間相関を利用して符号ィ匕が可能である。

[0005] H. 264の技術の詳細については、下記の非特許文献 1に記載されている力以下で概要を説明する。 Iフレームではフレームをブロック分割し（このブロックをマクロブロックといい、ブロックサイズは 16 X 16 (ピクセル）である）、各マクロブロックにおいてィントラ予測を行う。イントラ予測の際には、各マクロブロックをさらに小さなブロックに分割し (以後、サブブロックと呼ぶ）、各サブブロックで異なるイントラ予測方法を行うことができる。

[0006] 一方、 Pフレームでは、各マクロブロックでイントラ予測、あるいはインター予測を行うことができる。 Pフレームにおけるイントラ予測は、 Iフレームの場合と同様である。一方、インター予測の際には動き補償が行われる。動き補償においても、マクロブロックをより小さなブロックに分割して、各サブブロックで異なる動きベクトル、参照画像を持つことができる。

[0007] なお、 Bフレームにおいても、イントラ予測とインター予測が行える力 Bフレームでのインター予測では、過去のフレームに加えて未来のフレームも動き補償の参照画像にできる。例えば、 Iフレーム→Bフレーム→Bフレーム→Pフレームというフレーム構成で符号化する場合、 I→P→B→Bの順番で符号ィ匕することができる。そして、 Bフレームでは、 I及び Pフレームを参照して動き補償ができる。また、 Pフレームの場合と同様に、マクロブロックを分割したサブブロックごとに異なる動きベクトルを持つことができる。

イントラ、インター予測を行うと予測残差が得られるが、各マクロブロックで予測残差ブロックに DCT (離散コサイン変換)を行って量子化が行われる。そして、このようにして得られる DCT係数の量子化値に対して可変長符号化が行われる。

[0008] 多視点動画像の符号ィ匕については、動き補償を同じ時刻の異なるカメラの画像に適用した"視差補償"によって高効率に多視点動画像を符号ィ匕する方式が従来からある。ここで、視差とは、異なる位置に配置されたカメラの画像平面上で、被写体上の同じ位置が投影される位置の差である。

[0009] このカメラ間で生じる視差の概念図を図 9に示す。この概念図では、光軸が平行なカメラの画像平面を垂直に見下ろしたものとなっている。このように、異なるカメラの画像平面上で被写体上の同じ位置が投影される位置は、一般的に対応点と呼ばれる。視差は画像平面内での位置のズレとして表現できるため、 2次元ベクトルの情報として表現できる。

[0010] 視差補償では、符号化対象カメラの画像上のある着目画素に対応する参照先の力メラの画像上の対応点を参照画像から推定し、当該対応点に対応した画素値で、着目画素の画素値を予測する。以下では、便宜上、前述のような"推定された視差"についても"視差"と呼ぶこととする。

[0011] 視差補償を用いた符号ィ匕手法としては、例えば非特許文献 2があるが、このような方式では、符号化対象の画像の画素に対する視差情報と予測残差を符号化する。具体的には、この手法ではブロック単位で視差補償を行う仕組みが含まれてヽるが、ブロック単位の視差を 2次元ベクトルで表現する。この視差ベクトルの概念図を図 10 に示す。即ち、この手法では 2次元ベクトルである視差情報と予測残差を符号化する。なお、この方法では、カメラパラメータを利用して符号ィ匕を行わないため、カメラパラメータが未知である場合に有効である。

[0012] 各々が異なるカメラ力のものである参照画像が複数ある場合、任意視点画像技術を利用して視差補償を行うことが可能である。非特許文献 3では、任意視点画像生成技術を利用して視差補償をする。具体的には、符号化対象カメラの画像の画素値を、当該画素に対応した異なるカメラの対応点の画素値で補間して予測する。この補間の概念図を図 11に示す。この補間では、符号化対象画像の画素 mの値を、画素 mに対応する参照画像 1、 2の画素、 mグの値を補間することにより予想する。

[0013] なお、非特許文献 3の場合のように、異なるカメラの 2枚以上の参照画像があれば、符号化対象画像を利用せずに、符号化対象画像の各画素に関する各参照画像への視差を推定できる。この視差推定の概念図を図 12に示す。

この図に示されて、るように、真の視差にぉ、ては参照画像の対応点の画素値がほぼ同じ値になるはずである。従い、多くの視差推定法では、様々な奥行きに関する対応点について参照画像の画素値を比較して、画素値が最も近くなる奥行きに基づ V、て視差を推定することができる。この処理は符号化対象画像の画素単位で行うことが可能である。

このように、異なるカメラの 2枚以上の参照画像があり、復号側で視差推定が可能な場合には、符号ィ匕側カゝら明示的に視差情報を符号化して復号側に提供することなく、復号側で画素単位の視差情報を利用して視差補償を行うことができる。

非特許文献 1 : ITU- T Rec.H.264/ISO/IEC 11496-10, "Advanced Video Coding", Fi nal Committee Draft, Document JVT-E022, September 2002

非特許文献 2： Hideaki Kimata and Masaki Kitahara, "Preliminary results on multiple view video coding (3DAV)", document M10976 MPEG Redmond Meeting, July, 2004 非特許文献 3 : Masayuki Tanimoto, Toshiaki Fujii, "Response to Call for Evidence o n Multi-View Video Coding", document Mxxxxx MPEG Hong Kong Meeting, Januar y, 2005

発明の開示

発明が解決しょうとする課題

[0014] 従来の技術によれば、異なるカメラの 2枚以上の参照画像があり、復号側で視差推定が可能な場合には、符号ィ匕側力明示的に視差情報を符号ィ匕することなぐ復号側で画素単位の視差情報を利用して視差補償を行うことができる。このように、符号化及び復号側において、符号ィ匕または復号対象の画像を用いずに (復号の場合は復号せずに)推定できる、符号ィ匕 Z復号対象の画像に関する視差を"参照視差"と呼ぶこととする。

し力しながら、復号側で推定される参照視差は予測効率の意味では最適なものではないため、予測残差の符号量が多くなる場合がある。従い、符号化側で予測効率を最大化する視差を求め、この視差と参照視差の差 (以下では、視差変位と呼ぶ)を各画素について符号化することにより、予測効率を向上させ、結果として予測残差の符号ィ匕効率を向上させる方法が容易に類推できる。

[0015] し力しながら、このように容易に類推可能な技術では、画素単位で視差変位を符号化するため、視差情報としての符号量の増加を招き、結果として全体として高い符号化効率を実現できな、と、う課題がある。

[0016] 本発明は上記課題の解決を図り、視差補償の精度に関する犠牲を小さく抑えながら、視差情報のデータ量を少なくすることができるようにすることを目的とする。

課題を解決するための手段

[0017] 本発明が従来技術ともっとも異なる点は、本発明では上記課題を解決するため、画像のブロック分割を決定する処理と、そこで決定したブロック分割情報及びブロックごとの視差変位情報を符号ィ匕する処理を行い、これらの情報を符号ィ匕情報とする点にある。

[0018] 本発明による映像符号化方法、映像復号方法の第 1の態様によれば、符号化対象の画像の性質に応じて設定した領域分割に基づき、各分割領域について視差変位情報を符号ィ匕することができる。

一般的に、視差変位は画面内において空間的な相関があるため、適切な領域分割を設定し、その各領域に対して視差変位を符号ィ匕することで視差補償の予測効率を劣化させずに視差情報の符号量を抑えることができる。

なお、映像符号化側では、参照視差設定ステップにおいて、すでに符号化済みの情報 (参照画像)から符号化対象画像に関する視差 (参照視差)を設定し、さらに、領域分割設定ステップにおヽて、符号化対象画像の画面内の領域分割を設定する。そして、視差変位設定ステップにおいて、領域分割で設定された各領域に対応した視差変位を設定し、領域分割情報符号化ステップにお、て領域分割を示す情報である領域分割情報を符号化し、視差変位情報符号化ステップにおいて、視差変位情報を符号化する。

[0019] なお、参照視差設定ステップにおいて設定される参照視差としては、例えば図 12 で示した原理に基づ!/、て参照画像から推定された視差 (下記の第 3の態様参照）、任意視点画像生成等を目的として別途手段で符号化され復号側に送られる視差画像や 3次元モデルに基づく視差、もしくはその他の方法で与えられる視差のいずれでも良い。

[0020] 一方、映像復号側では、参照視差設定ステップにおヽて、符号化側と同様にすでに復号済みの情報 (参照画像)から復号対象画像に関する参照視差を設定し、領域分割情報復号ステップにお、て領域分割情報を復号し、視差変位情報復号ステップにお、て、領域分割情報に基づく領域に関する視差変位情報を復号する。

[0021] 本発明による映像符号化方法、映像復号方法の第 2の態様は、基本的には上記第 1の態様と同様であるが、領域分割を矩形ブロック単位で行なうものとする。具体的には、例えば後掲の図 10のような矩形ブロック分割を、マクロブロック単位で指定することが考えられる。このようなブロック分割に関する情報は、例えば H. 264のエントロピ一符号化など、従来のエントロピー符号ィ匕技術により効率的に符号ィ匕できる。

[0022] 本発明による映像符号化方法、映像復号方法の第 3の態様は、基本的には上記第 1及び第 2の態様と同様であるが、図 12で示したような原理で、符号化対象画像を用いることなく複数の参照画像力推定された参照視差を用いる。このように、参照画像から参照視差を推定する場合、復号側にすでに送られた情報のみで参照視差を設定することが可能なため、参照視差を設定するために符号化すべき付加情報を発生させな!/、ようにすることができる。

発明の効果

[0023] 本発明によれば、参照画像カゝら視差を推定する映像符号ィ匕及び復号方法にお!、て、視差変位情報に空間的な相関があることを利用し、視差補償における予測効率の劣化をおさえながらも視差変位情報に関する符号量を小さくすることができ、全体としての符号ィ匕効率を向上させることができる。

図面の簡単な説明

[0024] [図 1]本発明の実施例に係る映像符号ィ匕装置を示す図である。

[図 2]実施例におけるカメラの参照関係を示す図である。

[図 3]実施例におけるカメラ配置を示す図である。

[図 4]本実施例の符号ィ匕フローチャートである。

[図 5]図 4のステップ S106の処理に関する詳細フローチャートである。

[図 6]マクロブロックにおけるブロック分割の例を示す図である。

[図 7]実施例に係る映像復号装置を示す図である。

[図 8]実施例における復号フローチャートである。

[図 9]カメラ間で生じる視差の概念図である。

[図 10]視差ベクトルの概念図である。

[図 11]画素値補間の概念図である。

[図 12]視差推定の概念図である。

符号の説明

[0025] 100 映像符号化装置

101 画像入力部

102 参照画像入力部

103 参照画像メモリ

104 参照視差設定部 105 視差変位設定部

106 ブロック分割設定部

107 ブロック分割情報符号化部

108 視差変位情報符号化部

109 予測残差符号化部

200 映像復号装置

201 ブロック分割情報復号部

202 視差変位情報復号部

203 予測残差復号部

204 視差補償部

205 参照画像メモリ

発明を実施するための最良の形態

[0026] 本発明の実施例に係る映像符号化装置の構成図を図 1に示す。

この映像符号化装置 100は、符号化対象画像であるカメラ Cの原画像を入力する画像入力部 101、参照画像であるカメラ Aと Bの復号画像を入力する参照画像入力部 102、参照画像を格納する参照画像メモリ 103、参照画像から参照視差を求める参照視差設定部 104、視差変位を求める視差変位設定部 105、ブロック分割を設定するブロック分割設定部 106、ブロック分割情報を符号ィ匕するブロック分割情報符号化部 107、視差変位情報を符号ィ匕する視差変位情報符号ィ匕部 108、予測残差を符号ィ匕する予測残差符号ィ匕部 109を備える。

[0027] 図 2は、本実施例におけるカメラの参照関係を示す図である。

本実施例では、図 2で示すように、 3つのカメラに関する多視点映像を符号ィ匕するにあたり、カメラ Aと Bの復号画像を参照画像として、カメラ Cの動画像を符号ィ匕する場合を示す。

図中の矢印は、視差補償の際の参照関係を示しており、カメラ Cの画像を符号化する際には、表示時刻において同時刻であるカメラ Aと Bの復号画像を参照画像として符号化する。その際には、カメラ A及び Bの対応点 (視差変位ベクトルと参照視差べクトルの和で与えられるベクトルが指す画素）に関する画素値の平均値で予測画像を作成するものとする。

[0028] 図 3は、本実施例におけるカメラ配置を示す図である。本実施例では、例えば図 3 に示すように、 3つのカメラの視点位置は直線上に等間隔に並んでおり、光軸はカメラが並ぶ直線に対して垂直となっているとする。すなわち、 3つのカメラの光軸は平行であるとする。

また、画像平面の xy座標系は、カメラが並ぶ直線に対する平行移動（回転等はなし )により得られ、各々のカメラで画像平面の X軸及び y軸を等間隔に分割することで画素が構成されているとする。すなわち、解像度が各カメラで同じであり、なおかつ、力メラ Cとカメラ Aの P画素分の視差は、カメラ Cとカメラ Bで P画素の視差となることになる。

[0029] 本実施例における符号化のフローを図 4に示す。さらに、図 5は、図 4におけるステップ S106の処理を詳細に記載したフロー図である。

[0030] 本実施例では、縦横 16画素で構成されるマクロブロック単位でマクロブロック内のブロック分割を指定し、そのブロック分割で作成されるブロック (便宜上、単に"ブロック"と呼ぶ)単位で視差変位情報を求めて符号ィ匕する。

参照視差は、 2次元ベクトルとして表現されるので、復号側 (及び符号化側）において、参照画像から、画素単位で各参照画像に対する 2次元ベクトル (参照視差)が求められる。

[0031] 一方、視差変位については、各ブロックについて 2次元ベクトルの視差変位を一つ

(カメラ Aに対する視差変位)符号化することとする。これは、参照視差を求める場合と同様に、各参照画像の各画素に関する視差変位ベクトルと参照視差ベクトルの和で与えられるベクトル (視差補償に利用される視差ベクトルである）が、被写体上の同じ位置を指しているという物理的な制約条件を仮定すると、カメラ Aに対する視差変位ベクトルが既知であれば、他のカメラに関する視差変位ベクトルが一意に決まるからである。

なお、このような制約条件を仮定せず、各参照画像に対する視差変位を独立に求めてそれぞれ符号ィ匕することも考えられる力このケースについては本実施例の変更例として容易に適用可能であるので説明を省略する。 [0032] マクロブロックで適用可能なブロック分割としては様々なものが考えられる力例えば、図 6に示すようなものが考えられる。なお、図 6に記載のように、ブロック分割の種類に関するインデックスを blkModeとし、ブロック分割 blkModeにおけるブロック数を m axBlk[blkMode]と表す。

[0033] このような前提の下で、図 4のフローに沿って符号化処理を説明する。

まず、画像入力部 101によりカメラ Cの画像が入力される (ステップ S101)。なお、ここで入力されたカメラ Cの画像と表示時刻が同じであるカメラ Aと Bの復号画像が参照画像メモリ 103に参照画像入力部 102により入力されている。

[0034] 次に、参照画像メモリ 103からカメラ Aと Bの復号画像を入力し (S102)、入力した参照画像から、符号ィ匕対象画像の各画素に対する参照視差を求める（S103)。すなわち、参照視差設定部 104にカメラ Aと Bに関する 2枚の参照画像が読み込まれ、力メラ Cの画像の各画素に関する参照視差が求められる。

これが行われることにより、カメラ Cの画像の各画素に対して 2次元ベクトルが二つ求められる。ここで、カメラ Cの画像平面上の座標 (x、 y) (x及び yは整数値でピクセルの座標を表すとする）に関するカメラ Aに対する参照視差ベクトルを d [x,y]、カメラ

A

Bに対する参照視差ベクトルを d [x,y]とする。

B

[0035] ここで、マクロブロックのインデックスを MBBlkと表し、マクロブロック数を maxMBBlk と表す。マクロブロックのインデックス MBBlkを 0に初期化した後（S 104)、以下の処理（S105〜S111)を、マクロブロックのインデックス MBBlkに 1をカ卩算しながら（S11 0)、各マクロブロックについて繰り返し実行する。

[0036] まず、ブロック分割（インデックス） blkModeを 0に初期化した後（S105)、ブロック分割 blkModeが最大のインデックス値 maxBlkModeになるまで（S108)、ブロック分割 bl kModeに 1を力卩算しながら（S107)、マクロブロック MBBlk及びブロック分割 blkMode に関するレート歪コストを求める（S106)。すなわち、視差変位設定部 105において、各ブロック分割 blkModeに関するレート歪コスト MBCostが求められる。

[0037] あるブロック分割 blkModeに関するレート歪コスト MBCostは、各ブロックに関するレート歪コスト blkCostを計算し（ブロック総数は maxBlk[blkMode]で表される）、その総禾ロを取ることにより得られる。あるブロックに関するレート歪コスト blkCostは、ある視差変位ベクトルを利用したときのレート歪コスト costの最小値として求められる。従い、各ブロックで costを最小化する視差変位ベクトルとそのレート歪コストを求める必要がある。

ここで、符号ィ匕に利用する視差変位の探索は参照視差の周辺を探索するとする。すなわち、視差変位ベクトルの候補として e 、 e〜e を考え、視差ベクトル d [x,y]+

0 1 N-l A e につ!/、てレート歪コストを計算する処理を n=0, 1,..,N-1につ!/、て繰り返して当該ブロックの最適な視差変位ベクトルを符号化する。

なお、 costの計算の際には、まず、ある視差変位ベクトル eを用いたときの予測残差のブロックに関する絶対値の総和 SAD「e ]が求められる。

さらに、ある視差変位ベクトル eを符号ィ匕したときの視差変位ベクトルの符号量の見積もり値 R [e ]が求められ、 costは次の式で計算される。

[0038] cost = SAD [e ]+ l R [e ] (1)

次に、ブロック分割設定部 106において、各マクロブロック MBBlkに関して、レート歪コスト MBCostが最小になるようなブロック分割 bestBlkModeが求められる（これに対応した視差変位ベクトルはすでに求まって、る）。

[0039] 以上のステップ S 106について、具体的には図 5に示す処理を行う。

まず、マクロブロックのレート歪コスト MBCostとブロック blkのインデックス値を 0に初期化し（S 1061)、ブロック blkにおけるレート歪コスト blkCostを最小にするように視差変位ベクトルを求める（S 1062)。

求めたブロックのレート歪コスト blkCostをマクロブロックのレート歪コスト MBCostに加算した後（S1063)、ブロック blkに 1をカ卩算し、ブロック blkがブロック総数 maxBlk[b lkMode]になるまで、ステップ S 1062〜S 1064を繰り返す（S 1065)。

[0040] ブロック blkがブロック総数 maxBlk[blkMode]になったならば、そのときに算出されたマクロブロックのレート歪コスト MBCostが、現時点における最小のマクロブロックのレート歪コスト minMBCostより小さいかを判定し（S 1066)、小さければ、レート歪コスト MBCostを最小のレート歪コスト minMBCostとして記憶し、そのときのブロック分割 blk Modeを、最適なブロック分割 bestBlkModeとして記憶する（S 1067)。

[0041] 上記の処理を行うことにより、マクロブロック MBBlkの視差補償に利用するブロック分割情報 bestBlkMode、視差変位情報 (視差変位ベクトル)、視差補償による予測残差が求まるので、次に、当該ブロック分割情報 bestBlkModeがブロック分割情報符号化部 107で、 bestBlkModeに対応した視差変位情報が視差変位情報符号ィ匕部 108 で符号ィ匕される（S 109)。

また、当該視差変位情報に対応した予測残差が予測残差符号化部 109で符号ィ匕される。

[0042] 次に、本実施例において用いる映像復号装置を図 7に示す。

映像復号装置 200は、ブロック分割情報復号部 201、視差変位情報復号部 202、予測残差復号部 203、視差補償部 204、参照画像メモリ 205を備える。

[0043] 図 8に本実施例の映像復号装置 200による復号フローを示す。これはカメラ Cを 1フレーム復号する上でのフローを示している。以下でフローを詳細に説明していく。なお、カメラ Aと Bの同時刻のフレームが先立って復号されているとし、その復号画像が参照画像メモリ 205に蓄積されているものとする。

[0044] まず、参照画像メモリ 205からカメラ Aと Bの復号画像を入力し（S201)、参照画像から符号化対象画像の各画素に対する参照視差を求める（S202)。すなわち、視差補償部 204にカメラ Aと Bに関する 2枚の参照画像が読み込まれ、カメラ Cの画像の各画素に関する参照視差が求められる。これが行われることにより、カメラ Cの画像の各画素に対して 2次元ベクトルが二つ求められる。

[0045] 次に、マクロブロックのインデックス MBBlkを 0に初期化した後（S203)、以下の処理（S204〜S212)を、マクロブロックのインデックス MBBlkに 1をカ卩算しながら（S21 1)、各マクロブロックについて 1フレーム分繰り返す（1フレームのブロック数は maxMB Blk)。これによりカメラ Cの 1フレームが復号される。

[0046] 各マクロブロックの復号では、まず、マクロブロック MBBlkに関するブロック分割情報 bestBlkModeがブロック分割情報復号部 201によって復号される（S204)。次に、ブロック blkのインデックス値を 0に初期化した後（S205)、以下の処理（S206〜S20 9)が各ブロック blkについて繰り返し行われる（最大ブロック数は maxBlk[blkMode]である)。

[0047] まず、視差変位情報復号部 202にお、てブロック blkに関する視差変位情報が復号され (S206)、視差補償部 204において、視差変位情報と参照視差を用いてプロック blkに関する予測画像 (カメラ Aと Bの画素値を補間することで作成）が作成される (S207)。

[0048] ここで、上記のブロック blkに関する繰り返し処理が行われることにより、マクロブロック MBBlkに関する予測画像が生成される。従い、次に予測残差復号部 203においてマクロブロック MBBlkに関する予測残差が復号される。そして、視差補償部 204で予測画像と予測残差の和が計算されることにより、マクロブロック MBBlkに関する復号画像が得られる（S210)。

以上の処理が 1フレーム分のすべてのマクロブロックに対して繰り返され（S211、 S 212)、カメラ Cの 1フレームが復号される。

[0049] なお、本実施例では、カメラ Cを符号ィ匕するにあたり、他のカメラ (カメラ A及び B)を参照することで符号ィ匕したが、他のカメラを参照して符号ィ匕する場合とカメラ Cの復号画像を参照して動き補償を行う場合とを画面 (一画像)内で適応的に切り替えて符号化しても良い。

具体的には、例えば図 6のブロック分割に含まれる各ブロックを単位として視差補償と動き補償を切り替えても良い。この場合には、映像符号ィ匕側では各ブロックで視差 Z動き補償のどちらが利用されたかを示す情報を符号ィ匕する必要があるとともに、映像復号側では、この情報を復号する必要がある。

[0050] 以上の映像符号ィ匕及び映像復号の処理は、コンピュータとソフトウェアプログラムとによって実現することができ、そのプログラムをコンピュータ読み取り可能な記憶媒体に記録して提供することも、ネットワークを通して提供することも可能である。

産業上の利用可能性

[0051] 参照画像から視差を推定する映像符号化及び復号方法にお！ヽて、視差変位情報に空間的な相関があることを利用し、視差補償における予測効率の劣化をおさえながらも視差変位情報に関する符号量を小さくすることができ、全体としての符号ィ匕効率を向上させることができる。

Claims

請求の範囲

[1] 複数の映像を一つの映像として符号ィ匕するにあたり、複数の映像間の視差を用いて予測する視差補償により符号ィ匕する映像符号ィ匕方法であって、

参照画像から推定された、符号化対象画像に対する参照視差を設定する参照視差設定ステップと、

画面内での領域分割を設定する領域分割設定ステップと、

前記領域分割設定ステップで設定された各領域に関して、前記参照視差と前記視差補償に用いる視差の差である視差変位を設定する視差変位設定ステップと、前記領域分割設定ステップで設定された領域分割を示す領域分割情報を符号ィ匕する領域分割情報符号化ステップと、

前記視差変位設定ステップで設定された視差変位を示す視差変位情報を符号ィ匕する視差変位情報符号化ステップと、

を有することを特徴とする映像符号化方法。

[2] 請求項 1に記載の映像符号ィ匕方法にぉ、て、

前記領域分割設定ステップにおヽて設定される領域分割は、矩形ブロックへの分割を行なう複数の領域分割方法の中から選択されるものである

ことを特徴とする映像符号化方法。

[3] 請求項 1に記載の映像符号ィ匕方法にぉ、て、

前記参照視差設定ステップにお!ヽて設定される参照視差は、前記符号化対象画像を用いることなく複数の参照画像力推定される

ことを特徴とする映像符号化方法。

[4] 請求項 3に記載の映像符号化方法にお、て、

前記参照視差は、前記複数の参照画像から画素単位で推定される

ことを特徴とする映像符号化方法。

[5] 複数の映像を一つの映像として復号するにあたり、複数の映像間の視差を用いて予測する視差補償により復号する映像復号方法であって、

参照画像から推定された、復号対象画像に対する参照視差を設定する参照視差設定ステップと、符号化情報に含まれる領域分割を示す領域分割情報を復号する領域分割情報復号ステップと、

前記領域分割情報復号ステップで復号された領域分割情報が示す各領域に関して、前記符号ィ匕情報に含まれる、前記参照視差と前記視差補償に用いる視差の差である視差変位の情報を復号する視差変位情報復号ステップと、

を有することを特徴とする映像復号方法。

[6] 請求項 5に記載の映像復号方法において、

前記領域分割情報復号ステップにお、て復号される領域分割情報は、矩形ブロックへの分割を行なう複数の領域分割方法の中から選択されたものである

ことを特徴とする映像復号方法。

[7] 請求項 5に記載の映像復号方法において、

前記視差変位情報復号ステップにお!、て復号される視差変位情報は、前記復号対象画像を用いることなく複数の参照画像から推定された参照視差と前記視差補償に用いる視差の差の情報である

ことを特徴とする映像復号方法。

[8] 請求項 7に記載の映像復号方法において、

前記参照視差は、前記複数の参照画像から画素単位で推定されたものであることを特徴とする映像復号方法。

[9] 複数の映像を一つの映像として符号ィ匕するにあたり、複数の映像間の視差を用いて予測する視差補償により符号ィ匕する映像符号ィ匕装置であって、

参照画像から推定された、符号化対象画像に対する参照視差を設定する参照視差設定手段と、

画面内での領域分割を設定する領域分割設定手段と、

前記領域分割設定手段で設定された各領域に関して、前記参照視差と前記視差補償に用いる視差の差である視差変位を設定する視差変位設定手段と、

前記領域分割設定手段で設定された領域分割を示す領域分割情報を符号化する領域分割情報符号化手段と、

前記視差変位設定手段で設定された視差変位を示す視差変位情報を符号化する視差変位情報符号化手段と、

を備えることを特徴とする映像符号ィ匕装置。

[10] 複数の映像を一つの映像として復号するにあたり、複数の映像間の視差を用いて予測する視差補償により復号する映像復号装置であって、

参照画像から推定された、復号対象画像に対する参照視差を設定する参照視差設定手段と、

符号化情報に含まれる領域分割を示す領域分割情報を復号する領域分割情報復号手段と、

前記領域分割情報復号手段で復号された領域分割情報が示す各領域に関して、前記符号化情報に含まれる、前記参照視差と前記視差補償に用いる視差の差である視差変位の情報を復号する視差変位情報復号手段と、

を備えることを特徴とする映像復号装置。

[11] 請求項 1、請求項 2及び請求項 3のいずれかに記載の映像符号ィ匕方法を、コンビュータに実行させるための映像符号ィ匕プログラム。

[12] 請求項 5、請求項 6及び請求項 7の、ずれかに記載の映像復号方法を、コンビユータに実行させるための映像復号プログラム。

[13] 請求項 1、請求項 2及び請求項 3の、ずれかに記載の映像符号ィ匕方法を、コンビュータに実行させるための映像符号ィ匕プログラムを記録したコンピュータ読み取り可能な記憶媒体。

[14] 請求項 5、請求項 6及び請求項 7の、ずれかに記載の映像復号方法を、コンビユータに実行させるための映像復号プログラムを記録したコンピュータ読み取り可能な記憶媒体。