WO2007077942A1

WO2007077942A1 - 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体

Info

Publication number: WO2007077942A1
Application number: PCT/JP2006/326297
Authority: WO
Inventors: Masaki Kitahara; Hideaki Kimata; Shinya Shimizu; Kazuto Kamikura; Yoshiyuki Yashima; Masayuki Tanimoto; Toshiaki Fujii; Kenji Yamamoto
Original assignee: Nippon Telegraph And Telephone Corporation; National University Corporation Nagoya University
Priority date: 2006-01-05
Filing date: 2006-12-29
Publication date: 2007-07-12
Also published as: JPWO2007077942A1; KR100968920B1; CA2845591C; CN101346998A; CA2845591A1; BRPI0620645B8; TWI335185B; EP1971154A1; RU2374786C1; CA2633637C; EP1971154A4; CA2633637A1; BRPI0620645B1; US8548064B2; KR20080076974A; TW200737990A; JP5234586B2; CN101346998B; BRPI0620645A2; US20090028248A1

Abstract

　複数の映像を一つの映像として符号化するにあたり、複数の映像間の視差を用いて予測する視差補償により符号化する映像符号化及び復号方法。前記視差補償に利用する、各参照画像に対する視差情報のパラメータ数を選択し設定し、前記設定されたパラメータ数の情報を符号化し、前記パラメータ数に応じた視差情報を符号化する。復号時には、符号化情報に含まれる、各参照画像に対する視差情報のパラメータ数を指定する視差パラメータ数情報を復号し、符号化情報に含まれる前記パラメータ数に応じた視差情報を復号する。

Description

明細書

映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体

技術分野

[0001] 本発明は、多視点動画像の符号ィ匕及び復号に関する技術である。

本願は、 2006年 1月 5日に出願された特願 2006— 000394号に基づき優先権を主張し、その内容をここに援用する。

背景技術

[0002] 多視点動画像は、様々な位置にあるカメラで同じ被写体と背景を撮影した複数の動画像である。以下では、一つのカメラで撮影された動画像を" 2次元動画像"と呼び、同じ被写体と背景を撮影した 2次元動画像の集合を多視点動画像と呼ぶ。多視点動画像に含まれる各カメラの 2次元動画像は、時間方向に強い相関がある。一方、各カメラが同期されていた場合、同じ時間に対応した各カメラのフレームは全く同じ状態の被写体と背景を撮影しているため、カメラ間で強い相関がある。

[0003] まず、 2次元動画像の符号化方式に関する従来技術を述べる。国際符号化標準である H. 264、 MPEG— 4、 MPEG— 2をはじめとした従来の多くの 2次元動画像符号化方式では、動き補償、直交変換、量子化、エントロピー符号化という技術を利用して、高効率な符号化を行う。例えば、 H. 264では、 Iフレームにおいてはフレーム内相関を利用して符号ィ匕が可能で、 Pフレームでは過去の複数枚のフレームとのフレーム間相関を利用して符号ィ匕が可能で、 Bフレームでは過去あるいは未来の複数毎のフレームとのフレーム間相関を利用して符号ィ匕が可能である。

[0004] H. 264の技術の詳細については、下記の非特許文献 1に記載されている力以下で概要を説明する。 Iフレームではフレームをブロック分割し（このブロックをマクロブロックといい、ブロックサイズは 16 X 16 (ピクセル）である）、各マクロブロックにおいてィントラ予測を行う。イントラ予測の際には、各マクロブロックをさらに小さなブロックに分割し (以後、サブブロックと呼ぶ）、各サブブロックで異なるイントラ予測方法を行うことができる。 [0005] 一方、 Pフレームでは、各マクロブロックでイントラ予測、あるいはインター予測を行うことができる。 Pフレームにおけるイントラ予測は、 Iフレームの場合と同様である。一方、インター予測の際には動き補償が行われる。動き補償においても、マクロブロックをより小さなブロックに分割して、各サブブロックで異なる動きベクトル、参照画像を持つことができる。

[0006] なお、 Bフレームにおいても、イントラ予測とインター予測が行える力 Bフレームでのインター予測では、過去のフレームに加えて未来のフレームも動き補償の参照画像にできる。例えば、 Iフレーム→Bフレーム→Bフレーム→Pフレームというフレーム構成で符号化する場合、 I→P→B→Bの順番で符号ィ匕することができる。そして、 Bフレームでは、 I及び Pフレームを参照して動き補償ができる。また、 Pフレームの場合と同様でマクロブロックを分割したサブブロックごとに異なる動きベクトルを持つことができる。

[0007] イントラ、インター予測を行うと予測残差が得られるが、各マクロブロックで予測残差ブロックに DCT (離散コサイン変換)を行って量子化が行われる。そして、このようにして得られる DCT係数の量子化値に対して可変長符号ィ匕が行われる。なお、 Pフレーム及び Bフレームでは、サブブロックごとに参照画像を選択可能である力参照画像は参照画像インデックスと呼ばれる数値で表され、可変長符号化される。 H. 264では、参照画像インデックスの値が小さいほど短い符号で可変長符号ィ匕されるため、フレームごとに参照画像インデックスを明示的に変更する仕組みを採用して、る。この機能により、使用頻度の高い参照画像ほど参照画像インデックスの値を小さく設定することで、参照画像インデックスを効率的に符号ィ匕できる。

[0008] 多視点動画像の符号ィ匕については、動き補償を同じ時刻の異なるカメラの画像に適用した"視差補償"によって高効率に多視点動画像を符号ィ匕する方式が従来からある。ここで、視差とは、異なる位置に配置されたカメラの画像平面上で、被写体上の同じ位置が投影される位置の差である。

[0009] このカメラ間で生じる視差の概念図を図 13に示す。この概念図では、光軸が平行なカメラの画像平面を垂直に見下ろしたものとなっている。このように、異なるカメラの画像平面上で被写体上の同じ位置が投影される位置は、一般的に対応点と呼ばれる。視差補償では、符号化対象カメラの画像上のある着目画素に対応する参照先のカメラの画像上の対応点を参照画像から推定し、当該対応点に対応した画素値で、着目画素の画素値を予測する。以下では、便宜上、前述のような"推定された視差" についても"視差"と呼ぶこととする。このような方式では、視差情報と予測残差を符号化する。

[0010] また、多くの手法では、視差を画像平面上でのベクトル (視差ベクトル）として表現する。例えば、非特許文献 2の手法では、ブロック単位で視差補償を行う仕組みが含まれている力ブロック単位の視差を 2次元ベクトルで、すなわち 2つのパラメータ（X 成分及び y成分)で表現する。この視差ベクトルの概念図を図 14に示す。即ち、この手法では、 2パラメータで構成される視差情報と予測残差を符号化する。なお、この方法では、カメラパラメータを利用して符号ィ匕を行わないため、カメラパラメータが未知である場合に有効である。

[0011] 一方、非特許文献 3には、多視点画像 (静止画像)の符号化方法が記載されている

1S この方法ではカメラパラメータを符号化に利用し、ェピポーラ幾何拘束に基づき視差ベクトルを 1次元の情報として表現することにより、多視点画像を効率的に符号化する。

[0012] ェピポーラ幾何拘束の概念図を図 15に示す。ェピポーラ幾何拘束によれば、 2台のカメラ (カメラ 1とカメラ 2)による 2枚の画像において、被写体上の位置 Mに関する片方の画像上の点 mに対応するもう片方の画像上の点 m'は、ェピポーラ線という直線上に拘束される。非特許文献 3の手法では、一次元のェピポーラ線上での位置という一つのパラメータで参照画像に対する視差を表現する。すなわち、この手法では、一つのパラメータで表現された視差情報と予測残差を符号ィ匕する。

[0013] なお、参照画像の枚数が 2枚以上 (各々は異なるカメラの参照画像である）であっても、ェピポーラ幾何拘束を利用して一つのパラメータで各参照画像への視差を表現できる。例えば一つの参照画像に対するェピポーラ線上の視差が既知であれば、他のカメラに関する参照画像に対する視差も復元できる。

[0014] また、各々が異なるカメラ力ものものである参照画像が複数ある場合、任意視点画像技術を利用して視差補償を行うことが可能である。非特許文献 4では、任意視点画像生成技術を利用して視差補償をする。具体的には、符号化対象カメラの画像の画素値を、当該画素に対応した異なるカメラの対応点の画素値で補間して予測する。この補間の概念図を図 16に示す。この補間では、符号化対象画像の画素 mの値を、画素 mに対応する参照画像 1、 2の画素、 m〃の値を補間することにより予想する。

非特許文献 1 : ITU- T Rec.H.264/ISO/IEC 11496-10, "Advanced Video Coding", Fi nal Committee Draft, Document JVT-E022, September 2002

非特許文献 2： Hideaki Kimata and Masaki Kitahara, "Preliminary results on multiple view video coding (3DAV)", document M10976 MPEG Redmond Meeting, July, 2004 非特許文献 3 :畑幸一，栄藤稔，千原國宏：多視点画像の高能率符号化，電子情報通信学会論文誌， Vol.J82-D-II, No.l l, pp.1921- 1929 (1999)

非特干文献 4： Masayuki Tanimoto, Toshiaki Fujn, Response to Call for Evidence o n Multi-View Video Coding", document Mxxxxx MPEG Hong Kong Meeting, Januar y, 2005

発明の開示

発明が解決しょうとする課題

[0015] 従来の多視点動画像の符号ィ匕手法によれば、カメラパラメータが既知である場合、ェピポーラ幾何拘束を利用して、参照画像の数にかかわらず、各参照画像に対する視差情報を一つのパラメータで表現できることにより、視差情報を効率的に符号ィ匕することが可能である。

[0016] しカゝしながら、実力メラで取得された多視点動画像を符号化対象とすると、カメラパラメータの測定誤差などにより、視差をェピポーラ線上に拘束して視差補償をすると、予測効率が悪化する場合がある。また、参照画像は符号化歪が混入した画像であるため、同様にェピポーラ線上に拘束して視差補償をすると、予測効率が悪化する場合がある。予測効率が悪化すると予測残差の符号量の増加を招き、結果として全体の符号化効率が悪化してしまう。

[0017] 本発明は、上記問題点の解決を図り、多視点動画像の符号ィ匕において、参照画像の性質に応じて視差補償の自由度を制御し、参照画像の符号化歪やカメラパラメ一タの測定誤差が存在する場合にも、視差補償の精度を向上させ、従来よりも高い符号化効率を実現することを目的とする。

課題を解決するための手段

[0018] 本発明が従来技術ともっとも異なる点は、参照画像の性質に応じて視差補償の自由度を制御可能にするため、視差情報のパラメータ数を可変にし、そのパラメータ数を示す視差パラメータ数情報またはインデックス情報を符号化して符号ィ匕情報に含ませる点である。

インデックス情報として、視差情報のパラメータ数の他に視差補償に用いる参照画像を示す情報を含ませることができ、またさらに他の情報を含ませることもできる。

[0019] 具体的には、本発明による映像符号化方法、映像復号方法の第 1の態様では、映像情報の性質に応じて、視差補償に用いる視差情報のパラメータ数を指定する視差パラメータ数を符号化、復号する処理を実行する。

ここで、視差パラメータ数情報は、例えば各参照画像に対する視差ベクトルの次元を指定するものである。例えば参照画像の枚数が 2枚 (参照画像 A、 B)であった場合、以下のような構成が考えられる。

[0020] 'pNum=0 :参照画像 A、 Bのいずれに対する視差ベクトルも 1次元

•pNum=l：参照画像 Aに対する視差ベクトルは 1次元、参照画像 Bに対する視差ベクトルは 2次元

•pNum=2：参照画像 Aに対する視差ベクトルは 2次元、参照画像 Bに対する視差ベクトルは 1次元

•pNum=3：参照画像 A、 Bの!、ずれに対する視差ベクトルも 2次元上記のインデックス情報 pNumが視差パラメータ数情報として定義できる。まず、映像符号ィ匕側では視差パラメータ数設定ステップで視差情報を表現するためのノラメータ数を設定する。そして、視差パラメータ数設定ステップで設定されたパラメータ数に関する情報である視差パラメータ数情報を、視差パラメータ数情報符号ィ匕ステップで符号化する。そして、視差パラメータ数設定ステップで設定されたパラメータ数で表現される視差情報を、視差情報符号化ステップで符号ィ匕する。一方、映像復号側では、視差パラメータ数情報復号ステップにおいて視差パラメ一タ数情報をまず復号する。そして、復号した視差パラメータ数情報で指定されるパラメータ数の視差情報を、視差情報復号ステップで復号する。

[0021] 本発明による映像符号化方法、映像復号方法の第 2の態様では、参照画像インデックスに対して視差補償に利用可能な参照画像が割り振られている。例えば視差補償の予測画像生成の際には 2枚の参照画像を利用し、参照画像メモリに使用可能な参照画像が 3枚 (A、 B、 C)あった場合、以下のような割り当て例が考えられる。

[0022] · refldx=0：参照画像 Aと B

•refldx=l：参照画像 Bと C

•refldx=2：参照画像 Aと C ここで、 refldxは参照画像インデックスである。上記に加え、符号化対象カメラの復号画像に対応付けた参照画像インデックスを設定しても良ヽ。

映像符号化側では、上記第 1の態様における処理に加え、視差補償に用いる参照画像を設定する参照画像設定ステップ、参照画像インデックスを符号化する参照画像インデックス符号化ステップを実行する。一方、復号側では、参照画像インデックスを復号するステップを有する。

前述のような H. 264の参照画像インデックスの順序変更の仕組みと組み合わせれば、動画像の性質に応じて、高品質な予測画像が生成可能な参照画像に対して参照画像インデックスとして小さな値が設定されるようにして、符号ィ匕効率を向上させることができる。

[0023] 本発明による映像符号化方法、映像復号方法の第 3の態様では、参照画像インデックスに対して利用可能な視差パラメータ数情報が対応付けられている。例えば視差補償の予測画像生成の際には 2枚の参照画像を利用し、参照画像メモリに使用可能な参照画像が 3枚 (A、 B、 C)あり、視差パラメータ数情報 pNumは 2通り (pNum=0,l)あつた場合、以下のような割り当て例が考えられる。

[0024] -refldx=0：参照画像 Aと B、 pNum=0

•refldx=l：参照画像 Aと B、 pNum=l •refldx=2 :参照画像 Bと C、 pNum=0

•refldx=3 :参照画像 Bと C、 pNum=l

•refldx=4:参照画像 Aと C、 pNum=0

•refldx=5 :参照画像 Aと C、 pNum=l この場合、映像符号化側では参照画像インデックスを符号化する参照画像インデッタス符号化ステップを実行するが、視差パラメータ数情報は当該ステップで符号化されることとなる。一方、映像復号側では参照画像インデックスを復号する参照画像ィンデックス復号ステップを実行する力視差パラメータ数情報は当該ステップで復号されることとなる。

前述のような H. 264の参照画像インデックスの順序変更の仕組みと組み合わせれば、動画像の性質に応じて視差パラメータ数情報に割り当てられる可変長符号の符号長を変更でき、視差パラメータ数情報を効率的に符号化できる。

発明の効果

[0025] 多視点動画像の符号ィ匕における視差補償において、カメラパラメータの測定誤差や参照画像の符号ィヒ歪によってェピポーラ幾何拘束に従った予測では予測効率が悪い場合には、視差情報のノメータ数を増やして自由度の高い予測を、ェピポーラ幾何拘束に従っても予測効率が良い場合には、 1パラメータで視差を表現した予測を、フレームやブロック単位で復号画像の特性に応じて適応的に制御することが可能となり、従来よりも高い符号化効率を実現することが可能となる。

図面の簡単な説明

[0026] [図 1]本発明における実施例 1の映像符号ィ匕装置を示す図である。

[図 2]実施例 1におけるカメラの参照関係を示す図である。

[図 3]実施例 1におけるカメラ配置を示す図である。

[図 4]実施例 1における符号ィ匕フローチャートである。

[図 5]実施例 1の映像復号装置を示す図である。

[図 6]実施例 1における復号フローチャートである。

[図 7]本発明における実施例 2におけるカメラの参照関係を示す図である。圆 8]実施例 2における映像符号ィ匕装置を示す図である。

[図 9]実施例 2における符号ィ匕フローチャートである。

[図 10]図 9のステップ S304の処理に関する詳細フローチヤ

[図 11]実施例 2の映像復号装置を示す図である。

[図 12]実施例 2における映像復号フローチャートである。圆 13]カメラ間で生じる視差の概念図である。

[図 14]視差ベクトルの概念図である。

圆 15]ェピポーラ幾何拘束の概念図である。

[図 16]画素値補間の概念図である。

符号の説明

100、 300 映像符号化装置

101、 301 画像入力部

102、 302 参照画像入力部

103、 205、 303、 405 参照画像メモリ

104 視差パラメータ数設定部

105 視差パラメータ数情報符号化部

106、 309 視差情報符号化部

107、 310 予測残差符号化部

200、 400 映像復号装置

201 視差パラメータ数情報復号部

202、 402 視差情報復号部

203、 404 予測残差復号部

204、 304、 406 視差補償部

305、 407 動き補償部

306 参照画像設定部

307 参照画像インデックス符号ィ匕部

308 動き情報符号化部

311 ローカル復号部 401 参照画像インデックス復号部

403 動き情報復号部

発明を実施するための最良の形態

[0028] 〔実施例 1〕

まず、第 1の実施例（以下、実施例 1)について説明する。本発明の実施例 1に係る映像符号化装置の構成図を図 1に示す。

この映像符号化装置 100は、符号化対象画像であるカメラ Cの原画像を入力する画像入力部 101、参照画像であるカメラ Aと Bの復号画像を入力する参照画像入力部 102、参照画像を格納する参照画像メモリ 103、視差補償に利用する視差情報を表現するパラメータ数を設定する視差パラメータ数設定部 104、視差パラメータ数情報を符号化する視差パラメータ数情報符号化部 105、視差情報を符号化する視差情報符号ィ匕部 106、視差補償で生じた残差信号を符号ィ匕する予測残差符号ィ匕部 1 07を備える。

[0029] 図 2は、実施例 1におけるカメラの参照関係を示す図である。

本実施例では、図 2に示すように、 3つのカメラに関する多視点映像を符号ィ匕するにあたり、カメラ Aと Bの復号画像を参照画像としてカメラ Cの動画像を符号ィ匕する場合を示す。

図中の矢印は視差補償の際の参照関係を示しており、カメラ Cの画像を符号ィ匕する際には、表示時刻において同時刻であるカメラ Aと Bの復号画像を参照画像として符号化する。その際には、カメラ A及び Bの対応点に関する画素値の平均値で予測画像を作成するものとする。

[0030] 図 3は、実施例 1におけるカメラ配置を示す図である。本実施例では、 3つのカメラの視点位置は直線上に等間隔に並んでおり、光軸はカメラが並ぶ直線に対して垂直となっているとする。すなわち、 3つのカメラの光軸は平行であるとする。

また、画像平面の xy座標系はカメラが並ぶ直線に対する平行移動（回転等はなし）により得られ、各々のカメラで画像平面の X軸及び y軸を等間隔に分割することで画素が構成されているとする。すなわち、解像度が各カメラで同じであり、なおかつ、力メラ Cとカメラ Aの P画素分の視差はカメラ Cとカメラ Bで P画素の視差となることになる [0031] 実施例 1における符号ィ匕のフローを図 4に示す。

このフローチャートは、カメラ Cの一つの画像を符号ィ匕する際に行う処理を示しており、各画像についてこの処理を繰り返すことにより動画像符号化が行われるとする。そして、本実施例では、視差情報の表現方法として、カメラ Aに対するェピポーラ線上の位置を一つのパラメータで表現した視差情報でカメラ Aと Bの各々の参照画像に対する視差を表現する場合 (インデックス pNumの値が 0)と、カメラ Aと Bの各々の参照画像に対する視差をそれぞれ 2次元ベクトルで表現し、合計 4パラメータで視差情報を表現する場合 (インデックス pNumの値が 1)の二つを適応的に切り替えて視差補償することとする。なお、 pNumは視差パラメータ数情報を表すインデックスである。

[0032] また、視差パラメータ数の切り替えは画像を分割して得られる縦横それぞれ N画素

(N X N)のブロック単位で行うとする。すなわち、各 N X Nブロックに対して 1つ（pNu m =0)もしくは 4つ (pN醒 =1)のパラメータを視差情報として符号ィ匕する。

[0033] このような前提の下で図 4のフローに沿って符号ィ匕処理を説明する。

まず、画像入力部 101によりカメラ Cの画像が入力される (ステップ S101)。なお、ここで入力されたカメラ Cの画像と表示時刻が同じであるカメラ Aと Bの復号画像力参照画像メモリ 103に参照画像入力部 102により入力されている。

[0034] このフローでは、画像を分割して得られる個々の N X Nブロックを示すインデックスを blkと表し、一つの画像に対する総ブロック数を maxBlkと表す。

N X Nブロックのインデックス blkを 0に初期化した後（S102)、以下の処理（S103 〜S116)を、インデックス blkに 1をカ卩算しながら（SI 15)、インデックス blkが総ブロック数 maxBlkになるまで（S116)、各 N X Nブロックに対して繰り返して実行する。

[0035] まず、視差パラメータ数設定部 104にお、て、画像 Cのインデックス blkに対応した符号化対象ブロックが読み込まれ、参照画像メモリ 103からカメラ Aと Bに対応した参照画像が読み込まれる。そして、同じく視差パラメータ数設定部 104において、 pNum = 0及び pNum= 1につ!/、て視差探索の処理が行われる（S 104〜S 106)。

なお、視差の探索は、視差補償による予測残差の N X Nブロックに関する絶対値の総和 SADと視差情報の符号量の見積もり値である R に基づいて求められるレート歪コスト costを最小化するように行われる。ここで、 costは次式で計算される。

[0036] cost = SAD + (1)

disp ここで、 λはラグランジュの未定乗数であり、予め設定された値が利用される。また、 R を求めるには、視差情報に可変長符号化を施して符号量を求める。

disp

pNum=0及び pNum= lについて、 costの最小値 pCost及び pCostを実現する視差情報を求め、より pCost力、さい視差情報を符号ィ匕に採用する（S107〜S110)。図 4のフローにおける minPCostは、 pCostの最小値を格納するための変数であり、ブロック blkを処理する際に pCostが取りうる最大の値より大きい任意の値 (maxPCost) に設定され、初期化される。

[0037] pNum=0の場合は、ステップ S105において、次の処理が行われる。

予め設定された範囲において視差を探索する。本実施例のカメラ配置では、ェピポーラ幾何拘束に従うと、カメラ Cのピクセル (x、 y)に対する視差は、カメラ Aについては (x + d , y) , (ただし、 d ≥0)となり、カメラ Bに対しては (x— d、y)となる。ただし、縦横 Iピクセルの画像平面上の座標系は、左上のピクセルを (0、 0)とし、右上を (I 1、 0)、左下を (0、 1—1)とするものである。本実施例では d =0〜Pの範囲を探索範囲とすることにする。従い、 d =0〜Pについて、次式で SAD[d ]を計算する。

[0038] SAD[d ] =∑ ∑ ABS( DEC [x+i+d y+j]/2 + DEC [x+i+d y+j]/2 - IMG [ x i j A x, B x, c x+i, y+j] ) (2) ただし、∑.は、 iが 0から N— 1までの総和、∑jは、 jが 0から N— 1までの総和を表す。ABS( )は括弧内の絶対値を取るものであり、 DEC [x,y]と DEC [x,y]は、それぞ

A B

れカメラ A及び Bの復号画像の（x、y)ピクセルの輝度値を表し、 IMG [x,y]は、カメラ Cの原画像の（x、 y)ピクセルの輝度値を表す。また、（x、 y)は N X Nブロックの左上のピクセルの画像平面内での座標であるとする。

[0039] さらに、視差が dであるときの視差情報の符号量見積もり値 R [ d ]を求め、数式 disp

1により視差 dに対するレート歪コスト cost「d ]を求める。求めた cost[d ]を最小にした視差を bestDispPNumO、及びその際のコストを pCostとする。 [0040] そして、 minPCost pCostとし、最適な pNumを格納する bestPNumには 0を代入して pNum= lの場合の処理に移る（S107〜S110)。

[0041] pNum= lの場合は、ステップ S106において、次の処理が行われる。

pNum= lの場合には、ェピポーラ幾何拘束を考慮せず、 2次元で視差の探索を行う。具体的には、カメラ A及びカメラ Bのぞれぞれに関する X軸上の探索範囲を d , d

=— P〜P (d ,d のそれぞれにおいて「― P〜P」の範囲）とし、 y軸上の探索範囲を d , d =— P〜P (d , d のそれぞれにおいて「一 P〜P」の範囲）とする。そして、全ての（d , d , d , d )の組み合わせについて、次式の SAD[d d d d ]を求める。

[0042] SAD[d，， d d d ] =∑ ∑ ABS( DEC [ x+i+d , y+j+d ]/2 + DEC [ x

+i+d , y+j+d ]/2 IMG [x+i, y+j] ) (3) さらに、視差が (d d d d )であるときの視差情報の符号量見積もり値 R [d d d d ]を求め、数式 1により視差 dに対するレート歪コスト cost[d d d d

]を求める。そして、 cost[d d d d ]を最小にした視差を bestDispPNuml、及びその際のコストを pCostとする。

[0043] そして、 pCostく minPCostであれば（S107)、 minPCost pCostとし、最適な pNu mを格納する bestPNumには 1を代入する（S 108)。

[0044] 次に、視差パラメータ数情報符号ィ匕部 105において、 bestPNumが可変長符号化される (Sl l l)。また、視差情報符号ィ匕部 106において、視差情報が符号化される。 be stPNum力^の場合には、 dが可変長符号化され、 bestPNumが 1の場合には、（d d d d )が可変長符号化される。最後に、予測残差符号ィ匕部 107において、予測残差が符号ィ匕される（S112〜S114)。

[0045] 次に、実施例 1の映像復号装置を図 5に示す。映像復号装置 200は、視差パラメ一タ数情報を復号する視差パラメータ数情報復号部 201と、視差パラメータ数情報に応じた視差情報を復号する視差情報復号部 202と、予測残差を復号する予測残差復号部 203と、視差補償部 204と、参照画像メモリ 205とを備える。

[0046] 図 6に本実施例の復号フローを示す。これはカメラ Cを 1フレーム復号する上でのフローを示して、る。以下でフローを詳細に説明して！/、く。

[0047] N X Nブロックのインデックス blkを 0に初期化した後（S201)、以下のステップ S20 2〜S208の処理を各 N X Nブロックに対して、 1フレーム分繰り返すことにより（1フレームのブロック数は maxBlk)、カメラ Cの 1フレームが復号される。なお、カメラ Aと Bの同時刻のフレームが先立って復号されているとし、その復号画像が参照画像メモリ 2 05に蓄積されているものとする。

[0048] まず、視差パラメータ数情報復号部 201により、視差パラメータ数情報 bestPNumが復号される（S202)。 bestPNumの値に応じて（S203)、以下の処理が行われる。

[0049] bestPNum=0の場合、視差情報復号部 202において、視差情報 dが復号される。

視差補償部 204に視差パラメータ数情報 bestPNumと視差情報 dが入力され、参照画像メモリ 205から視差情報 dに対応したカメラ Aと Bの N X Nブロックが入力される。そして、符号ィ匕対象の N X Nブロックのピクセルの位置を (x、 y)と表すと、次式により予測画像 PRED[x+i, y+j]が生成される（S204)。

[0050] PRED[x+i, y+j]= DEC [ x+i+d , y+j]/2 + DEC [ x+i+d , y+j]/2 (4)

A x B x ただし、 i=0,l,..,N- 1及び j = 0,l,..,N- 1である。

[0051] bestPNum= lの場合、視差情報復号部 202において、視差情報（d d d d ) x,A, x,B, y，A， y,B が復号される。視差補償部 204に視差パラメータ数情報 bestPNumと視差情報 (d d

_Χ，Α， κ d d )が入力され、参照画像メモリ 205から視差情報 dに対応したカメラ Aと Bの

,B, y,A, y,B χ

N X Nブロックが入力される。そして、符号化対象の N X Nブロックのピクセルの位置を (x、 y)と表すと、次式により予測画像 PRED[x+i, y+j]が生成される（S205)。

[0052] PRED[x+i, y+j]= DEC [ x+i+d , y+j+d ]/2 + DEC [ x+i+d , y+j+d ]/2 (

A x,A y,A B x,B y,B

5) ただし、 i=0,l,..,N- 1及び j = 0,l,..,N- 1である。

[0053] 次に、符号ィ匕された予測残差が入力された予測残差復号部 203において、 N X N の予測残差ブロック RES[x+i, y+j]が復号される。そして予測残差ブロックは視差補償部 204に入力され、次式のように予測画像との和が計算され、復号画像 DEC [x+i, y +j]が求められる（S206)。

[0054] DEC [x+i, y+j]= RES[x+i, y+j] + PRED[x+i, y+j] (6) 以上の処理をインデックス blkに 1を加算しながら（S207)、 blk力 Siフレームのブロック数 maxBlkになるまで繰り返し行うことにより、カメラ Cに関する復号画像を得ることができる。

[0055] 〔実施例 2〕

次に、第 2の実施例（以下、実施例 2)について説明する。

本実施例では、図 7のカメラの参照関係のように、 5つのカメラに関する多視点映像を符号化するにあたり、カメラ A、 B、 D、 Eの復号画像を参照画像として、カメラ Cの動画像を符号化する場合を示す。

前述した実施例 1では、カメラ Cの画像は視差補償のみを利用して符号ィ匕してヽた力本実施例では、動き補償と視差補償をブロック単位で切り替えて実行することで符号化を行う。そして、図中の矢印は視差 Z動き補償の際の参照関係を示している。

[0056] 視差補償の際には、カメラ A、 B、 D、 Eにおいて設定する 2台のカメラの複数の対（ Aと B、 Aと D、 Bと Eの 3種類の対）により予測画像を生成するものとする。予測画像の生成方法は、実施例 1と同様で、 2台のカメラの対応点に関する画素値の平均値で予測画像を作成するものとする。

なお、本実施例では実施例 1と同様に、 5つのカメラの視点位置は直線上に等間隔に並んでおり、光軸はカメラが並ぶ直線に対して垂直となっているとする。すなわち、図 3の関係が 5台のカメラにあり、各カメラの光軸は平行であるものとする。

[0057] 実施例 2における映像符号ィ匕装置の構成図を図 8に示す。

この映像符号化装置 300は、カメラ Cの原画像を入力する画像入力部 301、カメラ A、 B、 D、 Eの復号画像を入力する参照画像入力部 302、参照画像を格納する参照画像メモリ 303、視差補償を行う視差補償部 304、動き補償を行う動き補償部 305、参照画像設定部 306、参照画像インデックス符号化部 307、動き情報符号化部 308 、視差情報符号化部 309、予測残差符号化部 310、ローカル復号部 311を備える。

[0058] 本実施例における符号ィ匕のフローを図 9に示す。また、当該フロー中のステップ S3 04に関する詳細フローを図 10に示す。

このフローチャートは、カメラ Cの一つの画像を符号ィ匕する際に行う処理を示しており、各画像についてこの処理を繰り返すことにより動画像符号化が行われるとする。本実施例においては、 N X Nのブロック単位で、以下の処理を適応的に切り替えて符号化することとする。

[0059] 'カメラ Cの過去の復号画像を利用した動き補償： refldx =0、 1

'カメラ Aと Bの参照画像を利用した視差補償 (pNum=0)： refldx = 2 'カメラ Aと Bの参照画像を利用した視差補償 (pNum=l)： refldx = 3 'カメラ Aと Dの参照画像を利用した視差補償 (pNum=0)： refldx =4 'カメラ Aと Dの参照画像を利用した視差補償 (pNum=l)： refldx = 5 'カメラ Bと Eの参照画像を利用した視差補償 (pNum=0)： refldx =6 'カメラ Bと Eの参照画像を利用した視差補償 (pNum=l)： refldx = 7 ここで、 refldxは参照画像インデックスを示して!/、る。

また、 refldx=0、 1については、 refldx=0は、カメラ Cの 1フレーム前の復号画像に対応し、 refldx= lは、 2フレーム前の復号画像に対応する。

本実施例では、符号化側では各ブロックで利用された手法及び参照画像に対応した参照画像インデックスを符号化し、復号側では参照画像インデックスにより各ブロックの画素値を復号する。

[0060] なお、上記の参照画像インデックスの割り当ては画像 Cの 3フレーム目以降を符号化する際のものであるとする。

1フレーム目においては、カメラ Cの復号画像はないので動き補償に関しては参照画像インデックスが割り当てられず、視差補償に関する参照画像インデックスにつヽては上記の各値よりそれぞれ 2小さい値 (例えば「カメラ Aと Bの参照画像を利用した視差補償 (pNum=0」では refldx=0)が割り当てられる。

一方、 2フレーム目においては、動き補償に関する参照画像インデックスは、 refldx =0のみであり、視差補償に関する参照画像インデックスについては上記の各値よりそれぞれ 1小さい値 (例えば「カメラ Aと Bの参照画像を利用した視差補償 (pNum=0」では refldx=l)が割り当てられる。 [0061] このような前提の下で図 9のフローに沿って符号ィ匕処理を説明する。ただし、この処理は、カメラ Cの 3フレーム目以降の符号ィ匕処理であるとする。

[0062] 画像入力部 301によりカメラ Cの画像が入力される（S301)。なお、ここで入力されたカメラ Cの画像と表示時刻が同じであるカメラ A、 B、 D、 Eの復号画像が参照画像メモリ 303に参照画像入力部 302により入力されている。また、カメラ Cに関する 1フレーム前、及び 2フレーム前の復号画像がローカル復号部 311によって復号され、参照画像メモリ 303に入力されているとする。

[0063] 画像を分割して得られる各 N X Nブロックのインデックスを blkと表し、一つの画像に対する総ブロック数を maxBlkと表す。 N X Nブロックのインデックス blkを 0に初期化した後（S302)、以下の処理（S303〜S312)を、インデックス blkに 1を加算しながら（ S311)、インデックス blkが総ブロック数 maxBlkになるまで（S312)、各 N X Nブロックに対して繰り返して実行する。

[0064] 参照画像インデックス refldxを 0に初期化し、コスト値 re!Costの最小値を格納する変数である minRefCostを、ブロック blkを処理する際に re!Costが取りうる最大の値より大き、任意の値 maxRefCostに初期化する（S303)。

[0065] インデックス blkが指す各 N X Nブロックにお!/、て、各参照画像インデックス refldxに対応した予測処理を行う（S 304)。その際には、各参照画像インデックス refldxに対応したコスト値 re!Costを算出し、 re!Costを最小にした参照画像インデックス bestRefl dxを、その N X N

ブロックの符号ィ匕に採用する（S305、 S306)。

[0066] 以下に、ステップ S304の各参照画像インデックス refldxに対応した処理を、図 10のフローに従って説明する。なお、以下では動き補償もしくは視差補償が行われるが、どちらの場合においても、動き Z視差情報は、以下の式で与えられる costを最小化することで得られる。

[0067] cost = SAD + (7)

vec ここで、 R は動きもしくは視差情報の符号量の見積もり値であり、 SADは予測残 vec

差の絶対値の総和である。 [0068] refldxが 2以上であった場合、視差補償に対応した refldxであり (S3041)、視差補償部 304によって当該 refldxに対応した 2台のカメラの復号画像が参照画像として読み込まれ、視差補償が行なわれる。

また、 refldxが 2以上であった場合、 refldxは対応する視差パラメータ数情報 pNum= 0または 1を有する。従い、 pNum=0及び 1の場合の視差補償処理を実施例 1の場合と同様に行う。

[0069] すなわち、視差パラメータ数 (pNum)が 1の場合（S 3042)、参照画像インデックス re fldxに対応した 2つの参照画像にっ、てェピポーラ線上の視差を、レート歪コストを最小化するように探索し、最小コスト値を re!Costとする（S3043)。

また、視差パラメータ数が 1でない場合 (S3042)、参照画像インデックス refldxに対応した 2つの参照画像にっ、て画像平面上の視差を、レート歪コストを最小化するように探索し、最小コスト値を re!Costとする（S3044)。

上記 S3043、 S3044の各々において、算出された costの最小値 (refCost)に、参照画像インデックス refldxを符号ィ匕した際の符号量見積もり値を足し合わせた値力 f Costとされる。

[0070] refldxが 0もしくは 1の場合は、動き補償に対応した refldxであり、ステップ S3045に進む。この場合、動き補償部 305によって当該 refldxの値に対応したカメラ Cの復号画像が参照画像として読み込まれ、動き補償が行われる。その際の動き情報は、数式 7で算出される costを最小化することで行われる。そして、参照画像インデックス refl dxを符号ィ匕した際の符号量見積もり値を、当該 cost最小値に足しあわせた値を refCo stとする（S3045)。

[0071] 算出された refCost力現在の最小値を格納する minRe!Cos りも小さい場合には（ S305)、 minRefCostに re!Costを格納し、そのときの refldxを、 bestRefldxとして記憶しておく（S306)。

以上の処理を、 refldxに 1を力卩算しながら、 refldxがインデックスの総数 maxRe!Num になるまで繰り返す（S307、 S308)。

上記の処理が各参照画像に対して行われたら、参照画像設定部 306によって refC ostを最小にした参照画像インデックス bestRefldxが求められ、符号化に利用される参照画像インデックスが決定する。

[0072] 次に、 bestRefldxが参照画像インデックス符号化部 307によって符号化され（S309 )、動き情報もしくは視差情報が動き情報符号ィ匕部 308もしくは視差情報符号ィ匕部 3 09で符号化され、予測残差が予測残差符号化部 310で符号化される（S310)。インデックス blkに 1を加算し（S311)、これが総ブロック数 maxBlkになるまで繰り返すことにより（S312)、カメラ Cの 1フレーム分の画像が符号ィ匕される。

[0073] 次に、実施例 2における映像復号装置を図 11に示す。

映像復号装置 400は、参照画像インデックスを復号する参照画像インデックス復号部 401、視差情報を復号する視差情報復号部 402、動き情報を復号する動き情報復号部 403、予測残差を復号する予測残差復号部 404、参照画像を格納する参照画像メモリ 405、視差補償を行う視差補償部 406、動き補償を行う動き補償部 407を備える。

[0074] 図 12に本実施例の復号フローを示す。これはカメラ Cを 1フレーム復号する上でのフローを示して、る。以下でフローを詳細に説明して、く。

[0075] N X Nブロックのインデックス blkを 0に初期化した後（S401)、以下の処理（S402 〜S410)を、インデックス blkに 1をカ卩算しながら（S409)、インデックス blkが総ブロック数 maxBlkになるまで（S410)、各 N X Nブロックに対して繰り返して実行する。これにより、カメラ Cの 1フレームが復号される。なお、カメラ A、 B、 D、 Eの同時刻のフレーム、及びカメラ Cの 1フレーム前、 2フレーム前の復号画像が参照画像メモリ 405に蓄積されているものとする。

[0076] まず、参照画像インデックス復号部 401により、参照画像インデックス bestRefldxが復号される（S402)。参照画像インデックス bestRefldxの値に応じて（S403、 S404) 、以下の処理が行われる。

[0077] もし、 bestRefldx = 0もしくは 1であれば、動き補償に対応した参照画像インデックスであり、動き情報復号部 403により動き情報が復号される。そして、動き補償部 407により bestRefldx=0もしくは 1に対応した参照画像が読み込まれ、予測画像が生成される（S407)。

そして、予測残差復号部 404によって予測残差が復号され、動き補償部 407にお V、て予測残差に対して予測画像が足され (S408)、 N X Nブロックの復号画像が生成される。

[0078] もし bestRefldxが 2以上であったら、視差補償に対応した参照画像インデックスであり、その参照画像インデックス bestRefldxに対応した 2台のカメラに関する参照画像が読み込まれ、視差補償による復号が行われる。

この参照画像インデックス bestRefldxには、視差パラメータ数情報 pNumの値も対応付けられているため、 pNumに応じた処理が行われる。視差補償の処理は実施例 1の場合と同様である（S404〜S406)。そして、予測残差復号部 404によって予測残差が復号され、視差補償部 406において予測残差に対して予測画像が足され (S408) 、 N X Nブロックの復号画像が生成される。

[0079] インデックス blkに 1を加算し（S409)、これが総ブロック数 maxBlkになるまで繰り返すことにより（S410)、カメラ Cの 1フレーム分の画像が復号されることになる。

[0080] 以上説明した実施例における参照画像インデックスと、動き補償を用いるカゝ視差補償を用いるかの情報、参照画像、視差パラメータ数情報との対応づけは、もちろん一例であり、本発明の実施においてこの対応づけ方法は、任意に定めることができる設計的事項である。

[0081] 以上の映像符号ィ匕及び映像復号の処理は、コンピュータとソフトウェアプログラムとによって実現することができ、そのプログラムをコンピュータ読み取り可能な記憶媒体に記録して提供することも、ネットワークを通して提供することも可能である。

産業上の利用可能性

[0082] 多視点動画像の符号ィ匕における視差補償において、カメラパラメータの測定誤差や参照画像の符号ィヒ歪によってェピポーラ幾何拘束に従った予測では予測効率が悪い場合には、視差情報のノメータ数を増やして自由度の高い予測を、ェピポーラ幾何拘束に従っても予測効率が良い場合には、 1パラメータで視差を表現した予測を、フレームやブロック単位で復号画像の特性に応じて適応的に制御することが可能となり、従来よりも高い符号化効率を実現することが可能となる。

Claims

請求の範囲

[1] 複数の映像を一つの映像として符号ィ匕するにあたり、複数の映像間の視差を用いて予測する視差補償により符号ィ匕する映像符号ィ匕方法であって、

前記視差補償に利用する、各参照画像に対する視差情報のパラメータ数を選択し設定する視差パラメータ数設定ステップと、

前記視差パラメータ数設定ステップにより設定されたパラメータ数の情報を符号ィ匕する視差パラメータ数情報符号化ステップと、

前記パラメータ数に応じた視差情報を符号化する視差情報符号化ステップと、を有することを特徴とする映像符号化方法。

[2] 請求項 1に記載の映像符号ィ匕方法にぉ、て、

前記視差補償に用いる前記各参照画像を選択し設定する参照画像設定ステップと前記視差補償で用いられる参照画像があらかじめ対応づけられている複数の参照画像インデックスの中から、前記参照画像設定ステップにより設定された参照画像に対応する参照画像インデックスを決定し、その参照画像インデックスを符号化する参照画像インデックス符号化ステップと、

を更に有することを特徴とする映像符号化方法。

[3] 複数の映像を一つの映像として符号ィ匕するにあたり、複数の映像間の視差を用いて予測する視差補償により符号ィ匕する映像符号ィ匕方法であって、

前記視差補償に利用する視差情報のパラメータ数を選択し視差補償を行う視差補償ステップと、

前記視差補償に用いる参照画像を選択し設定する参照画像設定ステップと、前記視差補償で用いられる参照画像及び視差情報のパラメータ数があらかじめ対応づけられて、る複数の参照画像インデックスの中から、前記視差補償ステップにおいて選択されたパラメータ数及び前記参照画像設定ステップにより設定された参照画像に対応する参照画像インデックスを決定し、その参照画像インデックスを符号化する参照画像インデックス符号化ステップと、

[4] 複数の映像を一つの映像として復号するにあたり、複数の映像間の視差を用いて予測する視差補償により復号する映像復号方法であって、

符号ィヒ情報に含まれる、各参照画像に対する視差情報のパラメータ数を指定する視差パラメータ数情報を復号する視差パラメータ数情報復号ステップと、

符号化情報に含まれる前記パラメータ数に応じた視差情報を復号する視差情報復号ステップと、

前記復号した視差情報を用いて前記視差補償を行う視差補償ステップと、を有することを特徴とする映像復号方法。

[5] 請求項 4に記載の映像復号方法において、

前記視差補償で用いられる参照画像があらかじめ対応づけられている複数の参照画像インデックスの中の一つである、前記符号ィ匕情報に含まれる参照画像インデックスを復号する参照画像インデックス復号ステップを更に有し、

前記視差補償ステップでは、復号した前記参照画像インデックスによって示される参照画像を用いて視差補償を行う

ことを特徴とする映像復号方法。

[6] 複数の映像を一つの映像として復号するにあたり、複数の映像間の視差を用いて予測する視差補償により復号する映像復号方法であって、

前記視差補償で用いられる参照画像及び視差情報のパラメータ数があらかじめ対応づけられている複数の参照画像インデックスの中の一つである、符号ィ匕情報に含まれる参照画像インデックスを復号する参照画像インデックス復号ステップと、前記参照画像インデックスによって示されるパラメータ数に応じた、前記符号化情報に含まれる視差情報を復号する視差情報復号ステップと、

前記復号した視差情報と、前記復号した参照画像インデックスによって示される参照画像とを用いて視差補償を行う視差補償ステップと、

を有することを特徴とする映像復号方法。

[7] 複数の映像を一つの映像として符号ィ匕するにあたり、複数の映像間の視差を用いて予測する視差補償により符号ィ匕する映像符号ィ匕装置であって、前記視差補償に利用する、各参照画像に対する視差情報のパラメータ数を選択し設定する視差パラメータ数設定手段と、

前記視差パラメータ数設定手段により設定されたパラメータ数の情報を符号ィ匕する視差パラメータ数情報符号化手段と、

前記パラメータ数に応じた視差情報を符号化する視差情報符号化手段と、を備えることを特徴とする映像符号ィ匕装置。

[8] 複数の映像を一つの映像として符号ィ匕するにあたり、複数の映像間の視差を用いて予測する視差補償により符号ィ匕する映像符号ィ匕装置であって、

前記視差補償に利用する視差情報のパラメータ数を選択し視差補償を行う視差補償手段と、

前記視差補償に用いる参照画像を選択し設定する参照画像設定手段と、前記視差補償で用いられる参照画像及び視差情報のパラメータ数があらかじめ対応づけられている複数の参照画像インデックスの中から、前記視差補償手段において選択されたパラメータ数及び前記参照画像設定手段により設定された参照画像に対応する参照画像インデックスを決定し、その参照画像インデックスを符号化する参照画像インデックス符号化手段と、

[9] 複数の映像を一つの映像として復号するにあたり、複数の映像間の視差を用いて予測する視差補償により復号する映像復号装置であって、

符号ィヒ情報に含まれる、各参照画像に対する視差情報のパラメータ数を指定する視差パラメータ数情報を復号する視差パラメータ数情報復号手段と、

符号化情報に含まれる前記パラメータ数に応じた視差情報を復号する視差情報復号手段と、

前記復号した視差情報を用いて前記視差補償を行う視差補償手段と、を備えることを特徴とする映像復号装置。

[10] 複数の映像を一つの映像として復号するにあたり、複数の映像間の視差を用いて予測する視差補償により復号する映像復号装置であって、前記視差補償で用いられる参照画像及び視差情報のパラメータ数があらかじめ対応づけられている複数の参照画像インデックスの中の一つである、符号ィ匕情報に含まれる参照画像インデックスを復号する参照画像インデックス復号手段と、

前記参照画像インデックスによって示されるパラメータ数に応じた、前記符号化情報に含まれる視差情報を復号する視差情報復号手段と、

前記復号した視差情報と、前記復号した参照画像インデックスによって示される参照画像とを用いて視差補償を行う視差補償手段と、

を備えることを特徴とする映像復号装置。

[11] 請求項 1、請求項 2及び請求項 3のいずれかに記載の映像符号ィ匕方法を、コンビュータに実行させるための映像符号ィ匕プログラム。

[12] 請求項 4、請求項 5及び請求項 6のヽずれかに記載の映像復号方法を、コンビユータに実行させるための映像復号プログラム。

[13] 請求項 1、請求項 2及び請求項 3の、ずれかに記載の映像符号ィ匕方法を、コンビュータに実行させるための映像符号ィ匕プログラムを記録したコンピュータ読み取り可能な記憶媒体。

[14] 請求項 4、請求項 5及び請求項 6のヽずれかに記載の映像復号方法を、コンビユータに実行させるための映像復号プログラムを記録したコンピュータ読み取り可能な記憶媒体。