JP5234586B2 - 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体 - Google Patents

映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体 Download PDF

Info

Publication number
JP5234586B2
JP5234586B2 JP2007552992A JP2007552992A JP5234586B2 JP 5234586 B2 JP5234586 B2 JP 5234586B2 JP 2007552992 A JP2007552992 A JP 2007552992A JP 2007552992 A JP2007552992 A JP 2007552992A JP 5234586 B2 JP5234586 B2 JP 5234586B2
Authority
JP
Japan
Prior art keywords
parallax
information
encoding
disparity
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007552992A
Other languages
English (en)
Other versions
JPWO2007077942A1 (ja
Inventor
正樹 北原
英明 木全
信哉 志水
一人 上倉
由幸 八島
正幸 谷本
俊彰 藤井
健詞 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nagoya University NUC
Nippon Telegraph and Telephone Corp
Tokai National Higher Education and Research System NUC
Original Assignee
Nagoya University NUC
Nippon Telegraph and Telephone Corp
Tokai National Higher Education and Research System NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=38228291&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP5234586(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Nagoya University NUC, Nippon Telegraph and Telephone Corp, Tokai National Higher Education and Research System NUC filed Critical Nagoya University NUC
Priority to JP2007552992A priority Critical patent/JP5234586B2/ja
Publication of JPWO2007077942A1 publication Critical patent/JPWO2007077942A1/ja
Application granted granted Critical
Publication of JP5234586B2 publication Critical patent/JP5234586B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/122Improving the 3D impression of stereoscopic images by modifying image signal contents, e.g. by filtering or adding monoscopic depth cues
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Description

本発明は、多視点動画像の符号化及び復号に関する技術である。
本願は、2006年1月5日に出願された特願2006−000394号に基づき優先権を主張し、その内容をここに援用する。
多視点動画像は、様々な位置にあるカメラで同じ被写体と背景を撮影した複数の動画像である。以下では、一つのカメラで撮影された動画像を“2次元動画像”と呼び、同じ被写体と背景を撮影した2次元動画像の集合を多視点動画像と呼ぶ。多視点動画像に含まれる各カメラの2次元動画像は、時間方向に強い相関がある。一方、各カメラが同期されていた場合、同じ時間に対応した各カメラのフレームは全く同じ状態の被写体と背景を撮影しているため、カメラ間で強い相関がある。
まず、2次元動画像の符号化方式に関する従来技術を述べる。国際符号化標準であるH.264、MPEG−4、MPEG−2をはじめとした従来の多くの2次元動画像符号化方式では、動き補償、直交変換、量子化、エントロピー符号化という技術を利用して、高効率な符号化を行う。例えば、H.264では、Iフレームにおいてはフレーム内相関を利用して符号化が可能で、Pフレームでは過去の複数枚のフレームとのフレーム間相関を利用して符号化が可能で、Bフレームでは過去あるいは未来の複数毎のフレームとのフレーム間相関を利用して符号化が可能である。
H.264の技術の詳細については、下記の非特許文献1に記載されているが、以下で概要を説明する。Iフレームではフレームをブロック分割し(このブロックをマクロブロックといい、ブロックサイズは16×16(ピクセル)である)、各マクロブロックにおいてイントラ予測を行う。イントラ予測の際には、各マクロブロックをさらに小さなブロックに分割し(以後、サブブロックと呼ぶ)、各サブブロックで異なるイントラ予測方法を行うことができる。
一方、Pフレームでは、各マクロブロックでイントラ予測、あるいはインター予測を行うことができる。Pフレームにおけるイントラ予測は、Iフレームの場合と同様である。一方、インター予測の際には動き補償が行われる。動き補償においても、マクロブロックをより小さなブロックに分割して、各サブブロックで異なる動きベクトル、参照画像を持つことができる。
なお、Bフレームにおいても、イントラ予測とインター予測が行えるが、Bフレームでのインター予測では、過去のフレームに加えて未来のフレームも動き補償の参照画像にできる。例えば、Iフレーム→Bフレーム→Bフレーム→Pフレームというフレーム構成で符号化する場合、I→P→B→Bの順番で符号化することができる。そして、Bフレームでは、I及びPフレームを参照して動き補償ができる。また、Pフレームの場合と同様でマクロブロックを分割したサブブロックごとに異なる動きベクトルを持つことができる。
イントラ、インター予測を行うと予測残差が得られるが、各マクロブロックで予測残差ブロックにDCT(離散コサイン変換)を行って量子化が行われる。そして、このようにして得られるDCT係数の量子化値に対して可変長符号化が行われる。なお、Pフレーム及びBフレームでは、サブブロックごとに参照画像を選択可能であるが、参照画像は参照画像インデックスと呼ばれる数値で表され、可変長符号化される。H.264では、参照画像インデックスの値が小さいほど短い符号で可変長符号化されるため、フレームごとに参照画像インデックスを明示的に変更する仕組みを採用している。この機能により、使用頻度の高い参照画像ほど参照画像インデックスの値を小さく設定することで、参照画像インデックスを効率的に符号化できる。
多視点動画像の符号化については、動き補償を同じ時刻の異なるカメラの画像に適用した“視差補償”によって高効率に多視点動画像を符号化する方式が従来からある。ここで、視差とは、異なる位置に配置されたカメラの画像平面上で、被写体上の同じ位置が投影される位置の差である。
このカメラ間で生じる視差の概念図を図13に示す。この概念図では、光軸が平行なカメラの画像平面を垂直に見下ろしたものとなっている。このように、異なるカメラの画像平面上で被写体上の同じ位置が投影される位置は、一般的に対応点と呼ばれる。視差補償では、符号化対象カメラの画像上のある着目画素に対応する参照先のカメラの画像上の対応点を参照画像から推定し、当該対応点に対応した画素値で、着目画素の画素値を予測する。以下では、便宜上、前述のような“推定された視差”についても“視差”と呼ぶこととする。このような方式では、視差情報と予測残差を符号化する。
また、多くの手法では、視差を画像平面上でのベクトル(視差ベクトル)として表現する。例えば、非特許文献2の手法では、ブロック単位で視差補償を行う仕組みが含まれているが、ブロック単位の視差を2次元ベクトルで、すなわち2つのパラメータ(x成分及びy成分)で表現する。この視差ベクトルの概念図を図14に示す。即ち、この手法では、2パラメータで構成される視差情報と予測残差を符号化する。なお、この方法では、カメラパラメータを利用して符号化を行わないため、カメラパラメータが未知である場合に有効である。
一方、非特許文献3には、多視点画像(静止画像)の符号化方法が記載されているが、この方法ではカメラパラメータを符号化に利用し、エピポーラ幾何拘束に基づき視差ベクトルを1次元の情報として表現することにより、多視点画像を効率的に符号化する。
エピポーラ幾何拘束の概念図を図15に示す。エピポーラ幾何拘束によれば、2台のカメラ(カメラ1とカメラ2)による2枚の画像において、被写体上の位置Mに関する片方の画像上の点mに対応するもう片方の画像上の点m’は、エピポーラ線という直線上に拘束される。非特許文献3の手法では、一次元のエピポーラ線上での位置という一つのパラメータで参照画像に対する視差を表現する。すなわち、この手法では、一つのパラメータで表現された視差情報と予測残差を符号化する。
なお、参照画像の枚数が2枚以上(各々は異なるカメラの参照画像である)であっても、エピポーラ幾何拘束を利用して一つのパラメータで各参照画像への視差を表現できる。例えば一つの参照画像に対するエピポーラ線上の視差が既知であれば、他のカメラに関する参照画像に対する視差も復元できる。
また、各々が異なるカメラからのものである参照画像が複数ある場合、任意視点画像技術を利用して視差補償を行うことが可能である。非特許文献4では、任意視点画像生成技術を利用して視差補償をする。具体的には、符号化対象カメラの画像の画素値を、当該画素に対応した異なるカメラの対応点の画素値で補間して予測する。この補間の概念図を図16に示す。この補間では、符号化対象画像の画素mの値を、画素mに対応する参照画像1、2の画素m′、m″の値を補間することにより予想する。
ITU-T Rec.H.264/ISO/IEC 11496-10, "Advanced Video Coding", Final Committee Draft, Document JVT-E022, September 2002 Hideaki Kimata and Masaki Kitahara, "Preliminary results on multiple view video coding (3DAV)", document M10976 MPEG Redmond Meeting, July, 2004 畑幸一, 栄藤稔, 千原國宏: 多視点画像の高能率符号化, 電子情報通信学会論文誌, Vol.J82-D-II, No.11, pp.1921-1929 (1999) Masayuki Tanimoto, Toshiaki Fujii, "Response to Call for Evidence on Multi-View Video Coding", document Mxxxxx MPEG Hong Kong Meeting, January, 2005
従来の多視点動画像の符号化手法によれば、カメラパラメータが既知である場合、エピポーラ幾何拘束を利用して、参照画像の数にかかわらず、各参照画像に対する視差情報を一つのパラメータで表現できることにより、視差情報を効率的に符号化することが可能である。
しかしながら、実カメラで取得された多視点動画像を符号化対象とすると、カメラパラメータの測定誤差などにより、視差をエピポーラ線上に拘束して視差補償をすると、予測効率が悪化する場合がある。また、参照画像は符号化歪が混入した画像であるため、同様にエピポーラ線上に拘束して視差補償をすると、予測効率が悪化する場合がある。予測効率が悪化すると予測残差の符号量の増加を招き、結果として全体の符号化効率が悪化してしまう。
本発明は、上記問題点の解決を図り、多視点動画像の符号化において、参照画像の性質に応じて視差補償の自由度を制御し、参照画像の符号化歪やカメラパラメータの測定誤差が存在する場合にも、視差補償の精度を向上させ、従来よりも高い符号化効率を実現することを目的とする。
本発明が従来技術ともっとも異なる点は、参照画像の性質に応じて視差補償の自由度を制御可能にするため、視差情報のパラメータ数を可変にし、そのパラメータ数を示す視差パラメータ数情報またはインデックス情報を符号化して符号化情報に含ませる点である。
インデックス情報として、視差情報のパラメータ数の他に視差補償に用いる参照画像を示す情報を含ませることができ、またさらに他の情報を含ませることもできる。
具体的には、本発明による映像符号化方法、映像復号方法の第1の態様では、映像情報の性質に応じて、視差補償に用いる視差情報のパラメータ数を指定する視差パラメータ数を符号化、復号する処理を実行する。
ここで、視差パラメータ数情報は、例えば各参照画像に対する視差ベクトルの次元を指定するものである。例えば参照画像の枚数が2枚(参照画像A、B)であった場合、以下のような構成が考えられる。
・pNum=0:参照画像A、Bのいずれに対する視差ベクトルも1次元
・pNum=1:参照画像Aに対する視差ベクトルは1次元、参照画像Bに対する視差ベクトルは2次元
・pNum=2:参照画像Aに対する視差ベクトルは2次元、参照画像Bに対する視差ベクトルは1次元
・pNum=3:参照画像A、Bのいずれに対する視差ベクトルも2次元

上記のインデックス情報pNumが視差パラメータ数情報として定義できる。
まず、映像符号化側では視差パラメータ数設定ステップで視差情報を表現するためのパラメータ数を設定する。そして、視差パラメータ数設定ステップで設定されたパラメータ数に関する情報である視差パラメータ数情報を、視差パラメータ数情報符号化ステップで符号化する。そして、視差パラメータ数設定ステップで設定されたパラメータ数で表現される視差情報を、視差情報符号化ステップで符号化する。
一方、映像復号側では、視差パラメータ数情報復号ステップにおいて視差パラメータ数情報をまず復号する。そして、復号した視差パラメータ数情報で指定されるパラメータ数の視差情報を、視差情報復号ステップで復号する。
本発明による映像符号化方法、映像復号方法の第2の態様では、参照画像インデックスに対して視差補償に利用可能な参照画像が割り振られている。例えば視差補償の予測画像生成の際には2枚の参照画像を利用し、参照画像メモリに使用可能な参照画像が3枚(A、B、C)あった場合、以下のような割り当て例が考えられる。
・refIdx=0:参照画像AとB
・refIdx=1:参照画像BとC
・refIdx=2:参照画像AとC

ここで、refIdxは参照画像インデックスである。上記に加え、符号化対象カメラの復号画像に対応付けた参照画像インデックスを設定しても良い。
映像符号化側では、上記第1の態様における処理に加え、視差補償に用いる参照画像を設定する参照画像設定ステップ、参照画像インデックスを符号化する参照画像インデックス符号化ステップを実行する。一方、復号側では、参照画像インデックスを復号するステップを有する。
前述のようなH.264の参照画像インデックスの順序変更の仕組みと組み合わせれば、動画像の性質に応じて、高品質な予測画像が生成可能な参照画像に対して参照画像インデックスとして小さな値が設定されるようにして、符号化効率を向上させることができる。
本発明による映像符号化方法、映像復号方法の第3の態様では、参照画像インデックスに対して利用可能な視差パラメータ数情報が対応付けられている。例えば視差補償の予測画像生成の際には2枚の参照画像を利用し、参照画像メモリに使用可能な参照画像が3枚(A、B、C)あり、視差パラメータ数情報pNumは2通り(pNum=0,1)あった場合、以下のような割り当て例が考えられる。
・refIdx=0:参照画像AとB、pNum=0
・refIdx=1:参照画像AとB、pNum=1
・refIdx=2:参照画像BとC、pNum=0
・refIdx=3:参照画像BとC、pNum=1
・refIdx=4:参照画像AとC、pNum=0
・refIdx=5:参照画像AとC、pNum=1

この場合、映像符号化側では参照画像インデックスを符号化する参照画像インデックス符号化ステップを実行するが、視差パラメータ数情報は当該ステップで符号化されることとなる。一方、映像復号側では参照画像インデックスを復号する参照画像インデックス復号ステップを実行するが、視差パラメータ数情報は当該ステップで復号されることとなる。
前述のようなH.264の参照画像インデックスの順序変更の仕組みと組み合わせれば、動画像の性質に応じて視差パラメータ数情報に割り当てられる可変長符号の符号長を変更でき、視差パラメータ数情報を効率的に符号化できる。
多視点動画像の符号化における視差補償において、カメラパラメータの測定誤差や参照画像の符号化歪によってエピポーラ幾何拘束に従った予測では予測効率が悪い場合には、視差情報のパラメータ数を増やして自由度の高い予測を、エピポーラ幾何拘束に従っても予測効率が良い場合には、1パラメータで視差を表現した予測を、フレームやブロック単位で復号画像の特性に応じて適応的に制御することが可能となり、従来よりも高い符号化効率を実現することが可能となる。
本発明における実施例1の映像符号化装置を示す図である。 実施例1におけるカメラの参照関係を示す図である。 実施例1におけるカメラ配置を示す図である。 実施例1における符号化フローチャートである。 実施例1の映像復号装置を示す図である。 実施例1における復号フローチャートである。 本発明における実施例2におけるカメラの参照関係を示す図である。 実施例2における映像符号化装置を示す図である。 実施例2における符号化フローチャートである。 図9のステップS304の処理に関する詳細フローチャートである。 実施例2の映像復号装置を示す図である。 実施例2における映像復号フローチャートである。 カメラ間で生じる視差の概念図である。 視差ベクトルの概念図である。 エピポーラ幾何拘束の概念図である。 画素値補間の概念図である。
符号の説明
100、300 映像符号化装置
101、301 画像入力部
102、302 参照画像入力部
103、205、303、405 参照画像メモリ
104 視差パラメータ数設定部
105 視差パラメータ数情報符号化部
106、309 視差情報符号化部
107、310 予測残差符号化部
200、400 映像復号装置
201 視差パラメータ数情報復号部
202、402 視差情報復号部
203、404 予測残差復号部
204、304、406 視差補償部
305、407 動き補償部
306 参照画像設定部
307 参照画像インデックス符号化部
308 動き情報符号化部
311 ローカル復号部
401 参照画像インデックス復号部
403 動き情報復号部
〔実施例1〕
まず、第1の実施例(以下、実施例1)について説明する。本発明の実施例1に係る映像符号化装置の構成図を図1に示す。
この映像符号化装置100は、符号化対象画像であるカメラCの原画像を入力する画像入力部101、参照画像であるカメラAとBの復号画像を入力する参照画像入力部102、参照画像を格納する参照画像メモリ103、視差補償に利用する視差情報を表現するパラメータ数を設定する視差パラメータ数設定部104、視差パラメータ数情報を符号化する視差パラメータ数情報符号化部105、視差情報を符号化する視差情報符号化部106、視差補償で生じた残差信号を符号化する予測残差符号化部107を備える。
図2は、実施例1におけるカメラの参照関係を示す図である。
本実施例では、図2に示すように、3つのカメラに関する多視点映像を符号化するにあたり、カメラAとBの復号画像を参照画像としてカメラCの動画像を符号化する場合を示す。
図中の矢印は視差補償の際の参照関係を示しており、カメラCの画像を符号化する際には、表示時刻において同時刻であるカメラAとBの復号画像を参照画像として符号化する。その際には、カメラA及びBの対応点に関する画素値の平均値で予測画像を作成するものとする。
図3は、実施例1におけるカメラ配置を示す図である。本実施例では、3つのカメラの視点位置は直線上に等間隔に並んでおり、光軸はカメラが並ぶ直線に対して垂直となっているとする。すなわち、3つのカメラの光軸は平行であるとする。
また、画像平面のxy座標系はカメラが並ぶ直線に対する平行移動(回転等はなし)により得られ、各々のカメラで画像平面のx軸及びy軸を等間隔に分割することで画素が構成されているとする。すなわち、解像度が各カメラで同じであり、なおかつ、カメラCとカメラAのP画素分の視差はカメラCとカメラBでP画素の視差となることになる。
実施例1における符号化のフローを図4に示す。
このフローチャートは、カメラCの一つの画像を符号化する際に行う処理を示しており、各画像についてこの処理を繰り返すことにより動画像符号化が行われるとする。
そして、本実施例では、視差情報の表現方法として、カメラAに対するエピポーラ線上の位置を一つのパラメータで表現した視差情報でカメラAとBの各々の参照画像に対する視差を表現する場合(インデックスpNumの値が0)と、カメラAとBの各々の参照画像に対する視差をそれぞれ2次元ベクトルで表現し、合計4パラメータで視差情報を表現する場合(インデックスpNumの値が1)の二つを適応的に切り替えて視差補償することとする。なお、pNumは視差パラメータ数情報を表すインデックスである。
また、視差パラメータ数の切り替えは画像を分割して得られる縦横それぞれN画素(N×N)のブロック単位で行うとする。すなわち、各N×Nブロックに対して1つ(pNum =0)もしくは4つ(pNum =1)のパラメータを視差情報として符号化する。
このような前提の下で図4のフローに沿って符号化処理を説明する。
まず、画像入力部101によりカメラCの画像が入力される(ステップS101)。なお、ここで入力されたカメラCの画像と表示時刻が同じであるカメラAとBの復号画像が、参照画像メモリ103に参照画像入力部102により入力されている。
このフローでは、画像を分割して得られる個々のN×Nブロックを示すインデックスをblk と表し、一つの画像に対する総ブロック数をmaxBlkと表す。
N×Nブロックのインデックスblk を0に初期化した後(S102)、以下の処理(S103〜S116)を、インデックスblk に1を加算しながら(S115)、インデックスblk が総ブロック数maxBlkになるまで(S116)、各N×Nブロックに対して繰り返して実行する。
まず、視差パラメータ数設定部104において、画像Cのインデックスblk に対応した符号化対象ブロックが読み込まれ、参照画像メモリ103からカメラAとBに対応した参照画像が読み込まれる。そして、同じく視差パラメータ数設定部104において、pNum=0及びpNum=1について視差探索の処理が行われる(S104〜S106)。
なお、視差の探索は、視差補償による予測残差のN×Nブロックに関する絶対値の総和SADと視差情報の符号量の見積もり値であるRdispに基づいて求められるレート歪コストcostを最小化するように行われる。ここで、costは次式で計算される。
cost=SAD+λRdisp (1)

ここで、λはラグランジュの未定乗数であり、予め設定された値が利用される。また、Rdispを求めるには、視差情報に可変長符号化を施して符号量を求める。
pNum=0及びpNum=1について、costの最小値pCost 及びpCost を実現する視差情報を求め、よりpCost が小さい視差情報を符号化に採用する(S107〜S110)。図4のフローにおけるminPCostは、pCost の最小値を格納するための変数であり、ブロックblk を処理する際にpCost が取りうる最大の値より大きい任意の値(maxPCost)に設定され、初期化される。
pNum=0の場合は、ステップS105において、次の処理が行われる。
予め設定された範囲において視差を探索する。本実施例のカメラ配置では、エピポーラ幾何拘束に従うと、カメラCのピクセル(x、y)に対する視差は、カメラAについては(x+dx 、y)、(ただし、dx ≧0)となり、カメラBに対しては(x−dx 、y)となる。ただし、縦横Iピクセルの画像平面上の座標系は、左上のピクセルを(0、0)とし、右上を(I−1、0)、左下を(0、I−1)とするものである。本実施例ではdx =0〜Pの範囲を探索範囲とすることにする。従い、dx =0〜Pについて、次式でSAD[dx] を計算する。
SAD[dx ] =Σi Σj ABS( DECA [x+i+dx, y+j]/2 + DECB [x+i+dx, y+j]/2 − IMGc [x+i, y+j] ) (2)

ただし、Σi は、iが0からN−1までの総和、Σj は、jが0からN−1までの総和を表す。ABS( )は括弧内の絶対値を取るものであり、 DECA [x,y] と DECB [x,y] は、それぞれカメラA及びBの復号画像の(x、y)ピクセルの輝度値を表し、 IMGc [x,y] は、カメラCの原画像の(x、y)ピクセルの輝度値を表す。また、(x、y)はN×Nブロックの左上のピクセルの画像平面内での座標であるとする。
さらに、視差がdx であるときの視差情報の符号量見積もり値Rdisp[ dx ] を求め、数式1により視差dx に対するレート歪コスト cost[dx ] を求める。求めた cost[dx ] を最小にした視差を bestDispPNum0、及びその際のコストをpCost とする。
そして、minPCost←pCost とし、最適なpNumを格納するbestPNumには0を代入してpNum=1の場合の処理に移る(S107〜S110)。
pNum=1の場合は、ステップS106において、次の処理が行われる。
pNum=1の場合には、エピポーラ幾何拘束を考慮せず、2次元で視差の探索を行う。具体的には、カメラA及びカメラBのぞれぞれに関するx軸上の探索範囲をdx,A , dx,B =−P〜P(dx,A ,dx,B のそれぞれにおいて「−P〜P」の範囲)とし、y軸上の探索範囲をdy,A , dy,B =−P〜P(dy,A , dy,Bのそれぞれにおいて「−P〜P」の範囲)とする。そして、全ての (dx,A , dx,B , dy,A , dy,B ) の組み合わせについて、次式のSAD[dx,A,x,B,y,A,y,B ] を求める。
SAD[dx,A,x,B,y,A,y,B ] =Σi Σj ABS( DECA [ x+i+dx,A , y+j+dy,A ]/2 + DECB [ x+i+dx,B , y+j+dy,B ]/2 − IMGc [x+i, y+j] ) (3)

さらに、視差が(dx,A,x,B,y,A,y,B )であるときの視差情報の符号量見積もり値Rdisp [dx,A,x,B,y,A,y,B ] を求め、数式1により視差dx に対するレート歪コスト cost[dx,A,x,B,y,A,y,B ] を求める。そして、 cost[dx,A,x,B,y,A,y,B ] を最小にした視差をbestDispPNum1 、及びその際のコストをpCost とする。
そして、pCost <minPCostであれば(S107)、 minPCost ←pCost とし、最適なpNumを格納するbestPNumには1を代入する(S108)。
次に、視差パラメータ数情報符号化部105において、bestPNumが可変長符号化される(S111)。また、視差情報符号化部106において、視差情報が符号化される。bestPNumが0の場合には、dx が可変長符号化され、bestPNumが1の場合には、(dx,A,x,B,y,A,y,B )が可変長符号化される。最後に、予測残差符号化部107において、予測残差が符号化される(S112〜S114)。
次に、実施例1の映像復号装置を図5に示す。映像復号装置200は、視差パラメータ数情報を復号する視差パラメータ数情報復号部201と、視差パラメータ数情報に応じた視差情報を復号する視差情報復号部202と、予測残差を復号する予測残差復号部203と、視差補償部204と、参照画像メモリ205とを備える。
図6に本実施例の復号フローを示す。これはカメラCを1フレーム復号する上でのフローを示している。以下でフローを詳細に説明していく。
N×Nブロックのインデックスblk を0に初期化した後(S201)、以下のステップS202〜S208の処理を各N×Nブロックに対して、1フレーム分繰り返すことにより(1フレームのブロック数はmaxBlk)、カメラCの1フレームが復号される。なお、カメラAとBの同時刻のフレームが先立って復号されているとし、その復号画像が参照画像メモリ205に蓄積されているものとする。
まず、視差パラメータ数情報復号部201により、視差パラメータ数情報bestPNumが復号される(S202)。bestPNumの値に応じて(S203)、以下の処理が行われる。
bestPNum=0の場合、視差情報復号部202において、視差情報dx が復号される。視差補償部204に視差パラメータ数情報bestPNumと視差情報dx が入力され、参照画像メモリ205から視差情報dxに対応したカメラAとBのN×Nブロックが入力される。そして、符号化対象のN×Nブロックのピクセルの位置を(x、y)と表すと、次式により予測画像PRED[x+i, y+j]が生成される(S204)。
PRED[x+i, y+j]= DECA [ x+i+dx , y+j]/2 + DECB [ x+i+dx , y+j]/2 (4)

ただし、i=0,1,..,N-1及びj=0,1,..,N-1である。
bestPNum=1の場合、視差情報復号部202において、視差情報(dx,A,dx,B,dy,A,dy,B)が復号される。視差補償部204に視差パラメータ数情報bestPNumと視差情報(dx,A,dx,B,dy,A,dy,B)が入力され、参照画像メモリ205から視差情報(dx,A,dx,B,dy,A,dy,B)に対応したカメラAとBのN×Nブロックが入力される。そして、符号化対象のN×Nブロックのピクセルの位置を(x、y)と表すと、次式により予測画像PRED[x+i,y+j]が生成される(S205)。
PRED[x+i, y+j]= DECA [ x+i+dx,A , y+j+dy,A ]/2 + DECB [ x+i+dx,B , y+j+dy,B ]/2 (5)

ただし、i=0,1,..,N-1及びj=0,1,..,N-1である。
次に、符号化された予測残差が入力された予測残差復号部203において、N×Nの予測残差ブロックRES[x+i, y+j] が復号される。そして予測残差ブロックは視差補償部204に入力され、次式のように予測画像との和が計算され、復号画像 DECc [x+i, y+j]が求められる(S206)。
DECc [x+i, y+j]= RES[x+i, y+j]+PRED[x+i, y+j] (6)

以上の処理をインデックスblk に1を加算しながら(S207)、blk が1フレームのブロック数maxBlkになるまで繰り返し行うことにより、カメラCに関する復号画像を得ることができる。
〔実施例2〕
次に、第2の実施例(以下、実施例2)について説明する。
本実施例では、図7のカメラの参照関係のように、5つのカメラに関する多視点映像を符号化するにあたり、カメラA、B、D、Eの復号画像を参照画像として、カメラCの動画像を符号化する場合を示す。
前述した実施例1では、カメラCの画像は視差補償のみを利用して符号化していたが、本実施例では、動き補償と視差補償をブロック単位で切り替えて実行することで符号化を行う。そして、図中の矢印は視差/動き補償の際の参照関係を示している。
視差補償の際には、カメラA、B、D、Eにおいて設定する2台のカメラの複数の対(AとB、AとD、BとEの3種類の対)により予測画像を生成するものとする。予測画像の生成方法は、実施例1と同様で、2台のカメラの対応点に関する画素値の平均値で予測画像を作成するものとする。
なお、本実施例では実施例1と同様に、5 つのカメラの視点位置は直線上に等間隔に並んでおり、光軸はカメラが並ぶ直線に対して垂直となっているとする。すなわち、図3の関係が5台のカメラにあり、各カメラの光軸は平行であるものとする。
実施例2における映像符号化装置の構成図を図8に示す。
この映像符号化装置300は、カメラCの原画像を入力する画像入力部301、カメラA、B、D、Eの復号画像を入力する参照画像入力部302、参照画像を格納する参照画像メモリ303、視差補償を行う視差補償部304、動き補償を行う動き補償部305、参照画像設定部306、参照画像インデックス符号化部307、動き情報符号化部308、視差情報符号化部309、予測残差符号化部310、ローカル復号部311を備える。
本実施例における符号化のフローを図9に示す。また、当該フロー中のステップS304に関する詳細フローを図10に示す。
このフローチャートは、カメラCの一つの画像を符号化する際に行う処理を示しており、各画像についてこの処理を繰り返すことにより動画像符号化が行われるとする。本実施例においては、N×Nのブロック単位で、以下の処理を適応的に切り替えて符号化することとする。
・カメラCの過去の復号画像を利用した動き補償: refIdx =0、1
・カメラAとBの参照画像を利用した視差補償(pNum=0): refIdx =2
・カメラAとBの参照画像を利用した視差補償(pNum=1): refIdx =3
・カメラAとDの参照画像を利用した視差補償(pNum=0): refIdx =4
・カメラAとDの参照画像を利用した視差補償(pNum=1): refIdx =5
・カメラBとEの参照画像を利用した視差補償(pNum=0): refIdx =6
・カメラBとEの参照画像を利用した視差補償(pNum=1): refIdx =7
ここで、refIdxは参照画像インデックスを示している。
また、refIdx=0、1については、refIdx=0は、カメラCの1フレーム前の復号画像に対応し、refIdx=1は、2フレーム前の復号画像に対応する。
本実施例では、符号化側では各ブロックで利用された手法及び参照画像に対応した参照画像インデックスを符号化し、復号側では参照画像インデックスにより各ブロックの画素値を復号する。
なお、上記の参照画像インデックスの割り当ては画像Cの3フレーム目以降を符号化する際のものであるとする。
1フレーム目においては、カメラCの復号画像はないので動き補償に関しては参照画像インデックスが割り当てられず、視差補償に関する参照画像インデックスについては上記の各値よりそれぞれ2小さい値(例えば「カメラAとBの参照画像を利用した視差補償(pNum=0)」ではrefldx=0)が割り当てられる。
一方、2フレーム目においては、動き補償に関する参照画像インデックスは、refldx=0のみであり、視差補償に関する参照画像インデックスについては上記の各値よりそれぞれ1小さい値(例えば「カメラAとBの参照画像を利用した視差補償(pNum=0)」ではrefldx=1)が割り当てられる。
このような前提の下で図9のフローに沿って符号化処理を説明する。ただし、この処理は、カメラCの3フレーム目以降の符号化処理であるとする。
画像入力部301によりカメラCの画像が入力される(S301)。なお、ここで入力されたカメラCの画像と表示時刻が同じであるカメラA、B、D、Eの復号画像が参照画像メモリ303に参照画像入力部302により入力されている。また、カメラCに関する1フレーム前、及び2フレーム前の復号画像がローカル復号部311によって復号され、参照画像メモリ303に入力されているとする。
画像を分割して得られる各N×Nブロックのインデックスをblk と表し、一つの画像に対する総ブロック数をmaxBlkと表す。N×Nブロックのインデックスblk を0に初期化した後(S302)、以下の処理(S303〜S312)を、インデックスblk に1を加算しながら(S311)、インデックスblk が総ブロック数maxBlkになるまで(S312)、各N×Nブロックに対して繰り返して実行する。
参照画像インデックスrefIdxを0に初期化し、コスト値refCost の最小値を格納する変数であるminRefCostを、ブロックblk を処理する際にrefCost が取りうる最大の値より大きい任意の値maxRefCostに初期化する(S303)。
インデックスblk が指す各N×Nブロックにおいて、各参照画像インデックスrefIdxに対応した予測処理を行う(S304)。その際には、各参照画像インデックスrefIdxに対応したコスト値refCost を算出し、refCost を最小にした参照画像インデックスbestRefIdxを、そのN×N
ブロックの符号化に採用する(S305、S306)。
以下に、ステップS304の各参照画像インデックスrefIdxに対応した処理を、図10のフローに従って説明する。なお、以下では動き補償もしくは視差補償が行われるが、どちらの場合においても、動き/視差情報は、以下の式で与えられるcostを最小化することで得られる。
cost=SAD+λRvec (7)

ここで、Rvec は動きもしくは視差情報の符号量の見積もり値であり、SADは予測残差の絶対値の総和である。
refIdxが2以上であった場合、視差補償に対応したrefIdxであり(S3041)、視差補償部304によって当該refIdxに対応した2台のカメラの復号画像が参照画像として読み込まれ、視差補償が行なわれる。
また、refIdxが2以上であった場合、refIdxは対応する視差パラメータ数情報pNum=0または1を有する。従い、pNum=0及び1の場合の視差補償処理を実施例1の場合と同様に行う。
すなわち、視差パラメータ数(pNum)が1の場合(S3042)、参照画像インデックスrefIdxに対応した2つの参照画像についてエピポーラ線上の視差を、レート歪コストを最小化するように探索し、最小コスト値をrefCost とする(S3043)。
また、視差パラメータ数が1でない場合(S3042)、参照画像インデックスrefIdxに対応した2つの参照画像について画像平面上の視差を、レート歪コストを最小化するように探索し、最小コスト値をrefCost とする(S3044)。
上記S3043、S3044の各々において、算出されたcostの最小値(refCost)に、参照画像インデックスrefIdxを符号化した際の符号量見積もり値を足し合わせた値がrefCost とされる。
refIdxが0もしくは1の場合は、動き補償に対応したrefIdxであり、ステップS3045に進む。この場合、動き補償部305によって当該refIdxの値に対応したカメラCの復号画像が参照画像として読み込まれ、動き補償が行われる。その際の動き情報は、数式7で算出されるcostを最小化することで行われる。そして、参照画像インデックスrefIdxを符号化した際の符号量見積もり値を、当該cost最小値に足しあわせた値をrefCost とする(S3045)。
算出されたrefCost が、現在の最小値を格納するminRefCostよりも小さい場合には(S305)、minRefCostにrefCost を格納し、そのときのrefIdxを、bestRefIdxとして記憶しておく(S306)。
以上の処理を、refIdxに1を加算しながら、refIdxがインデックスの総数maxRefNum になるまで繰り返す(S307、S308)。
上記の処理が各参照画像に対して行われたら、参照画像設定部306によってrefCost を最小にした参照画像インデックスbestRefIdxが求められ、符号化に利用される参照画像インデックスが決定する。
次に、bestRefIdxが参照画像インデックス符号化部307によって符号化され(S309)、動き情報もしくは視差情報が動き情報符号化部308もしくは視差情報符号化部309で符号化され、予測残差が予測残差符号化部310で符号化される(S310)。
インデックスblk に1を加算し(S311)、これが総ブロック数maxBlkになるまで繰り返すことにより(S312)、カメラCの1フレーム分の画像が符号化される。
次に、実施例2における映像復号装置を図11に示す。
映像復号装置400は、参照画像インデックスを復号する参照画像インデックス復号部401、視差情報を復号する視差情報復号部402、動き情報を復号する動き情報復号部403、予測残差を復号する予測残差復号部404、参照画像を格納する参照画像メモリ405、視差補償を行う視差補償部406、動き補償を行う動き補償部407を備える。
図12に本実施例の復号フローを示す。これはカメラCを1フレーム復号する上でのフローを示している。以下でフローを詳細に説明していく。
N×Nブロックのインデックスblk を0に初期化した後(S401)、以下の処理(S402〜S410)を、インデックスblk に1を加算しながら(S409)、インデックスblk が総ブロック数maxBlkになるまで(S410)、各N×Nブロックに対して繰り返して実行する。これにより、カメラCの1フレームが復号される。なお、カメラA、B、D、Eの同時刻のフレーム、及びカメラCの1フレーム前、2フレーム前の復号画像が参照画像メモリ405に蓄積されているものとする。
まず、参照画像インデックス復号部401により、参照画像インデックスbestRefIdxが復号される(S402)。参照画像インデックスbestRefIdxの値に応じて(S403、S404)、以下の処理が行われる。
もし、bestRefIdx=0もしくは1であれば、動き補償に対応した参照画像インデックスであり、動き情報復号部403により動き情報が復号される。そして、動き補償部407によりbestRefIdx=0もしくは1に対応した参照画像が読み込まれ、予測画像が生成される(S407)。
そして、予測残差復号部404によって予測残差が復号され、動き補償部407において予測残差に対して予測画像が足され(S408)、N×Nブロックの復号画像が生成される。
もし bestRefIdx が2以上であったら、視差補償に対応した参照画像インデックスであり、その参照画像インデックスbestRefIdxに対応した2台のカメラに関する参照画像が読み込まれ、視差補償による復号が行われる。
この参照画像インデックスbestRefIdxには、視差パラメータ数情報pNumの値も対応付けられているため、pNumに応じた処理が行われる。視差補償の処理は実施例1の場合と同様である(S404〜S406)。そして、予測残差復号部404によって予測残差が復号され、視差補償部406において予測残差に対して予測画像が足され(S408)、N×Nブロックの復号画像が生成される。
インデックスblk に1を加算し(S409)、これが総ブロック数maxBlkになるまで繰り返すことにより(S410)、カメラCの1フレーム分の画像が復号されることになる。
以上説明した実施例における参照画像インデックスと、動き補償を用いるか視差補償を用いるかの情報、参照画像、視差パラメータ数情報との対応づけは、もちろん一例であり、本発明の実施においてこの対応づけ方法は、任意に定めることができる設計的事項である。
以上の映像符号化及び映像復号の処理は、コンピュータとソフトウェアプログラムとによって実現することができ、そのプログラムをコンピュータ読み取り可能な記憶媒体に記録して提供することも、ネットワークを通して提供することも可能である。
多視点動画像の符号化における視差補償において、カメラパラメータの測定誤差や参照画像の符号化歪によってエピポーラ幾何拘束に従った予測では予測効率が悪い場合には、視差情報のパラメータ数を増やして自由度の高い予測を、エピポーラ幾何拘束に従っても予測効率が良い場合には、1パラメータで視差を表現した予測を、フレームやブロック単位で復号画像の特性に応じて適応的に制御することが可能となり、従来よりも高い符号化効率を実現することが可能となる。

Claims (20)

  1. 複数の映像を一つの映像として符号化するにあたり、複数の映像間の視差を用いて予測する視差補償により符号化する映像符号化方法であって、
    前記視差補償に利用する、各参照画像に対する視差情報のパラメータ数を選択し設定する視差パラメータ数設定ステップと、
    前記視差パラメータ数設定ステップにより設定されたパラメータ数の情報を符号化する視差パラメータ数情報符号化ステップと、
    前記パラメータ数に応じた視差情報を符号化する視差情報符号化ステップと、
    を有し
    前記視差パラメータ数設定ステップにおいて選択されるパラメータ数は、
    所定の視差情報から、各参照画像を撮影するカメラに関する参照画像へのそれぞれの視差を生成するモードを示す第1のパラメータ数と、
    各参照画像を撮影するカメラに関する参照画像へのそれぞれの視差を示す視差情報を用いるモードを示す第2のパラメータ数と、
    を含み、
    前記第1のパラメータ数が選択された場合には、生成された各カメラに関する参照画像への視差と、当該複数の参照画像の画素値に基づいて予測画像を生成するとともに、前記視差情報符号化ステップにおいては前記所定の視差情報のみが符号化され、
    前記第2のパラメータ数が選択された場合には、前記それぞれの視差を示す視差情報と、当該複数の参照画像の画素値に基づいて予測画像を生成するとともに、前記視差情報符号化ステップにおいては前記それぞれの視差を示す視差情報が符号化されることを特徴とする映像符号化方法。
  2. 複数の映像を一つの映像として復号するにあたり、複数の映像間の視差を用いて予測する視差補償により復号する映像復号方法であって、
    符号化情報に含まれる、各参照画像に対する視差情報のパラメータ数を指定する視差パラメータ数情報を復号する視差パラメータ数情報復号ステップと、
    符号化情報に含まれる前記パラメータ数に応じた視差情報を復号する視差情報復号ステップと、
    前記復号した視差情報を用いて前記視差補償を行う視差補償ステップと、
    を有し
    前記指定されるパラメータ数は、
    所定の視差情報から、各参照画像を撮影するカメラに関する参照画像へのそれぞれの視差を生成するモードを示す第1のパラメータ数と、
    各参照画像を撮影するカメラに関する参照画像へのそれぞれの視差を示す視差情報を用いるモードを示す第2のパラメータ数と、
    を含み、
    前記第1のパラメータ数が指定された場合には、前記視差情報復号ステップにおいては前記所定の視差情報のみを復号するとともに、生成された各カメラに関する参照画像への視差と、当該複数の参照画像の画素値に基づいて予測画像を生成し、
    前記第2のパラメータ数が選択された場合には、前記視差情報復号ステップにおいては前記それぞれの視差を示す視差情報を復号するとともに、前記それぞれの視差を示す視差情報と、当該複数の参照画像の画素値に基づいて予測画像を生成することを特徴とする映像復号方法。
  3. 複数の映像を一つの映像として符号化するにあたり、複数の映像間の視差を用いて予測する視差補償により符号化する映像符号化装置であって、
    前記視差補償に利用する、各参照画像に対する視差情報のパラメータ数を選択し設定する視差パラメータ数設定手段と、
    前記視差パラメータ数設定手段により設定されたパラメータ数の情報を符号化する視差パラメータ数情報符号化手段と、
    前記パラメータ数に応じた視差情報を符号化する視差情報符号化手段と、
    を備え
    前記視差パラメータ数設定手段が選択するパラメータ数は、
    所定の視差情報から、各参照画像を撮影するカメラに関する参照画像へのそれぞれの視差を生成するモードを示す第1のパラメータ数と、
    各参照画像を撮影するカメラに関する参照画像へのそれぞれの視差を示す視差情報を用いるモードを示す第2のパラメータ数と、
    を含み、
    前記第1のパラメータ数が選択された場合には、生成された各カメラに関する参照画像への視差と、当該複数の参照画像の画素値に基づいて予測画像を生成するとともに、前記視差情報符号化手段が前記所定の視差情報のみを符号化し、
    前記第2のパラメータ数が選択された場合には、前記それぞれの視差を示す視差情報と、当該複数の参照画像の画素値に基づいて予測画像を生成するとともに、前記視差情報符号化手段が前記それぞれの視差を示す視差情報を符号化することを特徴とする映像符号化装置。
  4. 複数の映像を一つの映像として復号するにあたり、複数の映像間の視差を用いて予測する視差補償により復号する映像復号装置であって、
    符号化情報に含まれる、各参照画像に対する視差情報のパラメータ数を指定する視差パラメータ数情報を復号する視差パラメータ数情報復号手段と、
    符号化情報に含まれる前記パラメータ数に応じた視差情報を復号する視差情報復号手段と、
    前記復号した視差情報を用いて前記視差補償を行う視差補償手段と、
    を備え
    前記指定されるパラメータ数は、
    所定の視差情報から、各参照画像を撮影するカメラに関する参照画像へのそれぞれの視差を生成するモードを示す第1のパラメータ数と、
    各参照画像を撮影するカメラに関する参照画像へのそれぞれの視差を示す視差情報を用いるモードを示す第2のパラメータ数と、
    を含み、
    前記第1のパラメータ数が指定された場合には、前記視差情報復号手段が前記所定の視差情報のみを復号するとともに、生成された各カメラに関する参照画像への視差と、当該複数の参照画像の画素値に基づいて予測画像を生成し、
    前記第2のパラメータ数が選択された場合には、前記視差情報復号手段が前記それぞれの視差を示す視差情報を復号するとともに、前記それぞれの視差を示す視差情報と、当該複数の参照画像の画素値に基づいて予測画像を生成することを特徴とする映像復号装置。
  5. 請求項に記載の映像符号化方法において、前記第1のパラメータ数が選択された場合の前記所定の視差情報は、所定の1つのカメラに対する視差情報であることを特徴とする映像符号化方法。
  6. 請求項に記載の映像符号化方法において、前記第2のパラメータ数が選択された場合の前記視差情報は、2次元ベクトルによる情報であることを特徴とする映像符号化方法。
  7. 請求項に記載の映像復号方法において、前記第1のパラメータ数が選択された場合の前記所定の視差情報は、所定の1つのカメラに対する視差情報であることを特徴とする映像復号方法。
  8. 請求項に記載の映像復号方法において、前記第2のパラメータ数が選択された場合の前記視差情報は、2次元ベクトルによる情報であることを特徴とする映像復号方法。
  9. 請求項に記載の映像符号化装置において、前記第1のパラメータ数が選択された場合の前記所定の視差情報は、所定の1つのカメラに対する視差情報であることを特徴とする映像符号化装置。
  10. 請求項に記載の映像符号化装置において、前記第2のパラメータ数が選択された場合の前記視差情報は、2次元ベクトルによる情報であることを特徴とする映像符号化装置。
  11. 請求項に記載の映像復号装置において、前記第1のパラメータ数が選択された場合の前記所定の視差情報は、所定の1つのカメラに対する視差情報であることを特徴とする映像復号装置。
  12. 請求項に記載の映像復号装置において、前記第2のパラメータ数が選択された場合の前記視差情報は、2次元ベクトルによる情報であることを特徴とする映像復号装置。
  13. 複数の映像を一つの映像として符号化するにあたり、複数の映像間の視差を用いて予測する視差補償により符号化する映像符号化方法であって、
    前記視差補償に利用する、各参照画像に対する視差情報のパラメータ数を選択し設定する視差パラメータ数設定ステップと、
    前記視差パラメータ数設定ステップにより設定されたパラメータ数の情報を符号化する視差パラメータ数情報符号化ステップと、
    前記パラメータ数に応じた視差情報を符号化する視差情報符号化ステップと、
    を有し
    複数の参照画像が用いられる場合に、選択されるパラメータ数が2種類以上であることを特徴とする映像符号化方法。
  14. 複数の映像を一つの映像として復号するにあたり、複数の映像間の視差を用いて予測する視差補償により復号する映像復号方法であって、
    符号化情報に含まれる、各参照画像に対する視差情報のパラメータ数を指定する視差パラメータ数情報を復号する視差パラメータ数情報復号ステップと、
    符号化情報に含まれる前記パラメータ数に応じた視差情報を復号する視差情報復号ステップと、
    前記復号した視差情報を用いて前記視差補償を行う視差補償ステップと、
    を有し
    複数の参照画像が用いられる場合に、指定されたパラメータ数が2種類以上であることを特徴とする映像復号方法。
  15. 複数の映像を一つの映像として符号化するにあたり、複数の映像間の視差を用いて予測する視差補償により符号化する映像符号化装置であって、
    前記視差補償に利用する、各参照画像に対する視差情報のパラメータ数を選択し設定する視差パラメータ数設定手段と、
    前記視差パラメータ数設定手段により設定されたパラメータ数の情報を符号化する視差パラメータ数情報符号化手段と、
    前記パラメータ数に応じた視差情報を符号化する視差情報符号化手段と、
    を備え
    複数の参照画像が用いられる場合に、選択されるパラメータ数が2種類以上であることを特徴とする映像符号化装置。
  16. 複数の映像を一つの映像として復号するにあたり、複数の映像間の視差を用いて予測する視差補償により復号する映像復号装置であって、
    符号化情報に含まれる、各参照画像に対する視差情報のパラメータ数を指定する視差パラメータ数情報を復号する視差パラメータ数情報復号手段と、
    符号化情報に含まれる前記パラメータ数に応じた視差情報を復号する視差情報復号手段と、
    前記復号した視差情報を用いて前記視差補償を行う視差補償手段と、
    を備え
    複数の参照画像が用いられる場合に、指定されたパラメータ数が2種類以上であることを特徴とする映像復号装置。
  17. 請求項1、5、6、13のいずれか1項に記載の映像符号化方法を、コンピュータに実行させるための映像符号化プログラム。
  18. 請求項2、7、8、14のいずれか1項に記載の映像復号方法を、コンピュータに実行させるための映像復号プログラム。
  19. 請求項1、5、6、13のいずれか1項に記載の映像符号化方法を、コンピュータに実行させるための映像符号化プログラムを記録したコンピュータ読み取り可能な記媒体。
  20. 請求項2、7、8、14のいずれか1項に記載の映像復号方法を、コンピュータに実行させるための映像復号プログラムを記録したコンピュータ読み取り可能な記媒体。
JP2007552992A 2006-01-05 2006-12-29 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体 Active JP5234586B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007552992A JP5234586B2 (ja) 2006-01-05 2006-12-29 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006000394 2006-01-05
JP2006000394 2006-01-05
PCT/JP2006/326297 WO2007077942A1 (ja) 2006-01-05 2006-12-29 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体
JP2007552992A JP5234586B2 (ja) 2006-01-05 2006-12-29 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体

Publications (2)

Publication Number Publication Date
JPWO2007077942A1 JPWO2007077942A1 (ja) 2009-06-11
JP5234586B2 true JP5234586B2 (ja) 2013-07-10

Family

ID=38228291

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007552992A Active JP5234586B2 (ja) 2006-01-05 2006-12-29 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体

Country Status (10)

Country Link
US (1) US8548064B2 (ja)
EP (1) EP1971154A4 (ja)
JP (1) JP5234586B2 (ja)
KR (1) KR100968920B1 (ja)
CN (1) CN101346998B (ja)
BR (1) BRPI0620645B8 (ja)
CA (2) CA2845591C (ja)
RU (1) RU2374786C1 (ja)
TW (1) TW200737990A (ja)
WO (1) WO2007077942A1 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2663672C (en) * 2006-09-20 2014-08-12 Nippon Telegraph And Telephone Corporation Image encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
WO2008035654A1 (fr) * 2006-09-20 2008-03-27 Nippon Telegraph And Telephone Corporation Procédés et dispositifs de codage et de décodage d'image, dispositif et programmes de décodage d'image, et support de stockage desdits programmes
BRPI0911307B1 (pt) * 2008-04-15 2020-09-29 France Telecom Codificação e decodificação de uma imagem ou de uma sequência de imagens recortadas, segundo partições de pixels de forma linear
US20120212579A1 (en) * 2009-10-20 2012-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Method and Arrangement for Multi-View Video Compression
JP4927928B2 (ja) * 2009-11-30 2012-05-09 パナソニック株式会社 多視点動画像復号装置及び多視点動画像復号方法
JP4837772B2 (ja) * 2009-12-15 2011-12-14 パナソニック株式会社 多視点動画像復号装置、多視点動画像復号方法、プログラム及び集積回路
JP2011199396A (ja) * 2010-03-17 2011-10-06 Ntt Docomo Inc 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
US9008175B2 (en) * 2010-10-01 2015-04-14 Qualcomm Incorporated Intra smoothing filter for video coding
US8284307B1 (en) * 2010-11-01 2012-10-09 Marseille Networks, Inc. Method for processing digital video fields
US20120163457A1 (en) * 2010-12-28 2012-06-28 Viktor Wahadaniah Moving picture decoding method, moving picture coding method, moving picture decoding apparatus, moving picture coding apparatus, and moving picture coding and decoding apparatus
WO2012131895A1 (ja) * 2011-03-29 2012-10-04 株式会社東芝 画像符号化装置、方法及びプログラム、画像復号化装置、方法及びプログラム
JP2012257198A (ja) * 2011-05-17 2012-12-27 Canon Inc 立体画像符号化装置、その方法、および立体画像符号化装置を有する撮像装置
BR112013032349B1 (pt) * 2011-06-17 2022-09-13 JVC Kenwood Corporation "dispositivo e método de codificação de imagem, dispositivo e método de decodificação de imagem, dispositivo é método de transmissão, e dispositivo e método de recepção
KR101753551B1 (ko) * 2011-06-20 2017-07-03 가부시키가이샤 제이브이씨 켄우드 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화 프로그램을 저장한 기록매체
CN110572681B (zh) * 2011-06-30 2023-12-15 索尼公司 图像处理设备和图像处理方法
US9635355B2 (en) 2011-07-28 2017-04-25 Qualcomm Incorporated Multiview video coding
US9674525B2 (en) * 2011-07-28 2017-06-06 Qualcomm Incorporated Multiview video coding
JP5706264B2 (ja) 2011-08-01 2015-04-22 日本電信電話株式会社 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラムおよび画像復号プログラム
CN103828359B (zh) 2011-09-29 2016-06-22 杜比实验室特许公司 用于产生场景的视图的方法、编码系统以及解码系统
JP5485969B2 (ja) * 2011-11-07 2014-05-07 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
KR101863179B1 (ko) 2012-01-20 2018-05-31 지이 비디오 컴프레션, 엘엘씨 병렬 처리, 전송 디멀티플렉서 및 비디오 비트스트림을 허용하는 코딩 개념
WO2013136365A1 (ja) * 2012-03-14 2013-09-19 株式会社 東芝 多視点画像符号化装置及び方法、並びに、多視点画像復号装置及び方法
JPWO2013136365A1 (ja) * 2012-03-14 2015-07-30 株式会社東芝 多視点画像符号化装置及び方法、並びに、多視点画像復号装置及び方法
HUE060889T2 (hu) 2012-04-13 2023-04-28 Ge Video Compression Llc Kis késleltetésû képkódolás
JP2013258577A (ja) * 2012-06-13 2013-12-26 Canon Inc 撮像装置、撮像方法及びプログラム、画像符号化装置、画像符号化方法及びプログラム
CN110536136B (zh) * 2012-06-29 2022-08-05 Ge视频压缩有限责任公司 视频数据流、编码器、编码视频内容的方法以及解码器
MX345003B (es) * 2012-09-26 2017-01-13 Panasonic Ip Corp America Metodo de decodificacion de imagen, metodo de codificacion de imagen, aparato de decodificacion de imagen, aparato de codificacion de imagen y aparato de codificacion y decodificacion de imagen.
JP2014082541A (ja) * 2012-10-12 2014-05-08 National Institute Of Information & Communication Technology 互いに類似した情報を含む複数画像のデータサイズを低減する方法、プログラムおよび装置
JP6150277B2 (ja) * 2013-01-07 2017-06-21 国立研究開発法人情報通信研究機構 立体映像符号化装置、立体映像復号化装置、立体映像符号化方法、立体映像復号化方法、立体映像符号化プログラム及び立体映像復号化プログラム
CN105052148B (zh) * 2013-04-12 2018-07-10 日本电信电话株式会社 视频编码装置和方法、视频解码装置和方法、以及其记录介质
WO2014196374A1 (ja) * 2013-06-05 2014-12-11 ソニー株式会社 画像処理装置および画像処理方法
EP3080991B1 (en) 2013-12-10 2020-02-12 Canon Kabushiki Kaisha Improved palette mode in hevc
JP6465890B2 (ja) 2013-12-10 2019-02-06 キヤノン株式会社 画素ブロックの符号化または復号の方法および装置
EP3171598A1 (en) * 2015-11-19 2017-05-24 Thomson Licensing Methods and devices for encoding and decoding a matrix of views obtained from light-field data, corresponding computer program and non-transitory program storage device
EP3610647B1 (en) 2017-04-26 2021-12-08 Huawei Technologies Co., Ltd. Apparatuses and methods for encoding and decoding a panoramic video signal
EP3639517B1 (en) 2017-06-14 2021-02-24 Huawei Technologies Co., Ltd. Intra-prediction for video coding using perspective information
CN110070564B (zh) * 2019-05-08 2021-05-11 广州市百果园信息技术有限公司 一种特征点匹配方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004007377A (ja) * 2002-04-18 2004-01-08 Toshiba Corp 動画像符号化/復号化方法及び装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SU1665545A1 (ru) 1988-07-21 1991-07-23 Винницкий политехнический институт Телевизионное устройство селекции изображений объектов
RU2030119C1 (ru) 1991-04-19 1995-02-27 Смирнов Александр Иванович Устройство формирования стереотелевизионного изображения подвижного объекта
US5625408A (en) * 1993-06-24 1997-04-29 Canon Kabushiki Kaisha Three-dimensional image recording/reconstructing method and apparatus therefor
JPH09261653A (ja) 1996-03-18 1997-10-03 Sharp Corp 多視点画像符号化装置
JP4013286B2 (ja) * 1997-01-22 2007-11-28 松下電器産業株式会社 画像符号化装置と画像復号化装置
JPH11239351A (ja) 1998-02-23 1999-08-31 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化方法、復号方法、符号化器、復号器、動画像符号化プログラムおよび動画像復号プログラムを記録した記録媒体
JP3519594B2 (ja) * 1998-03-03 2004-04-19 Kddi株式会社 ステレオ動画像用符号化装置
US6519358B1 (en) * 1998-10-07 2003-02-11 Sony Corporation Parallax calculating apparatus, distance calculating apparatus, methods of the same, and information providing media
US7085409B2 (en) * 2000-10-18 2006-08-01 Sarnoff Corporation Method and apparatus for synthesizing new video and/or still imagery from a collection of real video and/or still imagery
JP4608136B2 (ja) 2001-06-22 2011-01-05 オリンパス株式会社 動きベクトル及び視差ベクトル検出装置
JP4213646B2 (ja) * 2003-12-26 2009-01-21 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム。
JP2006000394A (ja) 2004-06-17 2006-01-05 Tokai Kiki Kogyo Co Ltd 畳側面の縫着方法及び畳用縫着装置
KR100679740B1 (ko) 2004-06-25 2007-02-07 학교법인연세대학교 시점 선택이 가능한 다시점 동영상 부호화/복호화 방법
JP4363295B2 (ja) * 2004-10-01 2009-11-11 オムロン株式会社 ステレオ画像による平面推定方法
KR100738867B1 (ko) * 2005-04-13 2007-07-12 연세대학교 산학협력단 다시점 동영상 부호화/복호화 시스템의 부호화 방법 및시점간 보정 변이 추정 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004007377A (ja) * 2002-04-18 2004-01-08 Toshiba Corp 動画像符号化/復号化方法及び装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200201351009; 畑幸一、栄藤稔、千原國宏: '多視点画像の高能率符号化' 電子情報通信学会論文誌 Vol.J82-D-II,No.11, 199911, pp.1921-1929, 社団法人電子情報通信学会 *
JPN6012058441; 畑幸一、栄藤稔、千原國宏: '多視点画像の高能率符号化' 電子情報通信学会論文誌 Vol.J82-D-II,No.11, 199911, pp.1921-1929, 社団法人電子情報通信学会 *

Also Published As

Publication number Publication date
WO2007077942A1 (ja) 2007-07-12
JPWO2007077942A1 (ja) 2009-06-11
CA2845591A1 (en) 2007-07-12
BRPI0620645B8 (pt) 2022-06-14
US20090028248A1 (en) 2009-01-29
CA2845591C (en) 2015-12-08
BRPI0620645B1 (pt) 2020-09-15
KR20080076974A (ko) 2008-08-20
KR100968920B1 (ko) 2010-07-14
TW200737990A (en) 2007-10-01
CA2633637A1 (en) 2007-07-12
EP1971154A4 (en) 2010-10-27
BRPI0620645A2 (pt) 2011-11-16
TWI335185B (ja) 2010-12-21
RU2374786C1 (ru) 2009-11-27
EP1971154A1 (en) 2008-09-17
CA2633637C (en) 2014-06-17
CN101346998A (zh) 2009-01-14
CN101346998B (zh) 2012-01-11
US8548064B2 (en) 2013-10-01

Similar Documents

Publication Publication Date Title
JP5234586B2 (ja) 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体
JP5234587B2 (ja) 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体
US9088802B2 (en) Video encoding method and apparatus, video decoding method and apparatus, programs therefor, and storage media for storing the programs
US9066096B2 (en) Video encoding method and decoding method, apparatuses therefor, programs therefor, and storage media which store the programs
JP6446488B2 (ja) ビデオデータデコーディング方法及びビデオデータデコーディング装置
CA2663084A1 (en) Image encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
CA2663672A1 (en) Image encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
JP2009510892A (ja) カメラパラメータを利用して視差ベクトルを予測する方法、その方法を利用して多視点映像を符号化及び復号化する装置、及びそれを行うためのプログラムが記録された記録媒体
US20120114036A1 (en) Method and Apparatus for Multiview Video Coding
KR20130117749A (ko) 화상 처리 장치와 화상 처리 방법
US20170070751A1 (en) Image encoding apparatus and method, image decoding apparatus and method, and programs therefor
US20160037172A1 (en) Image encoding method, image decoding method, image encoding apparatus, image decoding apparatus, image encoding program, and image decoding program
JP6386466B2 (ja) 映像符号化装置及び方法、及び、映像復号装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091201

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130319

R150 Certificate of patent or registration of utility model

Ref document number: 5234586

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250