WO2006073116A1

WO2006073116A1 - 映像符号化方法及び装置、映像復号方法及び装置、それらのプログラムおよびそれらプログラムを記録した記録媒体

Info

Publication number: WO2006073116A1
Application number: PCT/JP2005/024093
Authority: WO
Inventors: Masaki Kitahara; Kazuto Kamikura; Yoshiyuki Yashima
Original assignee: Nippon Telegraph And Telephone Corporation
Priority date: 2005-01-07
Filing date: 2005-12-28
Publication date: 2006-07-13
Also published as: EP1835747B1; EP1835747A4; KR100946790B1; US20070189396A1; EP1835747A1; CN100584013C; US9088802B2; TW200629914A; JP4937741B2; TWI308028B; KR20070052692A; JPWO2006073116A1; CN1910931A

Abstract

　複数の画像を一つの映像として符号化する映像符号化方法であって、第１の画像内の所定位置に対する符号化対象情報を符号化するにあたり、該第１の画像と符号化済みの第２の画像との間の視点ずれを示す参照視差情報を設定する参照視差情報設定ステップと，前記参照視差情報を用いて、前記第２の画像において前記所定位置と対応付けられる対応位置を設定する対応位置設定ステップと、前記対応位置の符号化対象情報に対応した符号テーブルを設定する符号テーブル設定ステップと、前記符号テーブルを使い、前記第１の画像内の前記符号化対象情報を符号化する符号化対象情報符号化ステップとを有する。

Description

映像符号化方法及び装置、映像復号方法及び装置、それらのプログラムおよびそれらプログラムを記録した記録媒体

技術分野

[0001] 本発明は、多視点動画像の符号化に用いられる映像符号化方法及びその装置と、その映像符号ィ匕方法の実現に用いられる映像符号ィ匕プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体と、その映像符号ィヒ技術により生成された符号化データを復号する映像復号方法及びその装置と、その映像復号方法の実現に用いられる映像復号プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体とに関する。

本願は、 2005年 1月 7日に出願された特願 2005— 002423号に基づき優先権を主張し、その内容をここに援用する。

背景技術

[0002] 多視点動画像は、様々な位置にある複数のカメラで同じ被写体と背景を撮影した複数の動画像である。以下では、一つのカメラで撮影された動画像を" 2次元動画像 "と呼び、同じ被写体と背景を撮影した 2次元動画像の集合を"多視点動画像"と呼

[0003] 多視点動画像に含まれる各カメラの 2次元動画像は、時間方向に強い相関がある。

一方、各カメラが同期されていた場合、同じ時間に対応した各カメラのフレームは全く同じ状態の被写体と背景を撮影しているため、カメラ間で強い相関がある。

[0004] まず、 2次元動画像の符号化方式に関する従来技術を述べる。

[0005] 国際符号化標準である H.264、 MPEG— 4、 MPEG— 2をはじめとした従来の多くの 2次元動画像符号化方式では、動き補償、直交変換、量子化、エントロピー符号化という技術を利用して、高効率な符号化を行う。

[0006] 例えば、 H.264では、 Iフレームにおいてはフレーム内相関を利用して符号化が可能で、 Pフレームでは過去の複数枚のフレームにおけるフレーム間相関を利用して符号ィ匕が可能で、 Bフレームでは過去あるいは未来の複数枚毎のフレームにおけるフレーム間相関を利用して符号ィ匕が可能である。

[0007] Iフレームではフレームをブロック分割し（このブロックをマクロブロックと、、、ブロックサイズは 16 X 16である）、各マクロブロックにおいてイントラ予測を行う。イントラ予測の際には、各マクロブロックをさらに小さなブロックに分割し (以後、サブブロックと呼ぶ）、各サブブロックで異なるイントラ予測方法を行うことができる。

[0008] 一方、 Pフレームでは、各マクロブロックでイントラ予測、あるいはインター予測を行うことができる。 Pフレームにおけるイントラ予測は Iフレームの場合と同様である。一方、インター予測の際には動き補償が行われる。動き補償においても、マクロブロックをより小さなブロックに分割して、各サブブロックで異なる動きベクトル、参照画像を持つことがでさる。

[0009] また、 Bフレームにおいても、イントラ予測とインター予測が行える力 Bフレームでのインター予測では、過去のフレームに加えて未来のフレームも動き補償の参照画像にできる。例えば、 Iフレーム→Bフレーム→Bフレーム→Pフレームというフレーム構成で符号化する場合、 I→P→B→Bの順番で符号ィ匕することとなる。そして、 Bフレームでは、 Iフレーム及び Pフレームを参照して動き補償ができる。また、 Pフレームの場合と同様に、マクロブロックを分割したサブブロックごとに異なる動きベクトルを持つことができる。

[0010] イントラもしくはインター予測を行うと予測残差が得られるが、各マクロブロックで予測残差ブロックに DCT (離散コサイン変換)を行って量子化が行われる。具体的には、ブロックサイズ 16 X 16のマクロブロックは 4 X 4のサブブロックに分割され、 4 X 4の DCTが行われる。そして、 DCT係数の量子化値列は次のような情報で表現される。

[0011] -Coded block pattern:マクロブロック内に定義できる 4つの 8 X 8ブロックのうち、どのブロック内で非ゼロである DCT係数 (以後、非ゼロ係数）が存

在するか示す情報

•Coded block flag:非ゼロ係数が存在する 8 X 8ブロック内における 4つの 4 X 4ブロックのうち、どの 4 X 4ブロックに非ゼロ係数が存在するか示す情報

•Significanceマップ： Coded block flagで示される 4 X 4ブロックに存在する DCT係数のうち、どの係数が非ゼロである力示す情報 •レベル情報： Significanceマップが示す非ゼロ係数の値

上記の DCT係数に関連する情報にカ卩え、各マクロブロックのサブブロックへの分割方法や動きベクトルなどに対して、エントロピー符号ィ匕と呼ばれる可逆符号ィ匕が施されて符号化が完了する。

[0012] ここで、画素領域の量子化値、ある、は画像ブロックに対して直交変換した変換係数の量子化値 (DCT係数の場合、上記のレベル情報に対応する）以外のエントロピ一符号ィ匕の対象となる情報を"補助情報"と呼ぶこととする。 H.264の場合、上記 DC T係数関連の補助情報以外の補助情報として、例えば以下のようなものがある。これらの補助情報はマクロブロック単位で与えられる。

[0013] ·マクロブロックタイプ及びサブマクロブロックタイプ：マクロブロックタイプは、マクロブロックでイントラ予測を行うか、インター予測を行うかの指定、予測方法、ブロックの分割形式などの組み合わせをインデックスで表現したものである。一方、サブマクロブロックタイプは、サブブロックでの予測方法、ブロックの分割形式などの組み合わせをインデックスで表現したものである。

•参照画像インデックス：各サブブロックでの動き補償に利用される参照画像のィンデッタス値である。

•動きベクトル：各サブブロックにおける動きベクトルである。 H.264では、周辺の動きベクトルで予測した残差として表現して、る。

[0014] 次に、エントロピー符号ィ匕に関する概要を説明する。

[0015] エントロピー符号ィ匕は可逆符号ィ匕である。ここで、一般的に可逆符号化とは、符号化対象のシンボル (整数の集合から取り出した一つの値と解釈すれば良、）を 1と 0によるビット列に変換する処理である。例えば、符号ィ匕対象のシンボル力 S {0, 1, 2, 3} という整数の集合における一つの値であるとき、そのシンボル力^の時は 00、 1のときは 01、 2のときは 10、 3のときは 11、に符号化すれば可逆符号化になる。この符号化方法は固定長符号化と呼ばれている。ここで、シンボルを符号化するための符号の集合 (この例では、 {00, 01, 10, 11 })を"符号テーブル"と呼ぶ。

[0016] 固定長符号化は可逆符号化だが、符号化効率の意味では効率が悪!、。情報理論では、シンボルの発生確率 (整数の集合に関する確率分布）を利用することによって、高効率な可逆符号ィ匕を実現できることが知られている。おおまかには、発生確率の高、シンボルには短、符号長を割り振り、発生確率の低、シンボルには長、符号長を割り振ることで平均的には固定長符号化より効率的な符号化が可能になる。このように、確率分布を利用した可逆符号ィ匕をエントロピー符号ィ匕と!、う。

[0017] しかし、前述のような高効率なエントロピー符号ィ匕が行えるのは、符号化対象のシンボルの確率分布が既知であることが前提である。従って、従来は経験的に確率分布を決めたり、符号ィ匕しながらシンボルの確率分布を学習するという方法が取られていた。なお、シンボルの確率分布力最適な符号テーブルを求める方法は従来力ある (ハフマン符号や算術符号)。従って、以下では確率分布と符号テーブルを同義として扱う。

[0018] エントロピー符号ィ匕を動画像符号ィ匕の補助情報、画素値、変換係数値の符号化に利用する場合、これらの符号化対象の情報は画像内で確率が変わる。従って、高効率な符号ィ匕を実現するには、画像内の位置によって符号ィ匕に利用する符号テープルを適切なものに切り替える必要がある。すなわち、確率分布を適切なものに切り替える必要がある。

[0019] H.264では、 Context— Adaptive Binary Arithmetic Coding(CABAC)という方法でこれを実現して、る（参考文献 1：下記の非特許文献 1)。以下で、マクロブロックタイプを符号ィ匕する場合を例として、 H.264における CABACの概要を示す。

[0020] CABACでは、あるマクロブロックのマクロブロックタイプを符号化する場合、そのマクロブロックの上及び左のマクロブロックの符号化済みのマクロブロックタイプを参照して符号テーブルを切り替える。

[0021] 図 17に、この参照関係の概念図を示す。図中の A、 Bと記述されたマクロブロックのマクロブロックタイプは符号ィ匕対象のマクロブロックタイプと強い相関がある。

[0022] CABACでは、この相関を利用して最適な符号テーブルを予測する。具体的には、マクロブロック A、 Bについて、あり得るすべてのマクロブロックタイプの値の組み合わせについてそれぞれ符号テーブルを保持し、実際の A、 Bのマクロブロックタイプの値に対応した符号テーブル (確率分布）を利用して符号ィ匕対象のマクロブロックタイプをエントロピー符号ィ匕する。その他の符号ィ匕対象の情報も同じ考え方に基づいてエントロピー符号化される。

[0023] 次に、従来の多視点動画像の符号化方法について説明する。

[0024] 従来の多視点動画像の符号ィ匕では、上記の時間方向及び視差方向（カメラ間）の相関を利用して符号ィ匕効率を高めるために、時間方向の予測及びカメラ間での補償を行った符号ィ匕を採用している。その一例としては、参考文献 2 (下記の非特許文献 2)に示される手法がある。

[0025] この手法では、 "GOP"と呼ばれるフレームの集まりを、 Base GOPと InterGOPという 2種類の GOPに分類し、符号化する。 Base GOPと呼ばれる GOPでは、同一カメラの GOPの画像に含まれる全てのフレームがイントラあるいはインター予測によって符号化される力 Inter GOPと呼ばれる GOPに含まれるフレームでは、このようなイントラ、インター予測に加え、別のカメラの GOPの画像を利用した視差方向予測も利用して良い。ここで、視差方向予測というのは、あるカメラの画像のマクロブロックを符号ィ匕するにあたり、別のカメラの画像を参照画像として動き補償と同じ処理を行うことである。

[0026] 図 18に、この方法における GOP構造の一例を示す。図の例においては、各 GOP は 2つの画像を有し、各矢印は画像間の参照関係を表している。この方法では、時間方向及び視差方向の相関が符号ィ匕に利用されるため、時間方向のみの相関を利用した方法より符号ィ匕効率を向上させることが可能である。

^^特干文献 1 : Detlev Marpe, et.al., "し ontext— Based Adaptive Binary Arithmeticし o ding in the H.264/AVC Video Compression Standard , IEEE Transactions on Circui ts and Systems for Video Technology, Vol. 13. No. 7, pp. 620—636, July, 2003. 非特許文献 2： Hideaki Kimataand Masaki Kitahara, "Preliminary results on multiple view video coding (3DAV)," document Ml 0976 MPEG Redmond Meeting, July, 2004 発明の開示

発明が解決しょうとする課題

[0027] しかしながら、参考文献 2の手法では、符号化対象の多視点動画像を符号化するときに、先ず最初に、符号ィ匕効率に基づいて、時間方向の予測を使って符号ィ匕を行うの力、視差方向の予測を使って符号ィ匕を行うのかを決めるようにして、それに従って、時間方向の予測を使って符号ィ匕を行うことを決定すると、その後は、視差方向の相関を一切考慮することなく符号ィ匕を行うようにして、る。

[0028] この場合、符号化対象の多視点動画像において、被写体と背景の時間的な変化が緩やかで、時間方向の相関がカメラ間の相関に勝る場合、参考文献 2の方法に従つていると、時間方向の相関し力利用しない方法と比較して符号ィ匕効率を向上させることができな、と、う問題がある。

[0029] これは、参考文献 2の方法を前述のような多視点動画像に適用すると、常に時間方向の予測が利用され、時間方向の相関し力利用しない方法とほぼ同じ符号ィ匕を行うこと〖こなる力らである。

[0030] しかし、時間方向の予測しか行われな、場合も、予測残差やその直交変換係数、動きベクトルやマクロブロックタイプのような補助情報は、カメラ間で相関がある。従つて、これらの情報の符号ィ匕においてカメラ間の相関を利用することが考えられる。

[0031] 一方、動き補償の予測誤差を画素領域で量子化し、その量子化値をエントロピー符号化するような符号化方法を前提とした場合、一つの 2次元動画像を符号化する方法である参考文献 3 (塩寺太一郎，松田一朗，伊東晋,"動き補償と 3次元予測に基づいた動画像の可逆符号ィ匕〜コンテクストモデリングに関する検討〜",情報科学技術フォーラム (FIT 2003)講演論文集， No. J- 053, pp. 303-304, Sep. 2003)の手法を応用することが考えられる。

[0032] この参考文献 3の手法では、予測残差の量子化値のエントロピー符号ィヒの際に、各ブロックで求められた動きベクトルを利用して、前フレームのすでに符号ィ匕が終了して、る量子化値を参照することで符号テーブルを切り替えるようにして、る。

[0033] 具体的には、現在符号化対象となっている画素の位置を (X, y)、その画素が含まれるブロックの動きベクトルを（m , m )としたとき、前フレームで（x+m , y+m )の位置の周辺の画素に対応した量子化値の和を参照して符号テーブルを切り替える。 (x+m , y+m )の位置の周辺の画素に対応した量子化値は、符号ィ匕対象の画素の量子化値と相関があるため、この手法を用いることで符号ィ匕効率を向上させることが可能となる。 [0034] この手法を多視点動画像の符号ィ匕にお、て、（画素領域における）予測残差の量子化値のエントロピー符号ィ匕に応用する場合には、各ブロックで隣接するカメラの同一フレームに対して視差ベクトルを求め、参考文献 3の手法で時間方向に行っていた処理を視差方向に行えばよ!/、。

[0035] し力しながら、このような容易に類推可能な方法では、予測残差の量子化値自体の符号ィ匕効率を向上させることができるものの、各ブロックに対する視差ベクトルを符号化する必要があるため、全体としての符号ィ匕効率を向上させることが困難である。

[0036] また、このような容易に類推可能な方法では、画素領域の予測残差以外の符号ィ匕対象情報 (例えば、直交変換係数、動きベクトルやマクロブロックタイプなどの補助情報)を効率的に符号ィ匕することはできない。これは、画素領域の予測残差とその他の符号ィ匕対象情報との間に相関がないからである。

[0037] 本発明は力かる事情に鑑みてなされたものであって、多視点動画像を符号ィ匕するときに、エントロピー符号ィ匕において視差方向の相関を利用して符号ィ匕を行うことができるようにすることで、従来視差方向予測によって符号ィ匕効率を向上させることができなヽで、た多視点動画像を含めたあらゆる多視点動画像に対して、その符号ィ匕効率を向上させることができるようにする新たな符号ィ匕技術の提供を目的とする。課題を解決するための手段

[0038] 上記事情を鑑みて、本発明は、複数の画像を一つの映像として符号ィ匕する映像符号化方法であって、

第 1の画像内の所定位置に対する符号ィヒ対象情報を符号ィヒするにあたり、該第 1 の画像と符号化済みの第 2の画像との間の視点ずれを示す参照視差情報を設定する参照視差情報設定ステップと，

前記参照視差情報を用いて、前記第 2の画像にお、て前記所定位置と対応付けられる対応位置を設定する対応位置設定ステップと、

前記対応位置の符号ィヒ対象情報に対応した符号テーブルを設定する符号テープル設定ステップと、

前記符号テーブルを使!ヽ、前記第 1の画像内の前記符号化対象情報を符号化する符号化対象情報符号化ステップとを有する映像符号化方法を提供する。

[0039] 典型例として、前記参照視差情報設定ステップでは、前記第 1及び第 2の画像間の平均的な視点ずれを示すグローバル視差情報を前記参照視差情報として設定するとともに、

前記グローバル視差情報を符号ィヒするグローバル視差情報符号化ステップを有する。

別の典型例として、

前記参照視差情報設定ステップでは、前記第 2の画像と別の第 3の画像とを用いて両画像間の視差を推定し、該視差と、前記第 1〜第 3の画像の撮像装置間の位置関係とに基づいて前記参照視差情報を設定する。

[0040] このように構成される本発明によれば、参照される視差情報 (視差ベクトルなどのような視差の大きさを示す情報)を符号ィ匕しないか、もしくは符号ィ匕してもデータ量を小さく抑えることができ、なおかつ、視差方向の相関を利用して符号ィ匕対象となっている符号ィ匕対象情報を符号ィ匕できることにより、複数の映像 (例えば多視点動画像)を効率的に符号ィ匕できるようになる。

[0041] この実現にあたって、ブロックごとに視差情報を求めて符号ィ匕するのでなぐ異なるカメラ間の視点ずれを示す視差情報を推定するか，もしくは一つの画像に対して 1つの平均的な視差情報 (グローバル視差情報)を求めて符号化する。

各カメラのカメラパラメータが既知であり、 2つ以上のカメラの復号画像が参照可能である場合には、符号化対象画像 (第 1の画像)を利用せずに、符号化対象画像の各画素に関する視差情報 (視差べ外ル)を推定することができる。

また、カメラが一列に並んでいて視軸が平行であるような場合、各カメラの同一時刻の画像列は被写体が平行移動した動画像を撮影して、ることと等価なので、参照視差情報のみでローカルな視差情報を近似できる。

そして、上記のような視差情報を利用して、別の画像の符号ィ匕対象情報を参照して、符号ィ匕対象画像のエントロピー符号ィ匕用の符号テーブルを切り替える。

[0042] 好適例として、前記符号テーブル設定ステップでは、前記第 2の画像内の前記対応位置の符号化対象情報と、前記第 1の画像内の前記所定位置の周辺の位置に対する符号ィ匕済みの符号ィ匕対象情報とに対応した符号テーブルを設定する。

別の好適例として、前記符号テーブル設定ステップでは、前記第 2の画像内の前記対応位置の周辺の位置に対応する符号ィ匕対象情報も参照して前記符号テーブルを設定する。これによれば、ロバストな符号テーブルの切り替えが可能となる。

これにより、参照視差情報の精度などの影響がある場合でも、上記第 2の画像内の対応位置を設定するにあたり、上記第 1の画像内の上記所定位置の統計的なばらつきにも対応できるという効果がある。

即ち、周辺の複数の対応位置を参照して符号テーブルを設定することにより、参照視差情報の精度などの影響を吸収することが可能となる。

[0043] 典型例として、前記符号化対象情報は、画像を分割したブロックごとに設定されるものであり、

前記対応位置設定ステップでは、前記第 2の画像におヽて前記所定位置に対応するブロックの位置を、前記参照視差情報に基づ、てずらしたときに該ブロックとの重複面積が最大となるブロックの位置を対応位置として設定する。

この場合、符号テーブル設定手段は、その対応位置のブロックの符号ィ匕対象情報を参照することで符号テーブルを切り替えることになる。この構成を採ることで、ブロックベースの符号ィ匕において、各ブロックに対して求められる符号ィ匕対象情報（直交変換係数、マクロブロックタイプなど）の効率的な符号ィ匕が行えるようになる。

[0044] 別の典型例として、前記符号化対象情報は、画像を分割したブロックごとに設定されるものであり、

前記対応位置設定ステップでは、前記第 2の画像におヽて前記所定位置に対応するブロックの位置を、前記参照視差情報に基づ、てずらした位置の周辺の複数のブロックの位置を対応位置として設定する。

このときには、符号テーブル設定手段は、その複数のブロックの符号ィ匕対象情報を参照することで符号テーブルを切り替えることになる。この構成を採ることで、ブロックベースの符号ィ匕において、前述した理由と同じ理由により、ロバストな符号テーブルの切り替えが可能となる。

[0045] 前記符号テーブル設定ステップでは、前記符号テーブルの設定に用いる符号化対象情報の最頻値に対応する符号テーブルを設定するようにしても良、。この構成を採ることで、符号テーブルの数の爆発的な増加を防ぎながら、マクロプロックタイプや予測モードのような、数値として表現されて、るがあくまでもインデックスとしての数値である、大小関係が定義できない符号ィ匕対象情報を効率的に符号ィ匕することがでさるよう〖こなる。

[0046] すなわち、参照する対応位置の数が Nであった場合、 N個のシンボルの全組み合わせについて符号テーブルを用意すると、参照する対応位置の数力^の場合の符号テーブル数 cに対して c^N_1個の符号テーブルを持つ必要がある。つまり、符号テープルの数は指数的に増加する。これに対して、この構成を採ると、複数の対応位置に関する符号化対象情報の最頻値を参照して符号テーブルを切り替えるので、符号テーブルの数は cで済む。

[0047] また、前記符号テーブル設定ステップにお、て、前記符号テーブルの設定に用いる符号ィヒ対象情報の平均値に対応する符号テーブルを設定するようにしても良い。この構成を採ることで、符号テーブルの数の爆発的な増加を防ぎながら、直交変換係数の量子化値や非ゼロ係数の数などのような大小関係が定義できる符号化対象情報を効率的に符号ィ匕することができるようになる。

上述のように、参照する対応位置の数が Nであった場合、 N個のシンボルの全組み合わせについて符号テーブルを用意すると、参照する対応位置の数が 1の場合の符号テーブル数 cに対して c^N_1個の符号テーブルを持つ必要がある。これに対して、この構成を採ると、複数の対応位置に関する符号化対象情報の平均値を参照して符号テーブルを切り替えるので、符号テーブルの数は cで済む。

[0048] 本発明はまた、複数の画像を一つの映像として符号ィ匕することで生成された符号化データを復号する映像復号方法であって、

第 1の画像内の所定位置に対する符号化対象情報を復号するにあたり、該第 1の画像と符号化済みの第 2の画像との間の視点ずれを示す参照視差情報を設定する参照視差情報設定ステップと，

前記参照視差情報を用いて、前記第 2の画像にお、て前記所定位置と対応付けられる対応位置を設定する対応位置設定ステップと、前記対応位置の符号ィヒ対象情報に対応した符号テーブルを設定する符号テープル設定ステップと、

前記符号テーブルを使ヽ、前記第 1の画像内の前記符号化対象情報を復号する符号化対象情報復号ステップと

を有する映像復号方法を提供する。

[0049] 典型例として、前記参照視差情報設定ステップでは、前記第 1及び第 2の画像間の平均的な視点ずれを示すグローバル視差情報を復号し、これを前記参照視差情報として設定する。

別の典型例として、前記参照視差情報設定ステップでは、前記第 2の画像と別の第 3の画像とを用いて両画像間の視差を推定し、該視差と、前記第 1〜第 3の画像の撮像装置間の位置関係とに基づいて前記参照視差情報を設定する。

[0050] 好適例として、前記符号テーブル設定ステップでは、前記第 2の画像内の前記対応位置の符号化対象情報と、前記第 1の画像内の前記所定位置の周辺の位置に対する復号済みの符号ィ匕対象情報とに対応した符号テーブルを設定する。

別の好適例として、前記符号テーブル設定ステップでは、前記第 2の画像内の前記対応位置の周辺の位置に対応する符号ィ匕対象情報も参照して前記符号テーブルを設定する。

[0051] 典型例として、

前記符号化対象情報は、画像を分割したブロックごとに設定されるものであり、前記対応位置設定ステップでは、前記第 2の画像におヽて前記所定位置に対応するブロックの位置を、前記参照視差情報に基づ、てずらしたときに該ブロックとの重複面積が最大となるブロックの位置を対応位置として設定する。

別の典型例として、前記符号化対象情報は、画像を分割したブロックごとに設定されるものであり、

[0052] 前記符号テーブル設定ステップでは、前記符号テーブルの設定に用いる符号化対象情報の最頻値に対応する符号テーブルを設定しても良ぐまた、前記符号テープルの設定に用いる符号ィ匕対象情報の平均値に対応する符号テーブルを設定しても良い。

[0053] 本発明はまた、複数の画像を一つの映像として符号ィ匕する映像符号ィ匕装置であつて、

第 1の画像内の所定位置に対する符号ィヒ対象情報を符号ィヒするにあたり、該第 1 の画像と符号化済みの第 2の画像との間の視点ずれを示す参照視差情報を設定する参照視差情報設定部と，

前記参照視差情報を用いて、前記第 2の画像にお、て前記所定位置と対応付けられる対応位置を設定する対応位置設定部と、

前記対応位置の符号ィヒ対象情報に対応した符号テーブルを設定する符号テープル設定部と、

前記符号テーブルを使!ヽ、前記第 1の画像内の前記符号化対象情報を符号化する符号化対象情報符号化部と

を有する映像符号化装置を提供する。

[0054] 典型例として、前記参照視差情報設定部は、前記第 1及び第 2の画像間の平均的な視点ずれを示すグローバル視差情報を前記参照視差情報として設定するとともに前記グローバル視差情報を符号ィ匕するグローバル視差情報符号ィ匕部を有する。別の典型例として、前記参照視差情報設定部は、前記第 2の画像と別の第 3の画像とを用いて両画像間の視差を推定し、該視差と、前記第 1〜第 3の画像の撮像装置間の位置関係とに基づいて前記参照視差情報を設定する。

[0055] 本発明はまた、複数の画像を一つの映像として符号ィ匕することで生成された符号化データを復号する映像復号装置であって、

第 1の画像内の所定位置に対する符号化対象情報を復号するにあたり、該第 1の画像と符号化済みの第 2の画像との間の視点ずれを示す参照視差情報を設定する参照視差情報設定部と，

前記符号テーブルを使ヽ、前記第 1の画像内の前記符号化対象情報を復号する符号化対象情報復号部と

を有する映像復号装置を提供する。

[0056] 典型例として、前記参照視差情報設定部は、前記第 1及び第 2の画像間の平均的な視点ずれを示すグローバル視差情報を復号し、これを前記参照視差情報として設定する。

別の典型例として、前記参照視差情報設定部は、前記第 2の画像と別の第 3の画像とを用いて両画像間の視差を推定し、該視差と、前記第 1〜第 3の画像の撮像装置間の位置関係とに基づいて前記参照視差情報を設定する。

[0057] 本発明の各方法はコンピュータプログラムでも実現できるものであり、このコンビユータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされて CPUなどの制御手段上で動作することにより本発明を実現することができる。

発明の効果

[0058] 以上に説明したように、本発明によれば、視差方向予測によって符号ィ匕効率を向上させることができな、で、た多視点動画像に対して、エントロピー符号ィ匕にぉ、て視差方向の相関を利用することが可能となることから、あらゆる多視点動画像に対して、符号ィ匕効率を向上させることができるようになる。

図面の簡単な説明

[0059] [図 1A]符号テーブルを切り替えるための符号化対象情報の参照関係の一例を示す図である。

[図 1B]同様に、符号テーブルを切り替えるための符号ィ匕対象情報の参照関係の一例を示す図である。

[図 2A]符号テーブルを切り替えるための符号化対象情報の参照関係の一例を示す図である。圆 2B]同様に、符号テーブルを切り替えるための符号ィ匕対象情報の参照関係の一例を示す図である。

圆 3]本発明の一実施形態において、カメラの構成を示す概念図である。

圆 4]同実施形態における映像符号ィ匕装置の構成を示す図である。

圆 5]同実施形態における符号ィ匕対象情報参照符号ィ匕部の構成を示す図である。圆 6]同実施形態において、映像符号化装置の実行する動作フローを示す図である圆 7]同実施形態において、カメラ C2の画像中の符号化対象情報の符号化処理の動作フローを示す図である。

[図 8A]符号テーブルを切り替えるための符号化対象情報の参照関係の一例を示す図である。

圆 8B]同様に、符号テーブルを切り替えるための符号ィ匕対象情報の参照関係の一例を示す図である。

圆 9]同実施形態における映像復号装置の構成を示す図である。

圆 10]同実施形態における符号ィ匕対象情報参照復号部の構成を示す図である。圆 11]同実施形態において、映像復号装置の実行する動作フローを示す図である。圆 12]同実施形態において、カメラ C2の画像中の符号化対象情報の復号処理の動作フローを示す図である。

圆 13A]同実施形態において、符号テーブルを切り替えるための符号化対象情報の参照関係の一例を示す図である。

[図 13B]同様に、符号テーブルを切り替えるための符号ィ匕対象情報の参照関係の一例を示す図である。

[図 14]符号化対象画像を利用せずに、該画像の各画素に関する視差情報 (視差べクトル)を推定する原理を示す図である。

[図 15]視差情報を推定する場合の、カメラ C2の画像中の符号化対象情報の符号ィ匕処理の動作フローを示す図である。

[図 16]視差情報を推定する場合の、カメラ C2の画像中の符号化対象情報の復号処理の動作フローを示す図である。 [図 17]H.264における符号テーブルを切り替えるためのマクロブロックの参照関係を示す図である。

[図 18]従来技術の GOP構造の一例を示す図である。

符号の説明

1 映像符号化装置

2 映像復号装置

10 画像情報入力部

11 画像メモリ

12 参照視差情報設定部

13 符号化対象情報非参照符号化部

14 符号化対象情報メモリ

15 符号化対象情報参照符号化部

16 グローバル視差符号ィ匕部

20 符号化対象情報非参照復号部

21 符号化対象情報メモリ

22 符号化対象情報参照復号部

23 グローバル視差復号部

24 画像情報復元部

25 画像情報出力部

発明を実施するための最良の形態

[0061] 以下、実施の形態に従って本発明を詳細に説明する。

[0062] まず、図 1A、 IB及び図 2A, 2Bに、符号テーブルを切り替えるための符号ィ匕対象情報の参照関係の一例を示す。ここで、これらの図では、説明の便宜上、参照視差情報としてグローバル視差ベクトル (グローバル視差情報）を用いることを想定してヽる。

[0063] これらの図では、 2つのカメラ (カメラ Cl、カメラ C2)で撮影された映像を符号ィ匕することを想定しており、カメラ C1に関する符号ィ匕対象情報 (符号ィ匕対象情報とはェント口ピー符号ィ匕の対象となる情報の総称で、予測残差、直交変換係数、マクロブロックタイプなどの情報である）については、カメラ C2の符号化対象情報を参照せずに符号化し、一方、カメラ C2の符号ィ匕対象情報のエントロピー符号ィ匕については、カメラ C1の符号ィ匕済みの符号ィ匕対象情報を参照してエントロピー符号ィ匕することを想定している。

[0064] 図 1A、 IBの例では、カメラ C2において現時点で符号ィ匕対象となっている符号ィ匕対象情報が属するブロック 502 (この例では MPEG— 2のようなブロックベースの符号ィ匕を仮定して、る）の位置〖こ対応するカメラ C 1の画像中の位置 501を、カメラ C 1 の画像中におヽてグローバル視差ベクトル分ずらすことで特定される位置に対応する 1つのブロック（図中で Cと記述されたブロック）の符号ィ匕対象情報に従って符号テ一ブルを切り替えて、その符号テーブルを使って符号ィ匕対象情報を符号ィ匕する。

[0065] なお、上記の例で、ブロック 502の位置に対応するカメラ C1の画像中の位置 501を、カメラ C1の画像中にぉヽてグローバル視差ベクトル分ずらすことで特定される位置に対応する 1つのブロックを特定する場合に、好適例としては、ブロック 501との重複面積が最大となるブロック (例えば C)の位置を対応位置として設定するようにする。

[0066] また、図 2A, 2Bの例では、カメラ C2において現時点で符号化対象となっている符号化対象情報が属するブロック 502 (この例では MPEG— 2のようなブロックベースの符号化を仮定してヽる）の位置に対応するカメラ C 1の画像中の位置 501を、カメラ C1の画像中においてグローバル視差ベクトル分ずらすことで特定される位置周辺に対応する複数のブロック（図中で C, D, E, Fと記述されたブロック）の符号ィ匕対象情報に従って符号テーブルを切り替えて、その符号テーブルを使って符号ィ匕対象情報を符号化する。

[0067] 以下の実施形態例では、 2つのカメラで撮影された多視点動画像を符号化する場合の具体例を、詳細に説明する。

[0068] 図 3に、本実施形態例で利用するカメラ構成の概念図を示す。ここで、図中に示す四角型の図形は各カメラのフレーム (画像)を表すものとする。

[0069] この図に示すように、本実施形態例では、カメラ CI, C2を利用することを想定するとともに、カメラ C1のフレームの全符号ィ匕対象情報を同一時刻のカメラ C2のフレームより前に符号化し、カメラ C2のフレームの符号ィ匕対象情報のエントロピー符号ィ匕においてカメラ CIの (符号ィ匕済みの)符号ィ匕対象情報を参照することを想定する。

[0070] 以下では、説明を簡単にするため、図 3の中でフレームの図に記述されている順番で符号ィ匕していくとする。また、符号化対象情報を符号化する際のブロックのスキャン方法については、各行を左力スキャンし、上の行から処理していくこととする。

[0071] また、本発明では、符号ィ匕対象情報ごとに最適な符号テーブルに切り替えるという構成を採るのである力本実施形態例では、マクロブロックタイプという符号ィ匕対象情報を符号化する場合を想定して、その符号テーブルの切り替えについて具体的に説明する。マクロブロックタイプは、各ブロックでの動き補償の方法やイントラ予測の方法を示す情報であり、整数インデックスである MBtypeとして表現される。本実施形態例では、 MBtypeは 12通りあるとする（つまり、 MBtype = 0,l,....,ll)_o

[0072] また、符号化対象情報のエントロピー符号化の際には、符号化対象情報に対応するブロック周辺の符号ィ匕済み符号ィ匕対象情報を利用したコンテクスト依存型ェントロピー符号ィ匕を行うか、あるいは、それらの符号ィ匕済み符号ィ匕対象情報及び別カメラのフレームの符号ィ匕済み符号ィ匕対象情報を利用したコンテクスト依存型エントロピー符号ィ匕を行うこととする。なお、その際の各符号テーブルは予め適切なものが用意されているとする。

[0073] 図 4に、本実施形態例において利用する映像符号ィ匕装置 1の構成を示す。

[0074] この図に示す映像符号ィ匕装置 1は、カメラ CI, C2のフレームを図 3に示す順番で入力する画像情報入力部 10と、カメラ C1のフレームを蓄積する画像メモリ 11と、カメラ C1とカメラ C2のフレームの間で参照視差情報 (本実施形態では、グローバル視差ベクトル)を求める参照視差情報設定部 12と、カメラ C1の符号化対象情報を符号ィ匕する符号ィ匕対象情報非参照符号ィ匕部 13と、カメラ C1のブロック情報 (符号化対象情報)を蓄積する符号化対象情報メモリ 14と、カメラ C2の符号化対象情報を符号化する符号ィ匕対象情報参照符号ィ匕部 15と、グローバル視差べ外ルを符号ィ匕するグロ一バル視差符号ィ匕部 16とを備える。

[0075] 図 5に、映像符号化装置 1における符号化対象情報参照符号化部 15の詳細な構成を示す。

[0076] この図に示すように、符号化対象情報参照符号化部 15は、グローバル視差べタトルから対応位置を求める対応位置設定部 150と、カメラ C 1とカメラ C2の符号化対象情報に基づいて符号テーブルを設定するための参照パラメータを設定する参照パラメータ設定部 151と、参照パラメータを基に符号テーブルを設定する符号テーブル設定部 152と、カメラ C2の画像から符号化対象情報を設定する符号化対象情報設定部 153と、カメラ C2の符号化対象情報を符号化する符号化対象情報符号化部 15 4とを備える。

[0077] 図 6に、このように構成される映像符号ィ匕装置 1の実行する動作フローを示す。

[0078] この動作フローに示すように、まず、カメラ C1とカメラ C2のフレーム力図 3に示されている順番で、交互に画像情報入力部 10に入力される (S10) _o

[0079] 入力されたフレームがカメラ C1のフレームであれば、符号化対象情報非参照符号化部 13にて、各ブロックの符号ィ匕対象情報が符号化される（S11ZS12)。また、画像メモリ 11には 1フレーム分のメモリがあり、常にカメラ C1の最新の入力済みフレームが蓄積される。

[0080] 一方、入力されたフレームがカメラ C2のフレームであれば、符号化対象情報参照符号ィ匕部 15にて、各ブロックの符号ィ匕対象情報が符号化される（S11ZS13)。なお、カメラ C2のフレームの符号ィ匕対象情報の符号ィ匕では、事前に参照視差情報設定部 12で求められたグローバル視差ベクトルが利用される。

[0081] そして、最後に、このようにして生成した符号ィ匕対象情報の符号ィ匕データを出力する（S14)。

[0082] 図 7に、カメラ C2の符号ィ匕対象情報の符号ィ匕処理の詳細な動作フローを示す。

[0083] 参照視差情報設定部 12には、画像メモリ 11からカメラ C1の画像が入力され、画像情報入力部 10からカメラ C2の画像が入力される。そして、参照視差情報設定部 12 でグローバル視差ベクトルが求められる（S 130)。

[0084] グローバル視差ベクトルの計算方法は様々な方法が考えられる力ここでは、各ブロック（例えばマクロブロック）ごとの視差ベクトルの平均ベクトルとして求めることとする。

[0085] すなわち、カメラ C2の b (b = 0, 1, B-1)番目のブロックの画素値を、

I ( i, j) i=0, 1, 1-1, j = 0, 1, J-l と表し、カメラ CIの画像中で左上の画素の位置が（i'， j ' )である、大きさ力 XJであるブロックの画素値を、

I ( i, j) i=0, 1, 1-1, j = 0, 1, J-l

，と表すならば、参照視差情報設定部 12では、カメラ C2の各ブロックについて、以下の評価関数に基づいてブロックマッチングを行う。

[0086] E (b, i',j') =∑ ∑ (I ( i, j) -I ( i, j) ) ²

i j b ただし、∑ は i=0〜I—lについての総和、∑ は】=0〜】ー1にっぃての総和。ここで、各ブロックにおいて E (b, i'J')を最小化することで求まった視差ベクトルをく d >としたとき、グローバル視差ベクトル < d>を例えば以下のような式で求める。 b

[0087] < d> =∑< d >/B

b

ただし、∑は b = 0〜： B— 1についての総和。

このようにして求められたグローバル視差ベクトルはグローバル視差符号ィ匕部 16に入力され、グローバル視差符号化部 16にて符号化される（S 131)。

[0088] グローバル視差ベクトルの符号ィ匕は、本実施形態例では非可逆符号ィ匕されることとする。ここでは、量子化ステップサイズが 1で量子化されて (最も近い整数にマツピングされることと等価である）、エントロピー符号化されることとする。

[0089] 次に、

、て、符号化対象情報をエントロピー符号化するために、符号ィ匕対象情報設定部 153にて符号ィ匕対象情報を求める (S 133)。具体的には、動き補償による動きベクトル、 MBtypeなどの情報や直交変換係数などの符号化対象情報が求められる。

[0090] 次に、各ブロックについて、符号化対象情報符号化部 154にて符号化対象情報を符号化する。その際、対応位置設定部 150は、符号化されて復号されたグローバル視差ベクトルを用いて、対応位置がカメラ C1のフレーム内に存在する力、判定を行う (S 134)。 [0091] 本実施形態例では、図 8A, 8Bに示すように、対応位置は、カメラ C2の画像中のブロック bに対応するカメラ C 1の画像中の位置 501をグローバル視差ベクトル分シフトさせた位置に最も近い 4つのブロックの位置とする。具体的には、現ブロック bの左上の角の位置を Iとしたとき、カメラ C1の画像においてブロックの左上の角の位置が I +

b b

< d>に最も近!、4つのブロックの位置を対応位置とする。ただし、 I + < d>とブロッ

b

ク左上の角の位置との距離が、予め設定された閾値 maxDistより大きい場合には対応位置とはしないものとする。

[0092] 対応位置設定部 150により対応位置が存在しないと判定された場合、エントロピー符号ィ匕の際の符号テーブルの切り替えは、同じ画像内の符号ィ匕済みのブロックのみの参照で行う。

[0093] すなわち、対応位置が存在しない場合は、参照パラメータ設定部 151は、図 8B中の A、 Bと記述されたブロックの MBtypeの組を求める。例えば、（0, 5)というような M Btypeの組を求めるのである。

[0094] これを受けて、符号テーブル設定部 152は、この（0, 5)という MBtypeの組に対応した符号テーブルをエントロピー符号ィ匕用に設定する（S 137)。なお、ここで利用される符号テーブルはカメラ C1で利用されたものと同じとする。また、符号テーブル設定部 152は、あり得るすべての MBtypeの値の組み合わせについてそれぞれ符号テ一ブルを保持している。

[0095] そして、この符号テーブルの設定を受けて、符号ィ匕対象情報符号ィ匕部 154は、この符号テーブル内で現ブロックの MBtypeに対応した符号を出力する（S138)。即ち、現ブロックの符号化対象情報が符号化される。

[0096] 一方、対応位置設定部 150により対応位置が存在すると判定された場合 (図 8Aで C、 D、 E、 Fと記述されたブロックである）は、参照パラメータ設定部 151は、 4つの対応位置に関する MBtypeの最頻値を求めて、その MBtypeと、図 8B中の A、 Bと記述されたブロックの MBtypeの組とに基づいて、最終的な MBtypeの組を求める。即ち、符号化対象画像中の、現在符号化しょうとしているブロック bの周辺の符号化済み符号ィ匕対象情報と、符号ィ匕済み参照画像中の対応位置の符号ィ匕対象情報とが参照される。 [0097] 例えば、 4つの対応位置の MBtypeが（0, 5, 5, 4)であったとすると、最頻値は 5である。また、図 8中の A、 Bと記述されたブロックの MBtypeの組が（0, 5)だったとすると、参照パラメータ設定部 151は、これらの MBtypeに基づいて、最終的に（0, 5, 5) と!、う MBtypeの糸且を求めるのである。

[0098] これを受けて、符号テーブル設定部 152は、この（0, 5, 5)という MBtypeの組に対応した符号テーブルをエントロピー符号ィ匕用に設定する（S 135)。

[0099] そして、この符号テーブルの設定を受けて、符号ィ匕対象情報符号ィ匕部 154は、この符号テーブル内で現ブロックの MBtypeに対応した符号を出力する（S136)。

[0100] これらの処理については、画像内の全ブロックの符号ィ匕対象情報が符号ィ匕されるまで行われる（S132ZS139ZS140)。

[0101] このようにして、本発明の映像符号化装置 1は、視差方向の相関を利用して、ェント口ピー符号化の対象となる符号化対象情報を符号化するように処理するのである。

[0102] 次に、本発明の映像復号装置について説明する。

[0103] 図 9に、本実施形態例において利用する映像復号装置 2の構成を示す。

[0104] この図に示す映像復号装置 2は、カメラ C1に関する符号ィ匕対象情報を復号する符号化対象情報非参照復号部 20と、カメラ C1について復号された符号ィ匕対象情報を蓄積する符号化対象情報メモリ 21と、カメラ C2に関する符号化対象情報を復号する符号ィ匕対象情報参照復号部 22と、グローバル視差べ外ルを復号するグローバル視差復号部 23と、符号化対象情報に基づ!/、て画像を復元する画像情報復元部 24と、復元された画像を出力する画像情報出力部 25とを備える。

[0105] 図 10に、映像復号装置 2における符号化対象情報参照復号部 22の詳細な構成を示す。

[0106] この図に示すように、符号化対象情報参照復号部 22は、カメラ C2の符号化対象情報を復号する符号化対象情報復号部 220と、復号されたグローバル視差ベクトルから対応位置を求める対応位置設定部 221と、カメラ C1とカメラ C2の復号済み符号ィ匕対象情報に基づいて符号テーブルを設定するための参照パラメータを設定する参照パラメータ設定部 222と、参照パラメータを基に符号テーブルを設定する符号テープル設定部 223とを備える。 [0107] 図 11に、このように構成される映像復号装置 2の実行する動作フローを示す。

[0108] まず、映像復号装置 2では、カメラ C1とカメラ C2の符号ィ匕データ力図 3に示されて、る順番で入力される (S20)。

[0109] このとき、カメラ C1の符号化データについては符号化対象情報非参照復号部 20に入力され、カメラ C2の符号ィ匕データについては符号ィ匕対象情報参照復号部 22に入力される。ここで、カメラ C2の符号ィ匕データが入力される際には、グローバル視差べタトルの符号化データもグローバル視差復号部 23に入力される。

[0110] 入力された符号化データがカメラ C1の符号化データであれば、符号化対象情報非参照復号部 20にて、各ブロックの符号化対象情報が復号される（S21ZS22)。

[0111] 一方、入力された符号化データがカメラ C2の符号化データであれば、符号化対象情報参照復号部 22にて、各ブロックの符号化対象情報が復号される (S21ZS23)。

[0112] そして、最後に、このようにして復号した符号ィ匕対象情報に基づいて画像を復元して出力する（S24)。

[0113] 図 12に、カメラ C2の符号ィ匕対象情報の復号処理の詳細な動作フローを示す。

[0114] カメラ C2の符号化対象情報の復号処理では、まずグローバル視差ベクトルの符号化データがグロ一ノレ視差復号部 23に入力され、グローバル視差復号部 23でグロ一バル視差ベクトルが復号される（S230)。

[0115] そして、対応位置設定部 221にて、復号されたグローバル視差ベクトルを用いて、カメラ C1のフレーム内に、カメラ C2のフレーム内の現ブロック bに対応する対応位置が存在するか、判定される（S232)。対応位置の決定方法については、符号化時と同様である。

[0116] 対応位置設定部 221により対応位置が存在しないと判定された場合、カメラ C2の復号済み符号ィヒ対象情報のみを参照することで符号テーブルの切り替えが行われ、現ブロックの符号ィ匕対象情報が復号される（S235ZS236)。参照関係については、符号ィ匕時と同様である。

[0117] このとき、参照パラメータ設定部 222と符号テーブル設定部 223については、映像符号化装置 1におヽて、対応位置が存在しな!、場合に行われる参照パラメータ設定部 151と符号テーブル設定部 152と同様の動作をして、現ブロックの MBtypeを復号する。

[0118] 一方、対応位置設定部 221により対応位置が存在すると判定された場合 (符号ィ匕の場合と同じく図 8Aで C、 D、 E、 Fと記述されたブロックである）、カメラ C2の復号済み符号ィ匕対象情報及びカメラ C1の対応位置の復号済み符号ィ匕対象情報を参照することで符号テーブルの切り替えが行われ、現ブロックの符号化対象情報が復号される（S233ZS234)。

[0119] このとき、参照パラメータ設定部 222と符号テーブル設定部 223については、映像符号化装置 1において、対応位置が存在する場合に行われる参照パラメータ設定部 151と符号テーブル設定部 152と同様の動作をして、現ブロックの MBtypeを復号する。

[0120] 現ブロックの全ての符号化対象情報が復号されると、画像情報復元部 24で、これらの情報をもとに当該ブロックの画像情報が復元され、画像情報出力部 25から出力される（S237)。

[0121] これらの処理については、画像内の全ブロックが復号されるまで行われる（S231Z S238ZS239)。

[0122] このようにして、本発明の映像復号装置 2は、視差方向の相関を利用して、本発明の映像符号化装置 1により生成された符号化データを復号するように処理するのである。

[0123] 前述した実施形態例での符号ィ匕処理はマクロブロックタイプと!/、う情報のエントロピ一符号ィ匕に関するものであるが、本発明は、その他のエントロピー符号ィ匕の対象となる情報のエントロピー符号ィ匕に対しても、そのまま応用可能である。以下にいくつかの例を示す。

[0124] 具体的には、 H.264でエントロピー符号ィ匕の対象となり、 DCT係数に関連する情報で &) 、し oded block pattern、 Coded bloc flag、； gnificanceマップ、レへノレ '隋報【こ対しての本発明の応用を示す。

[0125] 前述の通り、 H.264では、エントロピー符号ィ匕の対象となる情報は全てビット列で表現されており、 1ビットずつコンテクスト依存型の算術符号ィ匕でエントロピー符号化される。すなわち、本発明を応用する場合は、各ビットをエントロピー符号ィ匕するときの符号テーブル (算術符号ィ匕なので、具体的には確率テーブルである）の切り替えに利用可能である。

[0126] 前述のように、 Coded block patternという情報は、マクロブロック内の 4つの 8 X 8ブロックにおいて、どのブロックに非ゼロ係数がある力示す情報である。具体的には、 8 X 8ブロックにおいて非ゼロ係数の存在の有無を 1ビットで表すような、合計 4ビットの情報として表現される。

[0127] ある 8 X 8ブロックの Coded block patternのビットを符号化する際には、例えば図 1 3A, 13Bに示すような形の参照を、 8 X 8ブロックを単位として行えば良い。図 13A, 13Bは、それぞれ図 8A, 8Bに対応した、ブロックの位置関係を示す図である。つまり、 8 8ブロック八、 B、 Cのビットの全組み合わせに対応した符号テーブルをそれぞれ用意しておき、そのうちの、符号ィ匕対象の 8 X 8ブロック bに対して最も相応しい A、 B 、 Cのビットの組み合わせに対応した符号テーブルでエントロピー符号ィ匕すれば良ヽ

[0128] また、 Coded block flagと!、う情報は、上述のように、非ゼロ係数が存在する 8 X 8ブロック内の 4つの 4 X 4ブロックにおいて、どのブロックに非ゼロ係数があるか示す情報である。従い、 Coded block flagは Coded block patternと同じ形式の情報であり、本発明の応用も同じ形で行える。

[0129] 次に、 Significanceマップのエントロピー符号化における本発明の応用方法の例を示す。 Significanceマップという情報は、上述のように、 Coded block flagで示される 4 X 4ブロック内で、どの DCT係数が非ゼロである力示した情報である。具体的には、ある DCT係数が非ゼロであるか否かを 1ビットで表し、ある順番に従って当該 4 X 4ブロック中の 16個の DCT係数をスキャンし、 DCT係数が非ゼロであった場合は 1として、そうでな、場合は 0とする。これらのビットを Significanceビットと呼ぶ。

[0130] なお、 DCT係数が非ゼロであって 1とされたときは、その DCT係数がスキャンの中で最後の非ゼロ係数であった力否かを 1ビットで表して (非ゼロ係数であった場合は値 1、そうでな、場合は値 0) Significanceマップに含める。これらのビットを Lastビットと呼ぶ。

スキャン中に Lastビットの値が 1であるような状況が発生した場合 (即ち、その位置の DCT係数が最後の非ゼロ係数であった場合）、以後の DCT係数に関する Significan ceビットは必要ない。また、スキャンの中で最後の DCT係数が非ゼロであるか否かにっ、ては、それまでの Significanceビットと Lastビットから明らかなので、この DCT係数につ、ては情報は特に必要な、。

[0131] H.264では、 Significanceビットと Lastビットを独立に符号化する力符号テーブルはスキャンの中での位置に応じて切り替える（上述のように、最後の DCT係数にっヽては情報が不要なので、 15個の符号テーブルが要求される)。本発明を応用する場合は、例えば図 13A、 13Bに示されるように、別カメラの 4 X 4ブロック Cにおける非ゼロ係数の数を参照して符号テーブルを切り替えることが考えられる。これは、多視点動画像の性質上、ブロック Cにおいて非ゼロである DCT係数の数が大きいほど、符号化対象の 4 X 4ブロック bの 16個の Significanceビットが 1である（即ち、 DCT係数が非ゼロである）確率が高く、 Lastビットが 0である確率が高!、からである。

[0132] 最後に、レベル情報のエントロピー符号ィ匕における本発明の応用方法の例を示す。 H.264では、整数値である DCT係数の量子化値を 2進のビット列に変換し、 Signific anceマップの場合と同様にスキャンしながら、各ビットをエントロピー符号ィ匕していく。

[0133] このときに利用する符号テーブルは、ブロック内のこれまでのスキャン中で発生した、絶対値が 1より大きい量子化値の数によって切り替える。スキャン中のある時点で、絶対値が 1より大き!/、量子化値が多く発生してヽる場合、その時点で符号ィ匕対象となつて、る量子化値は大きな値を持つ確率が大き、ため、この性質を反映した符号テ一ブルを用意しておく。

[0134] 多視点動画像を符号化する場合、図 13A, 13Bに示されるような別カメラ (C1)のブロック Cにおける DCT係数の量子化値が大きければ、現在符号化対象となって!/ヽるブロック (b)の量子化値も大きい値が多いという性質がある。従って、本発明を応用する場合は、例えば、ブロック Cにおける量子化値の平均値に応じた符号テーブルを用意しておき、符号ィ匕対象のブロック bに関する別カメラのブロック Cの量子化値の平均値に対応した符号テーブルによってエントロピー符号ィ匕すれば良い。

[0135] 以上、実施形態例に従って本発明を説明したが、本発明はこれに限定されるものではない。例えば、実施形態例ではカメラ CI, C2という 2台のカメラにより撮像された映像を処理対象として本発明を説明したが、本発明は 3台以上のカメラにより撮像された映像に対してもそのまま適用できるものである。

[0136] また、上述の実施形態例では、参照視差情報を映像符号化装置において求めた場合を記載した。一方で、本発明は、種々の視差推定手法を用いて予め外部において求められた視差情報を入力して、当該視差情報を参照視差として用いて符号化処理すること〖こよっても実現できる。

[0137] また、実施形態例では視差情報として視差べ外ルを用いることを想定したが、本発明は視差ベクトル以外のものを視差情報として用いることでもよ、。

[0138] 具体的には、例えば、参考文献 4 (Aljoscha Smolic, Thomas Sikora and Jens- Raine r Ohm, Long-Term Global Motion Estimation and its Application for Sprite Coding, Content Description, and Segmentation", IEEti, i rans actions on circuits and Syste ms for Video Technology, Vol.9, No.8, pp.1227- 1242, December, 1999)で説明されて、るようなグローバル動きモデルを視差方向に適用したグローバル視差モデルを禾 IJ用してちょい。

この場合、映像符号ィ匕装置においてグロ一ノレ視差モデルのパラメータを求めて、これらのパラメータを符号化する。また、対応位置を求める際には、これらのパラメ一タをグローバル視差モデルに適用してグローバル視差ベクトルを求めて、対応位置を決定する。一方、映像復号装置では、復号されたグローバル視差モデルのパラメータをグローバル視差モデルに適用して対応位置を決定する。

[0139] また、上記の実施形態例では、カメラが 2台あり、片方のカメラの復号画像を参照する場合を記載した力各カメラのカメラパラメータ (カメラの位置や姿勢、レンズの画角等)が既知で、異なる 2台以上のカメラの復号画像を参照できる場合は、符号化対象画像を利用せずに，図 14に示したような方法で符号化対象の画像の各画素に関する視差情報 (視差ベクトル)を推定することができる。

図 14において、被写体 600に対し、符号ィ匕対照画像を撮像するカメラ C2の視点位置を 620、同被写体 600を撮像する（即ち、参照画像を出力する）別の 2つのカメラ C 1, C3の視点位置をそれぞれ 610、 630とする。また、符号化対照画像において視差を求めたい画素位置を 640とする。この図に示されているように、被写体 600に対する真の視差においては各参照画像において画素位置 640に対応する対応点の画素値がほぼ同じ値になるはずである。従って、多くの視差推定法では、様々な奥行きに関して各参照画像の対応点の画素値を比較して、画素値が最も近くなる奥行き（図 14では符号 650で示す）と、既知のカメラパラメータに基づいて、カメラ C1もしくは C3からの視差を推定できる。この処理は符号化対象画像の画素単位で行うことが可能である。

上記の実施形態例の構成においてこの方法を実施する場合は、映像符号化装置 1のグローバル視差符号ィ匕部 16、映像復号装置 2のグローバル視差復号部 23は不要である。そして、例えば符号ィ匕対象ブロックの各画素に関して推定された視差べクトルの平均を用いて、上記実施例と同様の処理により符号ィ匕を実施すればよい。具体的には、符号化対象情報の符号化処理において、図 15に示すような処理を行う。ここでは、図 7のステップ S130, S131の処理に代えて、ステップ S1300力設けられ、同ステップにおいて、カメラ C2により撮像された符号ィ匕対象画像と同時刻に撮像されたカメラ CI, C3の画像の復号画像を用いて、上述の方法によりカメラ C1もしくは C3からの視差を推定する。

また、復号処理においては、図 16に示すような処理を行う。ここでは、図 12のステツプ S230の処理に代えてステップ S2300が設けられ、同ステップにおいて、カメラ C2 により撮像された符号ィ匕対象画像と同時刻に撮像されたカメラ CI, C3の画像の復号画像を用いて、同様の方法によりカメラ C1もしくは C3からの視差を推定する。

Claims

請求の範囲

[1] 複数の画像を一つの映像として符号ィ匕する映像符号ィ匕方法であって、

前記符号テーブルを使!ヽ、前記第 1の画像内の前記符号化対象情報を符号化する符号化対象情報符号化ステップと

を有する映像符号化方法。

[2] 請求項 1に記載の映像符号ィ匕方法にぉ、て、

前記参照視差情報設定ステップでは、前記第 1及び第 2の画像間の平均的な視点ずれを示すグローバル視差情報を前記参照視差情報として設定するとともに、前記グローバル視差情報を符号ィヒするグローバル視差情報符号化ステップを有する映像符号化方法。

[3] 請求項 1に記載の映像符号ィ匕方法にぉ、て、

前記参照視差情報設定ステップでは、前記第 2の画像と別の第 3の画像とを用いて両画像間の視差を推定し、該視差と、前記第 1〜第 3の画像の撮像装置間の位置関係とに基づいて前記参照視差情報を設定する映像符号化方法。

[4] 請求項 1に記載の映像符号ィ匕方法にぉ、て、

前記符号テーブル設定ステップでは、前記第 2の画像内の前記対応位置の符号化対象情報と、前記第 1の画像内の前記所定位置の周辺の位置に対する符号化済みの符号ィ匕対象情報とに対応した符号テーブルを設定する映像符号ィ匕方法。

[5] 請求項 1に記載の映像符号ィ匕方法にぉ、て、

前記符号テーブル設定ステップでは、前記第 2の画像内の前記対応位置の周辺の位置に対応する符号ィヒ対象情報も参照して前記符号テーブルを設定する映像符号化方法。

[6] 請求項 1に記載の映像符号ィ匕方法にぉ、て、

前記符号化対象情報は、画像を分割したブロックごとに設定されるものであり、前記対応位置設定ステップでは、前記第 2の画像におヽて前記所定位置に対応するブロックの位置を、前記参照視差情報に基づ、てずらしたときに該ブロックとの重複面積が最大となるブロックの位置を対応位置として設定する映像符号ィ匕方法。

[7] 請求項 1に記載の映像符号ィ匕方法にぉ、て、

前記符号化対象情報は、画像を分割したブロックごとに設定されるものであり、前記対応位置設定ステップでは、前記第 2の画像におヽて前記所定位置に対応するブロックの位置を、前記参照視差情報に基づ、てずらした位置の周辺の複数のブロックの位置を対応位置として設定する映像符号ィ匕方法。

[8] 請求項 4又は 5に記載の映像符号ィ匕方法において、

前記符号テーブル設定ステップでは、前記符号テーブルの設定に用いる符号化対象情報の最頻値に対応する符号テーブルを設定する映像符号ィ匕方法。

[9] 請求項 4又は 5に記載の映像符号ィ匕方法において、

前記符号テーブル設定ステップでは、前記符号テーブルの設定に用いる符号化対象情報の平均値に対応する符号テーブルを設定する映像符号ィ匕方法。

[10] 複数の画像を一つの映像として符号化することで生成された符号化データを復号する映像復号方法であって、

前記符号テーブルを使ヽ、前記第 1の画像内の前記符号化対象情報を復号する符号化対象情報復号ステップとを有する映像復号方法。

[11] 請求項 10に記載の映像復号方法において、

前記参照視差情報設定ステップでは、前記第 1及び第 2の画像間の平均的な視点ずれを示すグローバル視差情報を復号し、これを前記参照視差情報として設定する映像復号方法。

[12] 請求項 10に記載の映像復号方法において、

前記参照視差情報設定ステップでは、前記第 2の画像と別の第 3の画像とを用いて両画像間の視差を推定し、該視差と、前記第 1〜第 3の画像の撮像装置間の位置関係とに基づいて前記参照視差情報を設定する映像復号方法。

[13] 請求項 10に記載の映像復号方法において、

前記符号テーブル設定ステップでは、前記第 2の画像内の前記対応位置の符号化対象情報と、前記第 1の画像内の前記所定位置の周辺の位置に対する復号済みの符号ィ匕対象情報とに対応した符号テーブルを設定する映像復号方法。

[14] 請求項 10に記載の映像復号方法において、

前記符号テーブル設定ステップでは、前記第 2の画像内の前記対応位置の周辺の位置に対応する符号ィヒ対象情報も参照して前記符号テーブルを設定する映像復号方法。

[15] 請求項 10に記載の映像復号方法において、

前記符号化対象情報は、画像を分割したブロックごとに設定されるものであり、前記対応位置設定ステップでは、前記第 2の画像におヽて前記所定位置に対応するブロックの位置を、前記参照視差情報に基づ、てずらしたときに該ブロックとの重複面積が最大となるブロックの位置を対応位置として設定する映像復号方法。

[16] 請求項 10に記載の映像復号方法において、

前記符号化対象情報は、画像を分割したブロックごとに設定されるものであり、前記対応位置設定ステップでは、前記第 2の画像におヽて前記所定位置に対応するブロックの位置を、前記参照視差情報に基づ、てずらした位置の周辺の複数のブロックの位置を対応位置として設定する映像復号方法。

[17] 請求項 13又は 14に記載の映像復号方法において、前記符号テーブル設定ステップでは、前記符号テーブルの設定に用いる符号化対象情報の最頻値に対応する符号テーブルを設定する映像復号方法。

[18] 請求項 13又は 14に記載の映像復号方法において、

前記符号テーブル設定ステップでは、前記符号テーブルの設定に用いる符号化対象情報の平均値に対応する符号テーブルを設定する映像復号方法。

[19] 複数の画像を一つの映像として符号ィ匕する映像符号ィ匕装置であって、

を有する映像符号化装置。

[20] 請求項 19に記載の映像符号化装置において、

前記参照視差情報設定部は、前記第 1及び第 2の画像間の平均的な視点ずれを示すグローバル視差情報を前記参照視差情報として設定するとともに、

前記グローバル視差情報を符号ィヒするグローバル視差情報符号ィヒ部を有する映像符号化装置。

[21] 請求項 19に記載の映像符号化装置において、

前記参照視差情報設定部は、前記第 2の画像と別の第 3の画像とを用いて両画像間の視差を推定し、該視差と、前記第 1〜第 3の画像の撮像装置間の位置関係とに基づ!ヽて前記参照視差情報を設定する映像符号化装置。

[22] 複数の画像を一つの映像として符号化することで生成された符号化データを復号する映像復号装置であって、

を有する映像復号装置。

[23] 請求項 22に記載の映像復号装置において、

前記参照視差情報設定部は、前記第 1及び第 2の画像間の平均的な視点ずれを示すグローバル視差情報を復号し、これを前記参照視差情報として設定する映像復号装置。

[24] 請求項 22に記載の映像復号装置において、

前記参照視差情報設定部は、前記第 2の画像と別の第 3の画像とを用いて両画像間の視差を推定し、該視差と、前記第 1〜第 3の画像の撮像装置間の位置関係とに基づ!、て前記参照視差情報を設定する映像復号装置。

[25] 請求項 1に記載の映像符号化方法の実現に用、られる処理をコンピュータに実行させるための映像符号ィ匕プログラム。

[26] 請求項 10に記載の映像復号方法の実現に用、られる処理をコンピュータに実行させるための映像復号プログラム。

[27] 請求項 1に記載の映像符号ィ匕方法の実現に用いられる処理をコンピュータに実行させるための映像符号ィ匕プログラムを記録したコンピュータ読み取り可能な記録媒体

[28] 請求項 10に記載の映像復号方法の実現に用、られる処理をコンピュータに実行させるための映像復号プログラムを記録したコンピュータ読み取り可能な記録媒体。