JPWO2010035731A1

JPWO2010035731A1 - 画像処理装置および方法

Info

Publication number: JPWO2010035731A1
Application number: JP2010530845A
Authority: JP
Inventors: 佐藤　数史; 数史佐藤; 矢ケ崎　陽一; 陽一矢ケ崎
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2008-09-24
Filing date: 2009-09-24
Publication date: 2012-02-23
Also published as: WO2010035731A1; US20110176741A1; CN102160379A

Abstract

画像のローカルな性質に基づいた重み付け予測を行うことができる画像処理装置および方法に関する。インターＴＰ動き予測・補償部７６は、符号化対象のフレームの画像のブロックについて、インターテンプレートマッチング方式によるマッチングを行い、マッチングにおけるテンプレート領域の画素値から算出された重み係数を用いたImplicit Weighted Predictionを行う。この重み係数は、重み係数算出部７７により算出される。本発明は、例えば、H.264/AVC方式で符号化する画像符号化装置に適用することができる。

Description

本発明は、画像処理装置および方法に関し、特に、画像のローカルな性質に基づいた重み付け予測（Weighted Prediction）を行うことができるようにする画像処理装置および方法に関する。

近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEG（Moving Picture Experts Group phase）などの方式を採用して画像を圧縮符号する装置が普及しつつある。

特に、MPEG2（ISO/IEC 13818-2）は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4乃至8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像であれば18乃至22Mbpsの符号量（ビットレート）を割り当てることで、高い圧縮率と良好な画質の実現が可能である。

このMPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していない。しかしながら、携帯端末の普及により、今後、そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。例えば、MPEG4の画像符号化方式に関しては、1998年12月にISO/IEC 14496-2として、その規格が国際標準に承認されている。

更に、近年、テレビ会議用の画像符号化を目的として、H．26L (ITU-T Q6/16 VCEG）という標準の規格化が進んでいる。H．26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH．26Lをベースに、H．26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われている。これは、2003年3月にH．264及びMPEG-4 Part10 （Advanced Video Coding、以下ＡＶＣと称する）という名で国際標準となっている。

ところで、MPEG-2等の符号化方式においては、線形内挿処理により、1/2画素精度の動き予測・補償処理が行われるが、ＡＶＣ符号化方式においては、６タップのFIR(Finite Impulse Response Filter)フィルタを用いた1/4画素精度の動き予測・補償処理が行われる。これにより、ＡＶＣ符号化方式では、符号化効率が向上するが、膨大な動きベクトル情報が生成される。従って、この動きベクトル情報をそのまま符号化すると、符号化効率の低下を招く。このため、ＡＶＣ符号化方式においては、所定の方法により、動きベクトルの符号化情報の低減が実現されている。

この方法としては、例えば、これから符号化される動き補償ブロックの予測動きベクトル情報を、既に符号化済の、隣接する動き補償ブロックの動きベクトル情報を用いてメディアンオペレーションにより生成する方法がある。

しかしながら、この方法が用いられる場合であっても、画像圧縮情報における動きベクトル情報の占める割合は少なくない。そこで、符号化対象のフレーム(以下、対象フレームと称する)の画像内のこれから符号化する対象ブロックに対して、所定の位置関係で隣接する、復号画像からなるテンプレート領域と相関が最も高い画像の領域を、参照されるフレーム（以下、参照フレームと称する）の復号画像から探索して、探索された領域と所定の位置関係とに基づいて動き予測を行う方法が提案されている（例えば、非特許文献１参照）。

この方法は、インターテンプレートマッチング方式と称され、マッチングに復号画像を用いているため、探索範囲を予め定めておくことで、符号化装置と復号装置において同一の処理を行うことが可能である。すなわち、復号装置においても、インターテンプレートマッチング方式で動き予測を行うことにより、符号化装置からの画像圧縮情報の中に動きベクトル情報を持つ必要がなくなり、符号化効率の低下を抑えることが可能である。

また、MPEG-2符号化方式等に基づき、フェードを含むシーン等を符号化すると、符号化効率が低下する。

すなわち、図１に示されるように、フェード等により、フレームＹ₁、フレームＹ₀、フレームＸの順に暗くなる画像の動き補償を行う場合、MPEG-2符号化方式等で規定されている動き補償方式では、フレーム間の輝度変化分を吸収することができない。例えば、符号化済みのフレームＹ₀を用いて、符号化対象のフレームＸの動き補償を行う場合、フレームＹ₀とフレームＸの輝度差分がノイズ（予測誤差）として現れてしまう。その結果、符号化効率が低下する。

そこで、このような符号化効率の低下を防止するため、ＡＶＣ方式では、Weighted Predictionと呼ばれる動き補償方式が規定されている。

そして、Ｐピクチャでは、Weighted PredictionのうちのExplicit Weighted Predictionと呼ばれる方式が使用可能であり、これが用いられる場合、予測画像Predは、以下の式（１）により求められる。

Pred＝w₀×P(L0)＋d₀ ・・・（１）

なお、式（１）において、P(L0)は、動きベクトル情報により指し示されるList0参照フレームから抽出される予測画像であり、w₀，d₀は、それぞれ、画像圧縮情報中に含まれる、重み係数、オフセット値である。

また、Ｂピクチャでは、Weighted PredictionのうちのExplicit Weighted Predictionだけでなく、Implicit Weighted Predictionも使用可能である。Explicit Weighted PredictionやImplicit Weighted Predictionが用いられる場合、２つの参照フレームをL0参照フレームおよびL1参照フレームとすると、以下の式（２）により、予測画像Predが求められる。

Pred＝w₀×P(L0)＋w₀×P(L1)＋d₀ ・・・（２）

ただし、式（２）において、P(L0)，P(L1)は、それぞれ、動きベクトル情報により指し示されるList0参照フレーム、List1参照フレームから抽出される予測画像である。また、式（２）において、w₀，w₁は、Explicit Weighted Predictionでは、画像圧縮中に含まれる重み係数であり、d₀は、画像圧縮情報中に含まれるオフセット値である。

これに対して、Implicit Weighted Predictionでは、d₀＝0で、w₀およびw₁は、以下の式（３）で求められる重み係数である。

w₁＝tb/td
w₀＝1−w₁
・・・（３）

なお、式（３）において、tbは、図２に示すように、L0参照フレームと符号化対象の対象フレームの時間間隔であり、tdは、L0参照フレームとL1参照フレームの時間間隔である。但し、実際には、ＡＶＣ方式では、画像圧縮情報にtbやtdに相当するパラメータが存在しないため、tbやtdの代わりにPOC（Picture Order Count）が用いられている。

"Inter Frame Coding with Template Matching Averaging", Y. Suzuki et al, ICIP2007

しかしながら、POCは、必ずしも、時間軸上、等間隔であるとは限らず、これを基にImplicit Weighted Predictionの重み係数を算出することは、符号化効率の低下につながる場合がある。

また、ＡＶＣ方式において、Explicit Weighted PredictionやImplicit Weighted Predictionで用いられる重み係数およびオフセット値は、同一ピクチャ（スライス）内では同一の値が用いられるが、その値が画面内の各ブロックに対して最適な値であるとは限らない。

本発明はこのような状況に鑑みてなされたものであり、画像のローカルな性質に基づいた重み付け予測を行うことができるようにするものである。

本発明の一側面の画像処理装置は、復号対象のフレームの画像のブロックについて、インターテンプレートマッチング方式によるマッチング処理を行うマッチング手段と、前記マッチング手段による前記マッチング処理におけるテンプレートの画素値を用いた重み付け予測を行う予測手段とを備える。

前記フレームの画像は、Pピクチャであり、前記重み付け予測は、Implicit Weighted Predictionである。

前記予測手段は、前記テンプレートの画素値から算出された重み係数を用いて前記重み付け予測を行うことができる。

前記テンプレートの画素値の平均値をAve(B)とし、そのテンプレートと相関の最も高い、前記マッチングで参照される参照フレームの画像内の領域である参照テンプレートの画素値の平均値をAve(B')とし、前記重み係数をｗ₀としたときの式
ｗ₀＝Ave(B’)/Ave(B)
により前記重み係数を算出する算出手段をさらに備え、前記予測手段は、前記ブロックの予測画素値をPred(A)とし、前記テンプレートと前記ブロックの位置関係と同一の位置関係を、前記参照テンプレートとの間に有する前記参照フレームの画像内の領域の画素値をPix(A’)としたときの、前記重み係数ｗ₀を用いた式
Pred(A)＝ｗ₀×Pix(A’)
により前記ブロックの前記予測画素値を算出することができる。

前記算出手段は、前記重み係数ｗ₀をX/（2ⁿ）の形式で表される値に近似することができる。

前記予測手段は、前記テンプレートの画素値から算出されたオフセットを用いて前記重み付け予測を行うことができる。

前記テンプレートの画素値の平均値をAve(B)とし、そのテンプレートと相関の最も高い、前記マッチングで参照される参照フレームの画像内の領域である参照テンプレートの画素値の平均値をAve(B')とし、前記オフセットをｄ₀としたときの式
ｄ₀＝Ave(B)−Ave(B’)
により前記オフセットを算出する算出手段をさらに備え、前記予測手段は、前記ブロックの予測画素値をPred(A)とし、前記テンプレートと前記ブロックの位置関係と同一の位置関係を、前記参照テンプレートとの間に有する前記参照フレームの画像内の領域の予測画素値をPred(A’)としたときの、前記オフセットｄ₀を用いた式
Pred(A)＝Pred(A’)＋ｄ₀
により前記ブロックの前記予測画素値を算出することができる。

前記予測手段は、前記ブロックについて、符号化時に重み付け予測としてImplicit Weighted Predictionが行われたことを表す情報を、前記フレームの画像としてのPピクチャのヘッダ部から抽出し、その情報に応じて、前記重み付け予測としてImplicit Weighted Predictionを行うことができる。

前記テンプレートの画素値から、前記重み付け予測に用いられる第１および第２の重み係数を算出する算出手段
をさらに備え、
前記算出手段は、前記テンプレートの画素値の平均値をAve_tmplt_Curとし、そのテンプレートと相関の最も高い、前記マッチングで参照される第１の参照フレームの画像内の領域である第１の参照プレートおよび第２の参照フレームの画像内の領域である第２の参照テンプレートの画素値の平均値をそれぞれAve_tmplt_L0，Ave_tmplt_L1とし、前記第１および第２の重み係数をそれぞれｗ₀，ｗ₁としたときの式
ｗ₀＝|Ave_tmplt_L1−Ave_tmplt_Cur|
ｗ₁＝|Ave_tmplt_L0−Ave_tmplt_Cur|
により前記第１および第２の重み係数を算出し、
その第１の重み係数ｗ₀と第２の重み係数ｗ₁を、式
ｗ₀＝ｗ₀/(ｗ₀＋ｗ₁)
ｗ₁＝ｗ₁/(ｗ₀＋ｗ₁)
により正規化し、前記予測手段は、前記ブロックの予測画素値をPred_Curとし、前記テンプレートと前記ブロックの位置関係と同一の位置関係を、前記第１の参照テンプレートとの間に有する前記第１の参照フレームの画像内の領域の画素値および前記第２の参照テンプレートとの間に有する前記第２の参照フレームの画像内の領域の画素値をそれぞれPix_L0，Pix_L1としたときの、正規化後の第１の重み係数ｗ₀および前記第２の重み係数ｗ₁を用いた式 Pred_Cur＝ｗ₀×Pix_L0＋ｗ₁×Pix_L1
により前記ブロックの予測画素値を算出することができる。

前記算出手段は、前記第１の重み係数ｗ₀および前記第２の重み係数ｗ₁をX/(2ⁿ)の形式で表される値に近似することができる。

本発明の第１の側面の画像処理方法は、画像処理装置が、復号対象のフレームの画像のブロックについて、インターテンプレートマッチング方式によるマッチング処理を行い、前記マッチング処理におけるテンプレートの画素値を用いた重み付け予測を行うステップを含む。

本発明の第２の側面の画像処理装置は、復号対象のフレームの画像のブロックについて、インターテンプレートマッチング方式によるマッチング処理を行うマッチング手段と、前記マッチング手段による前記マッチング処理におけるテンプレートの画素値を用いた重み付け予測を行う予測手段を備える。

前記ブロックについて、前記重み付け予測としてImplicit Weighted Predictionが行われたことを表す情報を、前記フレームの画像としてのPピクチャのヘッダ部に挿入する挿入手段をさらに備えることができる。

本発明の第２の側面の画像処理方法は、画像処理装置が、復号対象のフレームの画像のブロックについて、インターテンプレートマッチング方式によるマッチング処理を行い、前記マッチング処理におけるテンプレートの画素値を用いた重み付け予測を行うステップを含む。

本発明の第１の側面においては、復号対象のフレームの画像のブロックについて、インターテンプレートマッチング方式によるマッチング処理が行われ、マッチング処理におけるテンプレートの画素値を用いた重み付け予測が行われる。

本発明の第２の側面においては、符号化対象のフレームの画像のブロックについて、インターテンプレートマッチング方式によるマッチング処理が行われ、マッチング処理におけるテンプレートの画素値を用いた重み付け予測が行われる。

本発明によれば、画像のローカルな性質に基づいた重み付け予測を行うことができる。

フェードを含むシーンの符号化について説明する図である。ｔｂ，ｔｄを示す図である。本発明を適用した画像符号化装置の一実施の形態の構成を示すブロック図である。可変ブロックサイズ動き予測・補償処理を説明する図である。１／４画素精度の動き予測・補償処理を説明する図である。図３の画像符号が装置の符号化処理を説明するフローチャートである。図６の予測処理を説明するフローチャートである。１６×１６画素のイントラ予測モードの場合の処理順序を説明する図である。輝度信号の４×４画素のイントラ予測モードの種類を示す図である。輝度信号の４×４画素のイントラ予測モードの種類を示す図である。４×４画素のイントラ予測の方向を説明する図である。４×４画素のイントラ予測を説明する図である。輝度信号の４×４画素のイントラ予測モードの符号化を説明する図である。輝度信号の１６×１６画素のイントラ予測モードの種類を示す図である。輝度信号の１６×１６画素のイントラ予測モードの種類を示す図である。１６×１６画素のイントラ予測を説明する図である。色差信号のイントラ予測モードの種類を示す図である。イントラ予測処理を説明するフローチャートである。インター動き予測処理を説明するフローチャートである。動きベクトル情報の生成方法の例を説明する図である。インターテンプレートマッチング方式について説明する図である。Ｂピクチャのインターテンプレートマッチング方式について説明する図である。インターテンプレート動き予測処理を説明するフローチャートである。本発明を適用した画像復号装置の一実施の形態の構成を示すブロック図である。図２４の画像復号装置の復号処理を説明するフローチャートである。図２５の予測処理を説明するフローチャートである。拡張されたブロックサイズの例を示す図である。本発明を適用したテレビジョン受像機の主な構成例を示すブロック図である。本発明を適用した携帯電話機の主な構成例を示すブロック図である。本発明を適用したハードディスクレコーダの主な構成例を示すブロック図である。本発明を適用したカメラの主な構成例を示すブロック図である。

図３は、本発明の画像符号化装置の一実施の形態の構成を表している。この画像符号化装置５１は、Ａ／Ｄ変換部６１、画面並べ替えバッファ６２、演算部６３、直交変換部６４、量子化部６５、可逆符号化部６６、蓄積バッファ６７、逆量子化部６８、逆直交変換部６９、演算部７０、デブロックフィルタ７１、フレームメモリ７２、スイッチ７３、イントラ予測部７４、動き予測・補償部７５、インターテンプレート動き予測・補償部７６、重み係数算出部７７、予測画像選択部７８、およびレート制御部７９により構成されている。

なお、以下、インターテンプレート動き予測・補償部７６を、インターＴＰ動き予測・補償部７６と称する。

この画像符号化装置５１は、例えば、H.264およびＡＶＣ（以下H.264/AVCと称する）方式で画像を圧縮符号化する。

H.264/AVC方式においては、ブロックサイズを可変にして、動き予測・補償が行われる。すなわち、H.264/AVC方式においては、16×16画素で構成される１つのマクロブロックを、図４に示されるように、16×16画素、16×8画素、8×16画素、あるいは8×8画素のいずれかのパーティションに分割して、それぞれ独立した動きベクトル情報を持つことが可能である。また、8×8画素のパーティションに関しては、図４に示されるように、8×8画素、8×4画素、4×8画素、あるいは4×4画素のいずれかのサブパーティションに分割し、それぞれ独立した動きベクトル情報を持つことが可能である。

また、H.264/AVC方式においては、6タップのFIRフィルタを用いた1/4画素精度の予測・補償処理が行われる。図５を参照して、H.264/AVC方式における小数画素精度の予測・補償処理について説明する。

図５の例において、位置Ａは、整数精度画素の位置、位置b,c,dは、1/2画素精度の位置、位置e1,e2,e3は、1/4画素精度の位置を示している。まず、以下においては、Clip()を次の式（４）のように定義する。

なお、入力画像が8ビット精度である場合、max_pixの値は255となる。

このとき、位置bおよびdにおける画素値は、6タップのFIRフィルタを用いて、次の式（５）により求められる。

なお、式（５）において、Ａ_p（p＝-2,-1,0,1,2,3）は、位置ｂまたはｄに対応する位置Ａからの水平方向または垂直方向の距離がｐの位置Ａにおける画素値である。また、式（５）において、ｂ，ｄは、それぞれ、位置ｂにおける画素値、位置ｄにおける画素値である。

また、位置ｃにおける画素値は、水平方向および垂直方向に6タップのFIRフィルタを適用し、次の式（６）により求められる。

なお、式（６）において、ｂ_p，d_p（p＝-2,-1,0,1,2,3）は、位置ｃに対応する位置ｂ，ｄからの水平方向または垂直方向の距離がpの位置ｂ，ｄにおける画素値であり、ｃは、位置ｃにおける画素値である。また、式（６）において、Clip処理は、式（６）のＦの演算、即ち水平方向および垂直方向の両方の積和演算を行った後、最後に１度のみ実行される。

さらに、位置ｅ₁乃至ｅ₃における画素値は、次の式（７）のように線形内挿により求められる。

なお、式（７）において、Ａ，ａ乃至ｄ，ｅ₁乃至ｅ₃は、それぞれ、位置Ａ，ａ乃至ｄ，ｅ₁乃至ｅ₃における画素値である。

図３に戻って、Ａ／Ｄ変換部６１は、入力された画像をＡ／Ｄ変換し、画面並べ替えバッファ６２に出力し、記憶させる。画面並べ替えバッファ６２は、記憶した表示の順番のフレームの画像を、ＧＯＰ（Group of Picture）に応じて、符号化のためのフレームの順番に並べ替える。

演算部６３は、画面並べ替えバッファ６２から読み出された画像から、予測画像選択部７８により選択されたイントラ予測部７４からの予測画像または動き予測・補償部７５からの予測画像を減算し、その差分情報を直交変換部６４に出力する。直交変換部６４は、演算部６３からの差分情報に対して、離散コサイン変換、カルーネン・レーベ変換等の直交変換を施し、その変換係数を出力する。量子化部６５は直交変換部６４が出力する変換係数を量子化する。

量子化部６５の出力となる、量子化された変換係数は、可逆符号化部６６に入力される。ここで、量子化された変換係数には、CAVLC（Context-based Adaptive Variable Length Coding)などの可変長符号化、CABAC(Context-based Adaptive Binary Arithmetic Coding)などの算術符号化等の可逆符号化が施され、圧縮される。なお、圧縮画像は、蓄積バッファ６７に蓄積された後、出力される。

また、量子化部６５より出力された、量子化された変換係数は、逆量子化部６８にも入力され、逆量子化された後、さらに逆直交変換部６９において逆直交変換される。逆直交変換された出力は演算部７０により予測画像選択部７８から供給される予測画像と加算されて、局部的に復号された画像となる。デブロックフィルタ７１は、復号された画像のブロック歪を除去した後、フレームメモリ７２に供給し、蓄積させる。フレームメモリ７２には、デブロックフィルタ７１によりデブロックフィルタ処理される前の画像も供給され、蓄積される。

スイッチ７３は、フレームメモリ７２に蓄積された画像を、動き予測・補償部７５またはイントラ予測部７４に出力する。

この画像符号化装置５１においては、例えば、画面並べ替えバッファ６２からのＩピクチャ、Ｂピクチャ、およびＰピクチャが、イントラ予測（イントラ処理とも称する）する画像として、イントラ予測部７４に供給される。また、画面並べ替えバッファ６２から読み出されたＢピクチャ、およびＰピクチャが、インター予測（インター処理とも称する）する画像として、動き予測・補償部７５に供給される。

イントラ予測部７４は、画面並べ替えバッファ６２から読み出されたイントラ予測する画像とスイッチ７３を介してフレームメモリ７２から供給された参照画像としての画像に基づいて、候補となる全てのイントラ予測モードのイントラ予測処理を行い、予測画像を生成する。

イントラ予測部７４は、候補となる全てのイントラ予測モードに対してコスト関数値を算出する。イントラ予測部７４は、算出したコスト関数値のうち、最小値を与える予測モードを、最適イントラ予測モードとして決定する。

イントラ予測部７４は、最適イントラ予測モードで生成された予測画像とそのコスト関数値を、予測画像選択部７８に供給する。イントラ予測部７４は、予測画像選択部７８により最適イントラ予測モードで生成された予測画像が選択された場合、最適イントラ予測モードに関する情報を、可逆符号化部６６に供給する。可逆符号化部６６は、この情報を可変符号化し、圧縮画像におけるヘッダ情報の一部とする。

動き予測・補償部７５は、候補となる全てのインター予測モードの動き予測・補償処理を行う。すなわち、動き予測・補償部７５は、画面並べ替えバッファ６２から読み出されたインター予測する画像と、スイッチ７３を介してフレームメモリ７２から供給される参照画像としての画像に基づいて、候補となる全てのインター予測モードの動きベクトルを検出し、動きベクトルに基づいて参照画像に動き予測と補償処理を施し、予測画像を生成する。

また、動き予測・補償部７５は、スイッチ７３を介してフレームメモリ７２から供給される画像を、インターＴＰ動き予測・補償部７６に供給する。

動き予測・補償部７５は、候補となる全てのインター予測モードに対してコスト関数値を算出する。動き予測・補償部７５は、算出したインター予測モードに対してのコスト関数値と、インターＴＰ動き予測・補償部７６により算出されたインターテンプレート予測モードに対してのコスト関数値のうち、最小値を与える予測モードを、最適インター予測モードとして決定する。

動き予測・補償部７５は、最適インター予測モードで生成された予測画像とそのコスト関数値を、予測画像選択部７８に供給する。動き予測・補償部７５は、予測画像選択部７８により最適インター予測モードで生成された予測画像が選択された場合、最適インター予測モードに関する情報、およびその最適インター予測モードに応じた情報（動きベクトル情報、参照フレーム情報、テンプレート方式情報（詳細は後述する）など）を可逆符号化部６６に出力する。可逆符号化部６６は、動き予測・補償部７５からの情報をやはり可変長符号化、算術符号化といった可逆符号化処理し、圧縮画像のヘッダ部に挿入する。

インターＴＰ動き予測・補償部７６は、動き予測・補償部７５から供給される画像に基づいて、インターテンプレートマッチング方式またはインターテンプレートWeighted Prediction方式（詳細は後述する）で、インターテンプレート予測モードの動き予測と補償処理を行う。その結果、予測画像が生成される。

なお、インターテンプレートWeighted Prediction方式とは、インターテンプレートマッチング方式とWeighted Predictionを組み合わせた方式である。インターテンプレートWeighted Prediction方式のうちのWeighted Predictionで用いられる重み係数やオフセット値は、重み係数算出部７７により供給される。なお、Weighted Predictionとしては、Explicit Weighted PredictionとImplicit Weighted Predictionがある。

また、インターＴＰ動き予測・補償部７６は、動き予測・補償部７５から供給される画像を重み係数算出部７７に供給する。さらに、インターＴＰ動き予測・補償部７６は、インターテンプレート予測モードに対してコスト関数値を算出し、算出したコスト関数値、予測画像、および、テンプレート方式情報を、動き予測・補償部７５に供給する。

なお、テンプレート方式情報とは、インターＴＰ動き予測・補償部７６による動き予測・補償処理の方式として、インターテンプレートWeighted Prediction方式が採用されたか、インターテンプレートマッチング方式が採用されたかを表す情報などである。但し、インターＴＰ動き予測・補償部７６による動き予測・補償処理の方式としてインターテンプレートWeighted Prediction方式が採用された場合には、Weighted PredictionとしてImplicit Weighted Predictionが採用されたか、Explicit Weighted Predictionが採用されたかを表す情報もテンプレート方式情報に含まれる。

また、インターＴＰ動き予測・補償部７６は、Weighted PredictionとしてExplicit Weighted Predictionが採用された場合、Explicit Weighted Predictionで用いられる重み係数とオフセット値を動き予測・補償部７５に供給する。この重み係数とオフセット値は、これらを用いて生成された予測画像が予測画像選択部７８により選択された場合、可逆符号化部６６に供給されて可逆符号化処理され、圧縮画像のヘッダ部に挿入される。

重み係数算出部７７は、インターテンプレートWeighted Prediction方式のWeighted PredictionとしてExplicit Weighted Predictionが採用される場合、インターＴＰ動き予測・補償部７６におけるインター予測する画像に対して、ピクチャ単位で、重み係数およびオフセット値を決定し、インターＴＰ動き予測・補償部７６に供給する。

また、重み係数算出部７７は、インターテンプレートWeighted Prediction方式のWeighted PredictionとしてImplicit Weighted Predictionが採用される場合、インターＴＰ動き予測・補償部７６から供給される画像に基づいて、インターテンプレートマッチングブロック単位で、重み係数またはオフセット値を算出し、インターＴＰ動き予測・補償部７６に供給する。なお、重み係数算出部７７の処理の詳細については後述する。

予測画像選択部７８は、イントラ予測部７４または動き予測・補償部７５より出力された各コスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードから、最適予測モードを決定し、決定された最適予測モードの予測画像を選択し、演算部６３，７０に供給する。このとき、予測画像選択部７８は、予測画像の選択情報を、イントラ予測部７４または動き予測・補償部７５に供給する。

レート制御部７９は、蓄積バッファ６７に蓄積された圧縮画像に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部６５の量子化動作のレートを制御する。

次に、図６のフローチャートを参照して、図３の画像符号化装置５１の符号化処理について説明する。

ステップＳ１１において、Ａ／Ｄ変換部６１は入力された画像をＡ／Ｄ変換する。ステップＳ１２において、画面並べ替えバッファ６２は、Ａ／Ｄ変換部６１より供給された画像を記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。

ステップＳ１３において、演算部６３は、ステップＳ１２で並び替えられた画像と予測画像との差分を演算する。予測画像は、インター予測する場合は動き予測・補償部７５から、イントラ予測する場合はイントラ予測部７４から、それぞれ予測画像選択部７８を介して演算部６３に供給される。

差分データは元の画像データに較べてデータ量が小さくなっている。したがって、画像をそのまま符号化する場合に較べて、データ量を圧縮することができる。

ステップＳ１４において、直交変換部６４は演算部６３から供給された差分情報を直交変換する。具体的には、離散コサイン変換、カルーネン・レーベ変換等の直交変換が行われ、変換係数が出力される。ステップＳ１５において、量子化部６５は変換係数を量子化する。この量子化に際しては、後述するステップＳ２５の処理で説明されるように、レートが制御される。

以上のようにして量子化された差分情報は、次のようにして局部的に復号される。すなわち、ステップＳ１６において、逆量子化部６８は量子化部６５により量子化された変換係数を量子化部６５の特性に対応する特性で逆量子化する。ステップＳ１７において、逆直交変換部６９は逆量子化部６８により逆量子化された変換係数を直交変換部６４の特性に対応する特性で逆直交変換する。

ステップＳ１８において、演算部７０は、予測画像選択部７８を介して入力される予測画像を局部的に復号された差分情報に加算し、局部的に復号された画像（演算部６３への入力に対応する画像）を生成する。ステップＳ１９においてデブロックフィルタ７１は、演算部７０より出力された画像をフィルタリングする。これによりブロック歪みが除去される。ステップＳ２０においてフレームメモリ７２は、フィルタリングされた画像を記憶する。なお、フレームメモリ７２にはデブロックフィルタ７１によりフィルタ処理されていない画像も演算部７０から供給され、記憶される。

ステップＳ２１において、イントラ予測部７４、動き予測・補償部７５、およびインターＴＰ動き予測・補償部７６は、それぞれ画像の予測処理を行う。すなわち、ステップＳ２１において、イントラ予測部７４は、イントラ予測モードのイントラ予測処理を行い、動き予測・補償部７５は、インター予測モードの動き予測・補償処理を行い、インターＴＰ動き予測・補償部７６は、インターテンプレート予測モードの動き予測・補償処理を行う。

ステップＳ２１における予測処理の詳細は、図７を参照して後述するが、この処理により、候補となる全ての予測モードでの予測処理がそれぞれ行われ、候補となる全ての予測モードでのコスト関数値がそれぞれ算出される。そして、算出されたコスト関数値に基づいて、最適イントラ予測モードが選択され、最適イントラ予測モードのイントラ予測により生成された予測画像とそのコスト関数値が予測画像選択部７８に供給される。また、算出されたコスト関数値に基づいて、インター予測モードとインターテンプレート予測モードの中から、最適インター予測モードが決定され、最適インター予測モードで生成された予測画像とそのコスト関数値が、予測画像選択部７８に供給される。

ステップＳ２２において、予測画像選択部７８は、イントラ予測部７４および動き予測・補償部７５より出力された各コスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちの一方を、最適予測モードに決定し、決定された最適予測モードの予測画像を選択し、演算部６３，７０に供給する。この予測画像が、上述したように、ステップＳ１３，Ｓ１８の演算に利用される。

なお、この予測画像の選択情報は、イントラ予測部７４または動き予測・補償部７５に供給される。最適イントラ予測モードの予測画像が選択された場合、イントラ予測部７４は、最適イントラ予測モードに関する情報を、可逆符号化部６６に供給する。

最適インター予測モードの予測画像が選択された場合、動き予測・補償部７５は、最適インター予測モードに関する情報、およびその最適インター予測モードに応じた情報（動きベクトル情報、参照フレーム情報、テンプレート方式情報、重み係数、オフセット値など）を可逆符号化部６６に出力する。

すなわち、最適インター予測モードとして、インター予測モードによる予測画像が選択されているときには、動き予測・補償部７５は、インター予測モードを表す情報（以下、適宜、インター予測モード情報と称する）、動きベクトル情報、参照フレーム情報を可逆符号化部６６に出力する。

一方、最適インター予測モードとして、インターテンプレート予測モードによる予測画像が選択されているときには、動き予測・補償部７５は、インターテンプレート予測モードを表す情報（以下、適宜、インターテンプレート予測モード情報と称する）、テンプレート方式情報を可逆符号化部６６に出力する。なお、インターテンプレートWeighted Prediction方式のWeighted Predictionとして、Explicit Weighted Predictionが採用されている場合には、動き予測・補償部７５は、重み係数とオフセット値も可逆符号化部６６に出力する。

ステップＳ２３において、可逆符号化部６６は量子化部６５より出力された量子化された変換係数を符号化する。すなわち、差分画像が可変長符号化、算術符号化等の可逆符号化され、圧縮される。このとき、上述したステップＳ２２において可逆符号化部６６に入力された、イントラ予測部７４からの最適イントラ予測モードに関する情報や、動き予測・補償部７５からの最適インター予測モードに応じた情報（予測モード情報、動きベクトル情報、参照フレーム情報、テンプレート方式情報、重み係数、オフセット値など）なども符号化され、ヘッダ情報に付加される。

ステップＳ２４において蓄積バッファ６７は圧縮された差分画像を圧縮画像として蓄積する。蓄積バッファ６７に蓄積された圧縮画像が適宜読み出され、伝送路を介して復号側に伝送される。

ステップＳ２５においてレート制御部７９は、蓄積バッファ６７に蓄積された圧縮画像に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部６５の量子化動作のレートを制御する。

次に、図７のフローチャートを参照して、図６のステップＳ２１における予測処理を説明する。

画面並べ替えバッファ６２から供給される処理対象の画像がイントラ処理されるブロックの画像である場合、参照される復号済みの画像がフレームメモリ７２から読み出され、スイッチ７３を介してイントラ予測部７４に供給される。これらの画像に基づいて、ステップＳ３１において、イントラ予測部７４は処理対象のブロックの画素を、候補となる全てのイントラ予測モードでイントラ予測する。なお、参照される復号済みの画素としては、デブロックフィルタ７１によりデブロックフィルタリングされていない画素が用いられる。

ステップＳ３１におけるイントラ予測処理の詳細は、図１８を参照して後述するが、この処理により、候補となる全てのイントラ予測モードでイントラ予測が行われ、候補となる全てのイントラ予測モードに対してコスト関数値が算出される。

ステップＳ３２において、イントラ予測部７４は、ステップＳ３１において算出された候補となる全てのイントラ予測モードに対してのコスト関数値を比較し、最小値を与える予測モードを、最適イントラ予測モードとして決定する。そして、イントラ予測部７４は、最適イントラ予測モードで生成された予測画像とそのコスト関数値を、予測画像選択部７８に供給する。

画面並べ替えバッファ６２から供給される処理対象の画像がインター処理される画像である場合、参照される復号済みの画像がフレームメモリ７２から読み出され、スイッチ７３を介して動き予測・補償部７５に供給される。これらの画像に基づいて、ステップＳ３３において、動き予測・補償部７５はインター動き予測処理を行う。すなわち、動き予測・補償部７５は、フレームメモリ７２から供給される復号済みの画像を参照して、候補となる全てのインター予測モードの動き予測処理を行う。

ステップＳ３３におけるインター動き予測処理の詳細は、図１９を参照して後述するが、この処理により、候補となる全てのインター予測モードで動き予測処理が行われ、候補となる全てのインター予測モードに対してコスト関数値が算出される。

さらに、画面並べ替えバッファ６２から供給される処理対象の画像がインター処理される画像である場合、フレームメモリ７２から読み出された参照される復号済みの画像は、スイッチ７３および動き予測・補償部７５を介してインターＴＰ動き予測・補償部７６にも供給される。これらの画像に基づいて、インターＴＰ動き予測・補償部７６および重み係数算出部７７は、ステップＳ３４において、インターテンプレート予測モードで、インターテンプレート動き予測処理を行う。

ステップＳ３４におけるインターテンプレート動き予測処理の詳細は、図２３を参照して後述するが、この処理により、インターテンプレート予測モードで動き予測処理が行われ、インターテンプレート予測モードに対してコスト関数値が算出される。そして、インターテンプレート予測モードの動き予測処理により生成された予測画像とそのコスト関数値が動き予測・補償部７５に供給される。

ステップＳ３５において、動き予測・補償部７５は、ステップＳ３３において選択された最適なインター予測モードに対してのコスト関数値と、ステップＳ３４において算出されたインターテンプレート予測モードに対してのコスト関数値を比較し、最小値を与える予測モードを、最適インター予測モードとして決定する。そして、動き予測・補償部７５は、最適インター予測モードで生成された予測画像とそのコスト関数値を、予測画像選択部７８に供給する。

次に、H.264/AVC方式で定められているイントラ予測の各モードについて説明する。

まず、輝度信号に対するイントラ予測モードについて説明する。輝度信号のイントラ予測モードには、9種類の4×4画素のブロック単位、並びに4種類の16×16画素のマクロブロック単位の予測モードがある。図８に示されるように、16×16画素のイントラ予測モードの場合、各ブロックの直流成分を集めて、4×4行列が生成され、これに対して、さらに、直交変換が施される。

なお、ハイプロファイルについては、8次のDCTブロックに対して、8×8画素のブロック単位の予測モードが定められているが、この方式については、次に説明する4×4画素のイントラ予測モードの方式に準じる。

図９および図１０は、9種類の輝度信号の4×4画素のイントラ予測モード(Intra_4x4_pred_mode)を示す図である。平均値（DC）予測を示すモード２以外の8種類の各モードは、それぞれ、図１１の番号0,1,3乃至8で示される方向に対応している。

9種類のIntra_4x4_pred_modeについて、図１２を参照して説明する。図１２の例において、画素a乃至pは、イントラ処理される対象ブロックの画素を表し、画素値Ａ乃至Ｍは、隣接ブロックに属する画素の画素値を表している。すなわち、画素a乃至pは、画面並べ替えバッファ６２から読み出された処理対象の画像であり、画素値Ａ乃至Ｍは、フレームメモリ７２から参照画像として読み出されるデブロックフィルタ処理前の復号済みの画像の画素値である。

図９および図１０の各イントラ予測モードの場合、画素a乃至pの予測画素値は、隣接ブロックに属する画素の画素値Ａ乃至Ｍを用いて、以下のように生成される。なお、画素値が“available”であるとは、画枠の端であったり、あるいは、まだ符号化されていないなどの理由がなく、利用可能であることを表し、画素値が“unavailable”であるとは、画枠の端であったり、あるいは、まだ符号化されていないなどの理由により利用可能ではないことを表す。

モード０はVertical Predictionであり、画素値Ａ乃至Ｄが “available” の場合のみ適用される。この場合、画素a乃至ｐの予測画素値は、次の式（８）により求められる。

画素ａ, ｅ, ｉ, ｍの予測画素値＝Ａ
画素ｂ, ｆ, ｊ, ｎの予測画素値＝Ｂ
画素ｃ, ｇ, ｋ, ｏの予測画素値＝Ｃ
画素ｄ, ｈ, ｌ, ｐの予測画素値＝Ｄ・・・（８）

モード１はHorizontal Predictionであり、画素値Ｉ乃至Ｌが “available” の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（９）により求められる。

画素ａ, ｂ, ｃ, ｄの予測画素値＝Ｉ
画素ｅ, ｆ, ｇ, ｈの予測画素値＝Ｊ
画素ｉ, ｊ, ｋ, ｌの予測画素値＝Ｋ
画素ｍ, ｎ, ｏ, ｐの予測画素値＝Ｌ・・・（９）

モード２はDC Predictionであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌが全て “available” である時、予測画素値は式（１０）により求められる。

（Ａ＋Ｂ＋Ｃ＋Ｄ＋ｉ＋Ｊ＋Ｋ＋Ｌ＋４）＞＞３・・・（１０）

また、画素値Ａ,Ｂ,Ｃ,Ｄが全て “unavailable” である時、予測画素値は式（１１）により求められる。

（Ｉ＋Ｊ＋Ｋ＋Ｌ＋２）＞＞２・・・（１１）

また、画素値Ｉ,Ｊ,Ｋ,Ｌが全て “unavailable” である時、予測画素値は式（１２）により求められる。

（Ａ＋Ｂ＋Ｃ＋Ｄ＋２）＞＞２・・・（１２）

なお、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌが全て“unavailable” である時、128を予測画素値として用いる。

モード３はDiagonal_Down_Left Predictionであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが“available”の場合のみ適用される。この場合、画素a乃至pの予測画素値は、次の式（１３）のように生成される。

画素ａの予測画素値＝（Ａ＋２Ｂ＋Ｃ＋２）＞＞２
画素ｂ，ｅの予測画素値＝（Ｂ＋２Ｃ＋Ｄ＋２）＞＞２
画素ｃ，ｆ，ｉの予測画素値＝（Ｃ＋２Ｄ＋Ｅ＋２）＞＞２
画素ｄ，ｇ，ｊ，ｍの予測画素値＝（Ｄ＋２Ｅ＋Ｆ＋２）＞＞２
画素ｈ，ｋ，ｎの予測画素値＝（Ｅ＋２Ｆ＋Ｇ＋２）＞＞２
画素ｌ，ｏの予測画素値＝（Ｆ＋２Ｇ＋Ｈ＋２）＞＞２
画素ｐの予測画素値＝（Ｇ＋３Ｈ＋２）＞＞２
・・・（１３）

モード４はDiagonal_Down_Right Predictionであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが “available” の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（１４）のように生成される。

画素ｍの予測画素値＝（Ｊ＋２Ｋ＋Ｌ＋２）＞＞２
画素ｉ，ｎの予測画素値＝（Ｉ＋２Ｊ＋Ｋ＋２）＞＞２
画素ｅ，ｊ，ｏの予測画素値＝（Ｍ＋２Ｉ＋Ｊ＋２）＞＞２
画素ａ，ｆ，ｋ，ｐの予測画素値＝（Ａ＋２Ｍ＋Ｉ＋２）＞＞２
画素ｂ，ｇ，ｌの予測画素値＝（Ｍ＋２Ａ＋Ｂ＋２）＞＞２
画素ｃ，ｈの予測画素値＝（Ａ＋２Ｂ＋Ｃ＋２）＞＞２
画素ｄの予測画素値＝（Ｂ＋２Ｃ＋Ｄ＋２）＞＞２
・・・（１４）

モード５はDiagonal_Vertical_Right Predictionであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが“available”の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（１５）のように生成される。

画素ａ，ｊの予測画素値＝（Ｍ＋Ａ＋１）＞＞１
画素ｂ，ｋの予測画素値＝（Ａ＋Ｂ＋１）＞＞１
画素ｃ，ｌの予測画素値＝（Ｂ＋Ｃ＋１）＞＞１
画素ｄの予測画素値＝（Ｃ＋Ｄ＋１）＞＞１
画素ｅ，ｎの予測画素値＝（Ｉ＋２Ｍ＋Ａ＋２）＞＞２
画素ｆ，ｏの予測画素値＝（Ｍ＋２Ａ＋Ｂ＋２）＞＞２
画素ｇ，ｐの予測画素値＝（Ａ＋２Ｂ＋Ｃ＋２）＞＞２
画素ｈの予測画素値＝（Ｂ＋２Ｃ＋Ｄ＋２）＞＞２
画素ｉの予測画素値＝（Ｍ＋２Ｉ＋Ｊ＋２）＞＞２
画素ｍの予測画素値＝（Ｉ＋２Ｊ＋Ｋ＋２）＞＞２
・・・（１５）

モード６はHorizontal_Down Predictionであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが“available”の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（１６）のように生成される。

画素ａ，ｇの予測画素値＝（Ｍ＋Ｉ＋１）＞＞１
画素ｂ，ｈの予測画素値＝（Ｉ＋２Ｍ＋Ａ＋２）＞＞２
画素ｃの予測画素値＝（Ｍ＋２Ａ＋Ｂ＋２）＞＞２
画素ｄの予測画素値＝（Ａ＋２Ｂ＋Ｃ＋２）＞＞２
画素ｅ，ｋの予測画素値＝（Ｉ＋Ｊ＋１）＞＞１
画素ｆ，ｌの予測画素値＝（Ｍ＋２Ｉ＋Ｊ＋２）＞＞２
画素ｉ，ｏの予測画素値＝（Ｊ＋Ｋ＋１）＞＞１
画素ｊ，ｐの予測画素値＝（Ｉ＋２Ｊ＋Ｋ＋２）＞＞２
画素ｍの予測画素値＝（Ｋ＋Ｌ＋１）＞＞１
画素ｎの予測画素値＝（Ｊ＋２Ｋ＋Ｌ＋２）＞＞２
・・・（１６）

モード７は、Vertical_Left Predictionであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが“available”の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（１７）のように生成される。

画素ａの予測画素値＝（Ａ＋Ｂ＋１）＞＞１
画素ｂ，ｉの予測画素値＝（Ｂ＋Ｃ＋１）＞＞１
画素ｃ，ｊの予測画素値＝（Ｃ＋Ｄ＋１）＞＞１
画素ｄ，ｋの予測画素値＝（Ｄ＋Ｅ＋１）＞＞１
画素ｌの予測画素値＝（Ｅ＋Ｆ＋１）＞＞１
画素ｅの予測画素値＝（Ａ＋２Ｂ＋Ｃ＋２）＞＞２
画素ｆ，ｍの予測画素値＝（Ｂ＋２Ｃ＋Ｄ＋２）＞＞２
画素ｇ，ｎの予測画素値＝（Ｃ＋２Ｄ＋Ｅ＋２）＞＞２
画素ｈ，ｏの予測画素値＝（Ｄ＋２Ｅ＋Ｆ＋２）＞＞２
画素ｐの予測画素値＝（Ｅ＋２Ｆ＋Ｇ＋２）＞＞２
・・・（１７）

モード８は、Horizontal_Up Predictionであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが“available”の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（１８）のように生成される。

画素ａの予測画素値＝（Ｉ＋Ｊ＋１）＞＞１
画素ｂの予測画素値＝（Ｉ＋２Ｊ＋Ｋ＋２）＞＞２
画素ｃ，ｅの予測画素値＝（Ｊ＋Ｋ＋１）＞＞１
画素ｄ，ｆの予測画素値＝（Ｊ＋２Ｋ＋Ｌ＋２）＞＞２
画素ｇ，ｉの予測画素値＝（Ｋ＋Ｌ＋１）＞＞１
画素ｈ，ｊの予測画素値＝（Ｋ＋３Ｌ＋２）＞＞２
画素ｋ，ｌ，ｍ，ｎ，ｏ，ｐの予測画素値＝Ｌ
・・・（１８）

次に、図１３を参照して、輝度信号の４×４画素のイントラ予測モード(Intra_4x4_pred_mode)の符号化方式について説明する。

図１３の例において、４×４画素からなり、符号化対象となる対象ブロックＣが示されており、対象ブロックＣに隣接する４×４画素からなるブロックＡおよびブロックＢが示されている。

この場合、対象ブロックＣにおけるIntra_4x4_pred_modeと、ブロックＡおよびブロックＢにおけるIntra_4x4_pred_modeとは高い相関があると考えられる。この相関性を用いて、次のように符号化処理を行うことにより、より高い符号化効率を実現することができる。

すなわち、図１３の例において、ブロックＡおよびブロックＢにおけるIntra_4x4_pred_modeを、それぞれ、Intra_4x4_pred_modeAおよびIntra_4x4_pred_modeBとして、MostProbableModeを次の式（１９）と定義する。

MostProbableMode=Min(Intra_4x4_pred_modeA, Intra_4x4_pred_modeB)
・・・（１９）

すなわち、ブロックＡおよびブロックＢのうち、より小さなmode_numberを割り当てられている方をMostProbableModeとする。

ビットストリーム中には、対象ブロックＣに対するパラメータとして、prev_intra4x4_pred_mode_flag[luma4x4BlkIdx] および rem_intra4x4_pred_mode[luma4x4BlkIdx] という２つの値が定義されており、次の式（２０）に示される擬似コードに基づく処理により、復号処理が行われ、対象ブロックＣに対するIntra_4x4_pred_mode、Intra4x4PredMode[luma4x4BlkIdx] の値を得ることができる。

if(prev_intra4x4_pred_mode_flag[luma4x4BlkIdx])
Intra4x4PredMode[luma4x4BlkIdx] = MostProbableMode
else
if(rem_intra4x4_pred_mode[luma4x4BlkIdx] < MostProbableMode)
Intra4x4PredMode[luma4x4BlkIdx]=rem_intra4x4_pred_mode[luma4x4BlkIdx]
else
Intra4x4PredMode[luma4x4BlkIdx]=rem_intra4x4_pred_mode[luma4x4BlkIdx] + 1 ・・・（２０）

次に、１６×１６画素のイントラ予測モードについて説明する。図１４および図１５は、４種類の輝度信号の１６×１６画素のイントラ予測モード(Intra_16x16_pred_mode)を示す図である。

４種類のイントラ予測モードについて、図１６を参照して説明する。図１６の例において、イントラ処理される対象マクロブロックＡが示されており、P(x,y);x,y=-1,0,…,15は、対象マクロブロックＡに隣接する画素の画素値を表している。

モード０は、Vertical Predictionであり、P(x,-1); x,y=-1,0,…,15が “available”である時のみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（２１）のように生成される。

Pred(x,y) = P(x,-1);x,y=0,…,15
・・・（２１）

モード１はHorizontal Predictionであり、P(-1,y); x,y=-1,0,…,15が “available”である時のみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（２２）のように生成される。

Pred(x,y) = P(-1,y);x,y=0,…,15
・・・（２２）

モード２はDC Predictionであり、P(x,-1)およびP(-1,y); x,y=-1,0,…,15が全て“available” である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（２３）のように生成される。

また、P(x,-1); x,y=-1,0,…,15が “unavailable” である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（２４）のように生成される。

P(-1,y); x,y=-1,0,…,15が “unavailable” である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（２５）のように生成される。

P(x,-1)およびP(-1,y); x,y=-1,0,…,15が全て “unavailable” である場合には、予測画素値として１２８を用いる。

モード３はPlane Predictionであり、P(x,-1)及びP(-1,y); x,y=-1,0,…,15が全て “available” の場合のみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（２６）のように生成される。

次に、色差信号に対するイントラ予測モードについて説明する。図１７は、４種類の色差信号のイントラ予測モード(Intra_chroma_pred_mode)を示す図である。色差信号のイントラ予測モードは、輝度信号のイントラ予測モードと独立に設定が可能である。色差信号に対するイントラ予測モードは、上述した輝度信号の１６×１６画素のイントラ予測モードに順ずる。

ただし、輝度信号の１６×１６画素のイントラ予測モードが、１６×１６画素のブロックを対象としているのに対し、色差信号に対するイントラ予測モードは、８×８画素のブロックを対象としている。さらに、上述した図１４と図１７に示されるように、両者においてモード番号は対応していない。

図１６を参照して上述した輝度信号の１６×１６画素のイントラ予測モードの対象マクロブロックＡの画素値および隣接する画素値の定義に準じて、イントラ処理される対象マクロブロックＡ（色差信号の場合は、８×８画素）に隣接する画素の画素値をP(x,y);x,y=-1,0,…,7とする。

モード０はDC Predictionであり、P(x,-1)およびP(-1,y); x,y=-1,0,…,7が全て “available” である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（２７）のように生成される。

また、P(-1,y) ; x,y=-1,0,…,7が “unavailable” である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（２８）のように生成される。

また、P(x,-1) ; x,y=-1,0,…,7が “unavailable”である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（２９）のように生成される。

モード１はHorizontal Predictionであり、P(-1,y) ; x,y=-1,0,…,7が “available”の場合にのみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（３０）のように生成される。

Pred(x,y) = P(-1,y);x,y=0,…,7
・・・（３０）

モード２はVertical Predictionであり、P(x,-1) ; x,y=-1,0,…,7が “available”の場合にのみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（３１）のように生成される。

Pred(x,y) = P(x,-1);x,y=0,…,7
・・・（３１）

モード３はPlane Predictionであり、P(x,-1)及びP(-1,y) ; x,y=-1,0,…,7 が “available” の場合にのみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（３２）のように生成される。

以上のように、輝度信号のイントラ予測モードには、９種類の４×４画素および８×８画素のブロック単位、並びに４種類の１６×１６画素のマクロブロック単位の予測モードがあり、色差信号のイントラ予測モードには、４種類の８×８画素のブロック単位の予測モードがある。色差信号のイントラ予測モードは、輝度信号のイントラ予測モードと独立に設定が可能である。輝度信号の４×４画素および８×８画素のイントラ予測モードについては、４×４画素および８×８画素の輝度信号のブロック毎に１つのイントラ予測モードが定義される。輝度信号の１６×１６画素のイントラ予測モードと色差信号のイントラ予測モードについては、１つのマクロブロックに対して１つの予測モードが定義される。

なお、予測モードの種類は、上述した図１１の番号０，１，３乃至８で示される方向に対応している。予測モード２は平均値予測である。

次に、これらの予測モードに対して行われる処理である、図７のステップＳ３１におけるイントラ予測処理を図１８のフローチャートを参照して説明する。なお、図１８の例においては、輝度信号の場合を例として説明する。

イントラ予測部７４は、ステップＳ４１において、上述した輝度信号の４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対してイントラ予測を行う。

例えば、４×４画素のイントラ予測モードの場合について、上述した図１２を参照して説明する。画面並べ替えバッファ６２から読み出された処理対象の画像（例えば、画素ａ乃至ｐ）がイントラ処理されるブロックの画像である場合、参照される復号済みの画像（画素値Ａ乃至Ｍが示される画素）がフレームメモリ７２から読み出され、スイッチ７３を介してイントラ予測部７４に供給される。

これらの画像に基づいて、イントラ予測部７４は、処理対象のブロックの画素をイントラ予測する。このイントラ予測処理が、各イントラ予測モードで行われることで、各イントラ予測モードでの予測画像が生成される。なお、参照される復号済みの画素（画素値Ａ乃至Ｍが示される画素）としては、デブロックフィルタ７１によりデブロックフィルタリングされていない画素が用いられる。

イントラ予測部７４は、ステップＳ４２において、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対するコスト関数値を算出する。ここで、コスト関数値としては、H.264/AVC方式における参照ソフトウェアであるＪＭ(Joint Model)で定められているように、High Complexity モードか、Low Complexity モードのいずれかの手法に基づいて行う。

すなわち、High Complexity モードにおいては、ステップＳ４１の処理として、候補となる全ての予測モードに対して、仮に符号化処理までを行い、次の式（３３）で表わされるコスト関数値を各予測モードに対して算出し、その最小値を与える予測モードを最適予測モードであるとして選択する。

Cost(Mode) = D + λ・R ・・・（３３）

Dは、原画像と復号画像の差分（歪）、Rは、直交変換係数まで含んだ発生符号量、λは、量子化パラメータQPの関数として与えられるラグランジュ乗数である。

一方、Low Complexity モードにおいては、ステップＳ４１の処理として、候補となる全ての予測モードに対して、予測画像の生成、および、動きベクトル情報や予測モード情報などのヘッダビットまでを算出し、次の式（３４）で表わされるコスト関数値を各予測モードに対して算出し、その最小値を与える予測モードを最適予測モードであるとして選択する。

Cost(Mode) = D + QPtoQuant(QP)・Header_Bit ・・・（３４）

Dは、原画像と復号画像の差分（歪）、Header_Bitは、予測モードに対するヘッダビット、QPtoQuantは、量子化パラメータQPの関数として与えられる関数である。

Low Complexity モードにおいては、全ての予測モードに対して、予測画像を生成するのみで、符号化処理および復号処理を行う必要がないため、演算量が少なくて済む。

イントラ予測部７４は、ステップＳ４３において、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対して、それぞれ最適モードを決定する。すなわち、図１１を参照して上述したように、イントラ４×４予測モードおよびイントラ８×８予測モードの場合には、予測モードの種類が９種類あり、イントラ１６×１６予測モードの場合には、予測モードの種類が４種類ある。したがって、イントラ予測部７４は、ステップＳ４２において算出されたコスト関数値に基づいて、それらの中から、最適イントラ４×４予測モード、最適イントラ８×８予測モード、最適イントラ１６×１６予測モードを決定する。

イントラ予測部７４は、ステップＳ４４において、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対して決定された各最適モードの中から、ステップＳ４２において算出されたコスト関数値に基づいて、１つのイントラ予測モードを選択する。すなわち、４×４画素、８×８画素、および１６×１６画素に対して決定された各最適モードの中から、コスト関数値が最小値であるイントラ予測モードを選択する。

次に、図１９のフローチャートを参照して、図７のステップＳ３３のインター動き予測処理について説明する。

動き予測・補償部７５は、ステップＳ５１において、図４を参照して上述した１６×１６画素乃至４×４画素からなる８種類の各インター予測モードに対して、動きベクトルと参照画像をそれぞれ決定する。すなわち、各インター予測モードの処理対象のブロックについて、動きベクトルと参照画像がそれぞれ決定される。

動き予測・補償部７５は、ステップＳ５２において、１６×１６画素乃至４×４画素からなる８種類の各インター予測モードについて、ステップＳ５１で決定された動きベクトルに基づいて、参照画像に動き予測と補償処理を行う。この動き予測と補償処理により、各インター予測モードでの予測画像が生成される。

動き予測・補償部７５は、ステップＳ５３において、１６×１６画素乃至４×４画素からなる８種類の各インター予測モードに対して決定された動きベクトルについて、圧縮画像に付加するための動きベクトル情報を生成する。

ここで、図２０を参照して、H.264/AVC方式による動きベクトル情報の生成方法について説明する。図２０の例において、これから符号化される対象ブロックＥ（例えば、１６×１６画素）と、既に符号化済みであり、対象ブロックＥに隣接するブロックＡ乃至Ｄが示されている。

すなわち、ブロックＤは、対象ブロックＥの左上に隣接しており、ブロックＢは、対象ブロックＥの上に隣接しており、ブロックＣは、対象ブロックＥの右上に隣接しており、ブロックＡは、対象ブロックＥの左に隣接している。なお、ブロックＡ乃至Ｄが区切られていないのは、それぞれ、図４で上述した１６×１６画素乃至４×４画素のうちのいずれかの構成のブロックであることを表している。

例えば、Ｘ（＝Ａ，Ｂ，Ｃ，Ｄ，Ｅ）に対する動きベクトル情報を、mvXで表す。まず、対象ブロックＥに対する予測動きベクトル情報（動きベクトルの予測値）pmvEは、ブロックＡ，Ｂ，Ｃに関する動きベクトル情報を用いて、メディアンオペレーションにより次の式（３５）で求められる。

pmvE = med(mvA,mvB,mvC) ・・・（３５）

ブロックＣに関する動きベクトル情報が、画枠の端であったり、あるいは、まだ符号化されていないなどの理由により、利用可能でない（unavailableである）場合には、ブロックＣに関する動きベクトル情報は、ブロックＤに関する動きベクトル情報で代用される。

対象ブロックＥに対する動きベクトル情報として、圧縮画像のヘッダ部に付加されるデータmvdEは、pmvEを用いて、次の式（３６）により求められる。

mvdE = mvE - pmvE ・・・（３６）

なお、実際には、動きベクトル情報の水平方向、垂直方向のそれぞれの成分に対して、独立に処理が行われる。

このように、予測動きベクトル情報を生成し、隣接するブロックとの相関で生成された予測動きベクトル情報と動きベクトル情報との差分を、圧縮画像のヘッダ部に付加することにより、動きベクトル情報を低減することができる。

以上のようにして生成された動きベクトル情報は、次のステップＳ５４におけるコスト関数値算出の際にも用いられ、最終的に予測画像選択部７８により対応する予測画像が選択された場合には、インター予測モード情報および参照フレーム情報とともに、可逆符号化部６６へ出力される。

図１９に戻って、動き予測・補償部７５は、ステップＳ５４において、１６×１６画素乃至４×４画素からなる８種類の各インター予測モードに対して、上述した式（３３）または式（３４）で示されるコスト関数値を算出する。ここで算出されたコスト関数値は、上述した図７のステップＳ３５で最適インター予測モードを決定する際に用いられる。

なお、インター予測モードに対するコスト関数値の算出には、H.264/AVC方式において定められているSkip ModeおよびDirect Modeのコスト関数値の評価も含まれる。

次に、インターテンプレートWeighted Prediction方式について説明する。

まず、図２１を参照して、インターテンプレートマッチング方式について説明する。

図２１の例においては、符号化対象の対象フレームと、動きベクトルを探索する際に参照される参照フレームが示されている。対象フレームには、これから符号化する対象ブロックＡと、対象ブロックＡに対して隣接するとともに、既に符号化済みの画素で構成されるテンプレート領域Ｂが示されている。すなわち、テンプレート領域Ｂは、符号化処理をラスタスキャン順に行う場合には、図２１に示されるように、対象ブロックＡの左および上側に位置する領域であり、フレームメモリ７２に復号画像が蓄積されている領域である。

インターＴＰ動き予測・補償部７６は、参照フレーム上の所定の探索範囲Ｅ内において、例えば、SAD(Sum of Absolute Difference) 等をコスト関数としてマッチング処理を行い、テンプレート領域Ｂの画素値と相関が最も高くなる領域Ｂ’を探索する。そして、インターＴＰ動き予測・補償部７６は、探索された領域Ｂ’に対応するブロックＡ’を、対象ブロックＡに対する予測画像として、対象ブロックＡに対する動きベクトルＰを探索する。すなわち、インターテンプレートマッチング方式においては、符号化済の領域であるテンプレートのマッチング処理を行うことにより、符号化対象ブロックの動きベクトルを探索して符号化対象ブロックの動きを予測するのである。

このように、インターテンプレートマッチング方式による動きベクトル探索処理は、テンプレートマッチング処理に復号画像を用いているので、所定の探索範囲Ｅを予め定めておくことにより、図３の画像符号化装置５１と後述する画像復号装置において同一の処理を行うことが可能である。すなわち、画像復号装置においても、インターＴＰ動き予測・補償部を構成することにより、対象ブロックＡに対する動きベクトルＰの情報を画像復号装置に送る必要がなくなるので、圧縮画像中における動きベクトル情報を低減することができる。

なお、この所定の探索範囲Ｅは、例えば、動きベクトル（０，０）を中心とした探索範囲とされる。また、この所定の探索範囲Ｅは、例えば、図２０を参照して上述したように、隣接ブロックとの相関で生成された予測動きベクトル情報を中心とした探索範囲とされるようにしてもよい。

インターテンプレートWeighted Prediction方式では、Weighted PredictionとしてExplicit Weighted Predictionが用いられる場合、上述したインターテンプレートマッチング方式で求められた予測画像が、List0参照フレームの予測画像P(L0)とされて、インター予測する画像としてのＰピクチャに対して、上述した式（１）の演算が行われる。

また、インター予測する画像としてのＢピクチャに対しては、上述したインターテンプレートマッチング方式で求められた２つの予測画像が、それぞれ、List0参照フレームの予測画像P(L0)、List1参照フレームの予測画像P(L1)とされて、上述した式（２）の演算が行われる。なお、Weighted PredictionとしてExplicit Weighted Predictionが用いられる場合には、重み係数とオフセット値は、重み係数算出部７７によりピクチャ単位で決定された値となる。

これに対して、インターテンプレートWeighted Prediction方式において、Weighted PredictionとしてImplicit Weighted Predictionが用いられる場合には、以下のようにして予測画像が求められる。

まず、インター予測する画像がＰピクチャである場合について説明する。

この場合、予測画像を求める方法には、重み係数に基づいて予測画像を求める方法とオフセット値に基づいて予測画像を求める方法の２つの方法があり、いずれの方法が用いられてもよい。

重み係数に基づいて予測画像を求める方法では、重み係数算出部７７は、インターテンプレートマッチング方式おけるテンプレート領域Ｂ、領域Ｂ’（図２１）の画素値の平均値を算出し、それぞれ、Ave(B)，Ave（B’）とする。そして、重み係数算出部７７は、平均値Ave(B)およびAve（B’）を用いて、以下の式（３７）により重み係数ｗ₀を求める。

これにより、重み係数ｗ₀は、同一のＰピクチャ内であっても、各テンプレートマッチングブロックに対して異なる値となる。

インターＴＰ動き予測・補償部７６は、この重み係数ｗ₀とブロックＡ’の画素値Pix(A')を用いて、以下の式（３８）により、ブロックＡの予測画素値Pred(A)を求める。

Pred(A)＝ｗ₀×Pix(A')
・・・（３８）

以上のように、インターＴＰ動き予測・補償部７６は、テンプレートマッチングブロック単位で求められる重み係数ｗ₀を用いて、予測画像を生成するので、画面内のローカルな画素値の性質に適した予測画像を生成することができる。

なお、式（３７）で求められた重み係数ｗ₀を、X/(2ⁿ)の形式で表される値に近似するようにしてもよい。この場合、除算をビットシフトにより行うことができるので、Weighted Predictionの処理の演算量を減らすことができる。

一方、オフセット値に基づいて予測画像を求める方法では、重み係数算出部７７は、平均値Ave(B)，Ave（B’）を用いて、以下の式（３９）によりオフセット値ｄ₀を求める。

ｄ₀＝Ave(Ｂ)−Ave（Ｂ’）
・・・（３９）

これにより、オフセット値ｄ₀は、同一のＰピクチャ内であっても、各テンプレートマッチングブロックに対して異なる値となる。

インターＴＰ動き予測・補償部７６は、このオフセット値ｄ₀とブロックＡ’の予測画素値Pred（A’）を用いて、以下の式（４０）により、ブロックＡの予測画素値Pred(A)を求める。

Pred(A)＝Pred（A’）＋ｄ₀
・・・（４０）

以上のように、インターＴＰ動き予測・補償部７６は、テンプレートマッチングブロック単位で求められるオフセット値ｄ₀を用いて、予測画像を生成するので、画面内のローカルな画素値の性質に適した予測画像を生成することができる。

次に、インター予測する画像がＢピクチャである場合について説明する。

この場合、図２２に示されるように、インターテンプレートマッチング方式では、符号化対象の対象フレームと、動きベクトルを探索する際に参照される参照フレームとして、L0参照フレームとL1参照フレームが用いられる。そして、L0参照フレーム上の所定の探索範囲内において、図２１の場合と同様のマッチング処理が行われ、探索された領域ｂ₁に対応するブロックａ₁が予測画像とされる。また、L1参照フレームについても同様のマッチング処理が行われ、探索された領域ｂ₂に対応するブロックａ₂が予測画像とされる。

重み係数算出部７７は、テンプレート領域Ｂ、領域ｂ₁、領域ｂ₂の画素値の平均値を算出し、それぞれ、Ave_tmplt_Cur，Ave_tmplt_L0，Ave_tmplt_L1とする。そして、重み係数算出部７７は、平均値Ave_tmplt_Cur，Ave_tmplt_L0、およびAve_tmplt_L1を用いて、以下の式（４１）により重み係数ｗ₀およびｗ₁を求める。

ｗ₀＝|Ave_tmplt_L1−Ave_tmplt_Cur|
ｗ₁＝|Ave_tmplt_L0−Ave_tmplt_Cur|
・・・（４１）

また、重み係数算出部７７は、式（４１）により求められた重み係数ｗ₀およびｗ₁を以下の式（４２）を用いて正規化する。

以上により、重み係数ｗ₀およびｗ₁は、同一のＢピクチャ内であっても、各テンプレートマッチングブロックに対して異なる値となる。

インターＴＰ動き予測・補償部７６は、この重み係数ｗ₀およびｗ₁、ブロックａ₁の画素値Pix_L0、並びにブロックａ₂の画素値Pix_L1を用いて、以下の式（４３）により、ブロックＡの予測画素値Pred(A)を求める。

Pred(A)＝ｗ₀×Pix_L0＋ｗ₁×Pix_L１
・・・（４３）

以上のように、インターＴＰ動き予測・補償部７６は、テンプレートマッチングブロック単位で求められる重み係数ｗ₀およびｗ₁を用いて、予測画像を生成するので、画面内のローカルな画素値の性質に適した予測画像を生成することができる。

なお、式（４２）で求められた重み係数ｗ₀およびｗ₁を、X/(2ⁿ)の形式で表される値に近似するようにしてもよい。この場合、除算をビットシフトにより行うことができるので、Weighted Predictionの処理の演算量を減らすことができる。

以上のようにして、画像符号化装置５１では、Implicit Weighted Predictionにおける重み係数が算出されるので、POCが等間隔でない場合であっても、その値に惑わされることなく、適切な重み係数の算出が可能となる。その結果、符号化効率の低下を抑制することができる。また、重み係数は、各テンプレートマッチングブロックに対して独立に算出されるので、画像のローカルな性質に基づいたWeighted Predictionを実現することができる。

次に、図２３のフローチャートを参照して、図７のステップＳ３４のインターテンプレート動き予測処理の詳細な例について説明する。

ステップＳ７１において、インターＴＰ動き予測・補償部７６は、インターテンプレートマッチング方式で動きベクトルの探索を行う。ステップＳ７２において、インターＴＰ動き予測・補償部７６は、動き予測・補償処理の方式としてインターテンプレートWeighted Prediction方式を採用するか否かを判定する。

ステップＳ７２で動き予測・補償処理の方式としてインターテンプレートWeighted Prediction方式を採用すると判定された場合、ステップＳ７３において、インターＴＰ動き予測・補償部７６は、Weighted Predictionとして、Explicit Weighted Predictionを採用するか否かを判定する。

ステップＳ７３で、Weighted PredictionとしてExplicit Weighted Predictionを採用すると判定された場合、ステップＳ７４において、インターＴＰ動き予測・補償部７６は、重み係数算出部７７によりピクチャ単位で決定されている重み係数およびオフセット値と、ステップＳ７１で探索された動きベクトルにより指し示される参照フレームのブロックＡまたはブロックａ１，ａ２とを用いて、上述した式（１）または式（２）により予測画像を生成する。

一方、ステップＳ７３で、Weighted PredictionとしてExplicit Weighted Predictionを採用しない、即ち、Weighted PredictionとしてImplicit Weighted Predictionを採用すると判定された場合、処理はステップＳ７５に進む。ステップＳ７５において、重み係数算出部７７は、インターＴＰ動き予測・補償部７６から供給される画像を用いて、重み係数を算出する。

具体的には、インター予測する画像がＰピクチャである場合、重み係数算出部７７は、テンプレート領域Ｂおよび領域Ｂ’の復号画像を用いて、上述した式（３７）により重み係数を算出する。また、インター予測する画像がＢピクチャである場合、重み係数算出部７７は、テンプレート領域Ｂ、領域ｂ₁、および領域ｂ₂の復号画像を用いて、上述した式（４１）および式（４２）により重み係数を算出する。なお、インター予測する画像がＰピクチャである場合には、重み係数算出部７７は、テンプレート領域Ｂおよび領域Ｂ’の復号画像を用いて、上述した式（３９）によりオフセット値を算出するようにしてもよい。

ステップＳ７６において、インターＴＰ動き予測・補償部７６は、ステップＳ７５で算出された重み係数を用いて、上述した式（３８）または式（４３）により予測画像を生成する。なお、重み係数算出部７７によりオフセット値が算出された場合には、インターＴＰ動き予測・補償部７６は、上述した式（４０）により予測画像を生成する。

また、ステップＳ７２で、動き予測・補償処理の方式としてインターテンプレートWeighted Prediction方式を採用しないと判定された場合、即ち、動き予測・補償処理の方式としてインターテンプレート方式を採用する場合、処理はステップＳ７７に進む。

ステップＳ７７において、インターＴＰ動き予測・補償部７６は、ステップＳ７１で探索された動きベクトルに基づいて予測画像を生成する。例えば、インターＴＰ動き予測・補償部７６は、動きベクトルＰに基づいて、領域Ａ´の画像をそのまま予測画像とする。

ステップＳ７４，Ｓ７６、またはＳ７７の処理後、ステップＳ７８において、インターＴＰ動き予測・補償部７６は、インターテンプレート予測モードに対してコスト関数値を算出する。

このようにして、インターテンプレート動き予測処理が行われる。

また、画像符号化装置５１により符号化された圧縮画像は、所定の伝送路を介して伝送され、画像復号装置により復号される。図２４は、このような画像復号装置の一実施の形態の構成を表している。

画像復号装置１０１は、蓄積バッファ１１１、可逆復号部１１２、逆量子化部１１３、逆直交変換部１１４、演算部１１５、デブロックフィルタ１１６、画面並べ替えバッファ１１７、Ｄ／Ａ変換部１１８、フレームメモリ１１９、スイッチ１２０、イントラ予測部１２１、動き予測・補償部１２２、インターテンプレート動き予測・補償部１２３、重み係数算出部１２４、およびスイッチ１２５により構成されている。

なお、以下、インターテンプレート動き予測・補償部１２３を、インターＴＰ動き予測・補償部１２３と称する。

蓄積バッファ１１１は伝送されてきた圧縮画像を蓄積する。可逆復号部１１２は、蓄積バッファ１１１より供給された、図３の可逆符号化部６６により符号化された情報を、可逆符号化部６６の符号化方式に対応する方式で復号する。逆量子化部１１３は可逆復号部１１２により復号された画像を、図３の量子化部６５の量子化方式に対応する方式で逆量子化する。逆直交変換部１１４は、図３の直交変換部６４の直交変換方式に対応する方式で逆量子化部１１３の出力を逆直交変換する。

逆直交変換された出力は演算部１１５によりスイッチ１２５から供給される予測画像と加算されて復号される。デブロックフィルタ１１６は、復号された画像のブロック歪を除去した後、フレームメモリ１１９に供給し、蓄積させるとともに、画面並べ替えバッファ１１７に出力する。

画面並べ替えバッファ１１７は、画像の並べ替えを行う。すなわち、図３の画面並べ替えバッファ６２により符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられる。Ｄ／Ａ変換部１１８は、画面並べ替えバッファ１１７から供給された画像をＤ／Ａ変換し、図示せぬディスプレイに出力し、表示させる。

スイッチ１２０は、インター符号化が行われる画像と参照される画像をフレームメモリ１１９から読み出し、動き予測・補償部１２２に出力するとともに、イントラ予測に用いられる画像をフレームメモリ１１９から読み出し、イントラ予測部１２１に供給する。

イントラ予測部１２１には、ヘッダ情報を復号して得られたイントラ予測モードに関する情報が可逆復号部１１２から供給される。イントラ予測モードに関する情報が供給された場合、イントラ予測部１２１は、この情報に基づいて、予測画像を生成する。イントラ予測部１２１は、生成した予測画像を、スイッチ１２５に出力する。

動き予測・補償部１２２には、ヘッダ情報を復号して得られた情報（予測モード情報、動きベクトル情報、参照フレーム情報、テンプレート方式情報、重み係数、オフセット値など）が可逆復号部１１２から供給される。予測モード情報としてインター予測モード情報が供給された場合、動き予測・補償部１２２は、動きベクトル情報と参照フレーム情報に基づいて画像に動き予測と補償処理を施し、予測画像を生成する。

予測モード情報としてインターテンプレート予測モード情報が供給された場合、動き予測・補償部１２２は、フレームメモリ１１９から読み出されたインター符号化が行われる画像と参照される画像をインターＴＰ動き予測・補償部１２３に供給し、インターテンプレート予測モードでの動き予測・補償処理を行わせる。なお、このとき、可逆復号部１１２から供給されるテンプレート方式情報もインターＴＰ動き予測・補償部１２３に供給される。また、可逆復号部１１２から重み係数およびオフセット値が供給された場合、その重み係数およびオフセット値もインターＴＰ動き予測・補償部１２３に供給する。

また、動き予測・補償部１２２は、予測モード情報に応じて、インター予測モードにより生成された予測画像、または、インターテンプレート予測モードにより生成された予測画像のどちらか一方をスイッチ１２５に出力する。

インターＴＰ動き予測・補償部１２３は、動き予測・補償部１２２から供給されるテンプレート方式情報に応じて、図３のインターＴＰ動き予測・補償部７６と同様に、インターテンプレート予測モードの動き予測と補償処理を行う。すなわち、インターＴＰ動き予測・補償部１２３は、フレームメモリ１１９から読み出されたインター符号化が行われる画像と参照される画像に基づいて、インターテンプレートWeighted Prediction方式またはインターテンプレートマッチング方式で、インターテンプレート予測モードの動き予測と補償処理を行う。その結果、予測画像が生成される。

なお、インターテンプレートWeighted Prediction方式で動き予測と補償処理が行われる場合、テンプレート方式情報がWeighted PredictionとしてExplicit Weighted Predictionが採用されたことを表しているとき、インターＴＰ動き予測・補償部１２３は、動き予測・補償部１２２から供給される重み係数とオフセット値を用いて、図３のインターＴＰ動き予測・補償部７６と同様に予測画像を生成する。

これに対して、テンプレート方式情報がWeighted PredictionとしてImplicit Weighted Predictionが採用されたことを表しているとき、インターＴＰ動き予測・補償部１２３は、インターテンプレートマッチング方式における対象フレームのテンプレート領域と、そのテンプレート領域と相関が高い参照フレームの領域の画像を、重み係数算出部１２４に供給する。そして、インターＴＰ動き予測・補償部１２３は、その画像に応じて重み係数算出部１２４から供給される重み係数またはオフセット値を用いて、図３のインターＴＰ動き予測・補償部７６と同様に予測画像を生成する。

重み係数算出部１２４は、インターＴＰ動き予測・補償部１２３から供給されるテンプレート領域と、そのテンプレート領域と相関が高い参照フレームの領域の画像から、図３の重み係数算出部７７と同様に、重み係数またはオフセット値を算出する。

インターテンプレート予測モードの動き予測・補償により生成された予測画像は、動き予測・補償部１２２に供給される。

スイッチ１２５は、動き予測・補償部１２２またはイントラ予測部１２１により生成された予測画像を選択し、演算部１１５に供給する。

次に、図２５のフローチャートを参照して、画像復号装置１０１が実行する復号処理について説明する。

ステップＳ１３１において、蓄積バッファ１１１は伝送されてきた画像を蓄積する。ステップＳ１３２において、可逆復号部１１２は、蓄積バッファ１１１から供給される圧縮画像を復号する。すなわち、図３の可逆符号化部６６により符号化されたＩピクチャ、Ｐピクチャ、並びにＢピクチャが復号される。

このとき、動きベクトル情報や予測モード情報（イントラ予測モード、インター予測モード、またはインターテンプレート予測モードを表す情報）も復号される。すなわち、予測モード情報がイントラ予測モードを表す場合、予測モード情報は、イントラ予測部１２１に供給される。予測モード情報がインター予測モードまたはインターテンプレート予測モードを表す場合、予測モード情報は、動き予測・補償部１２２に供給される。その際、対応する動きベクトル情報、参照フレーム情報、テンプレート方式情報、重み係数、オフセット値などがあれば、それも、動き予測・補償部１２２に供給される。

ステップＳ１３３において、逆量子化部１１３は可逆復号部１１２により復号された変換係数を、図３の量子化部６５の特性に対応する特性で逆量子化する。ステップＳ１３４において逆直交変換部１１４は逆量子化部１１３により逆量子化された変換係数を、図３の直交変換部６４の特性に対応する特性で逆直交変換する。これにより図３の直交変換部６４の入力（演算部６３の出力）に対応する差分情報が復号されたことになる。

ステップＳ１３５において、演算部１１５は、後述するステップＳ１３９の処理で選択され、スイッチ１２５を介して入力される予測画像を差分情報と加算する。これにより元の画像が復号される。ステップＳ１３６においてデブロックフィルタ１１６は、演算部１１５より出力された画像をフィルタリングする。これによりブロック歪みが除去される。
ステップＳ１３７においてフレームメモリ１１９は、フィルタリングされた画像を記憶する。

ステップＳ１３８において、イントラ予測部１２１、動き予測・補償部１２２、またはインターＴＰ動き予測・補償部１２３は、可逆復号部１１２から供給される予測モード情報に対応して、それぞれ画像の予測処理を行う。

すなわち、可逆復号部１１２からイントラ予測モードを表す情報（以下、イントラ予測モード情報と称する）が供給された場合、イントラ予測部１２１は、そのイントラ予測モードのイントラ予測処理を行う。また、可逆復号部１１２からインター予測モード情報が供給された場合、動き予測・補償部１２２は、そのインター予測モードの動き予測・補償処理を行う。可逆復号部１１２からインターテンプレート予測モード情報が供給された場合、インターＴＰ動き予測・補償部１２３は、インターテンプレート予測モードの動き予測・補償処理を行う。

ステップＳ１３８における予測処理の詳細は、図２６を参照して後述するが、この処理により、イントラ予測部１２１により生成された予測画像、動き予測・補償部１２２により生成された予測画像、またはインターＴＰ動き予測・補償部１２３により生成された予測画像がスイッチ１２５に供給される。

ステップＳ１３９において、スイッチ１２５は予測画像を選択する。すなわち、イントラ予測部１２１により生成された予測画像、動き予測・補償部１２２により生成された予測画像、またはインターＴＰ動き予測・補償部１２３により生成された予測画像が供給されるので、供給された予測画像が選択されて演算部１１５に供給され、上述したように、ステップＳ１３４において逆直交変換部１１４の出力と加算される。

ステップＳ１４０において、画面並べ替えバッファ１１７は並べ替えを行う。すなわち画像符号化装置５１の画面並べ替えバッファ６２により符号化のために並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。

ステップＳ１４１において、Ｄ／Ａ変換部１１８は、画面並べ替えバッファ１１７からの画像をＤ／Ａ変換する。この画像が図示せぬディスプレイに出力され、画像が表示される。

次に、図２６のフローチャートを参照して、図２５のステップＳ１３８の予測処理について説明する。

イントラ予測部１２１は、ステップＳ１７１において、対象ブロックがイントラ符号化されているか否かを判定する。可逆復号部１１２からイントラ予測モード情報がイントラ予測部１２１に供給されると、イントラ予測部１２１は、ステップＳ１７１において、対象ブロックがイントラ符号化されていると判定し、処理は、ステップＳ１７２に進む。

ステップＳ１７２において、イントラ予測部１２１は、イントラ予測モード情報を取得する。

ステップＳ１７３において、処理に必要な画像がフレームメモリ１１９から読み出されるとともに、イントラ予測部１２１は、ステップＳ１７２で取得されたイントラ予測モード情報に従ってイントラ予測し、予測画像を生成する。そして、処理は終了する。

一方、ステップＳ１７１において、イントラ符号化されていないと判定された場合、処理は、ステップＳ１７４に進む。この場合、処理対象の画像がインター処理される画像であるから、必要な画像がフレームメモリ１１９から読み出され、スイッチ１２０を介して動き予測・補償部１２２に供給される。

動き予測・補償部１２２は、ステップＳ１７４において、対象ブロックがインターテンプレートマッチング方式で符号化されているか否かを判定する。可逆復号部１１２からインターテンプレート予測モード情報が動き予測・補償部１２２に供給されると、動き予測・補償部１２２は、ステップＳ１７４において、対象ブロックがインターテンプレートマッチング方式で符号化されていると判定し、処理は、ステップＳ１７５に進む。

ステップＳ１７５において、動き予測・補償部１２２は、可逆復号部１１２からテンプレート方式情報を取得し、インターＴＰ動き予測・補償部１２３に供給する。ステップＳ１７６において、インターＴＰ動き予測・補償部１２３は、インターテンプレートマッチング方式で動きベクトルの探索を行う。

ステップＳ１７７において、インターＴＰ動き予測・補償部１２３は、対象ブロックが、インターテンプレートWeighted Prediction方式で符号化されているか否かを判定する。可逆復号部１１２から取得されたテンプレート方式情報が、動き予測・補償方式としてインターテンプレートWeighted Prediction方式が採用されていることを表していると、インターＴＰ動き予測・補償部１２３は、ステップＳ１７７において、対象ブロックがインターテンプレートWeighted Prediction方式で符号化されていると判定し、処理は、ステップＳ１７８に進む。

ステップＳ１７８において、インターＴＰ動き予測・補償部１２３は、インターテンプレートWeighted Prediction方式のWeighted PredictionとしてExplicit Weighted Predictionが採用されているか否かを判定する。可逆復号部１１２から取得されたテンプレート方式情報が、Weighted PredictionとしてExplicit Weighted Predictionが採用されていることを表していると、ステップＳ１７８において、Weighted PredictionとしてExplicit Weighted Predictionが採用されていると判定され、処理は、ステップＳ１７９に進む。

ステップＳ１７９において、インターＴＰ動き予測・補償部１２３は、可逆復号部１１２から動き予測・補償部１２２を介して供給される重み係数とオフセット値を取得する。
ステップＳ１８０において、インターＴＰ動き予測・補償部１２３は、ステップＳ１７９で取得された重み係数およびオフセット値と、ステップＳ１７６で探索された動きベクトルに対応する画像とを用いて、上述した式（１）または（２）を用いて予測画像を生成する。そして、処理は終了する。

一方、可逆復号部１１２から取得されたテンプレート方式情報が、Weighted PredictionとしてImplicit Weighted Predictionが採用されていることを表していると、ステップＳ１７８において、Weighted PredictionとしてExplicit Weighted Predictionが採用されていないと判定され、処理は、ステップＳ１８１に進む。

ステップＳ１８１において、重み係数算出部１２４は、上述した式（３７）または式（４１）および式（４２）により重み係数を算出する。なお、インター予測する画像がＰピクチャである場合には、重み係数算出部７７は、上述した式（３９）によりオフセット値を算出するようにしてもよい。

ステップＳ１８２において、インターＴＰ動き予測・補償部１２３は、ステップＳ１８１で算出された重み係数を用いて、上述した式（３８）または式（４３）により予測画像を生成する。なお、重み係数算出部７７によりオフセット値が算出された場合には、インターＴＰ動き予測・補償部１２３は、上述した式（４０）により予測画像を生成する。そして、処理は終了する。

また、可逆復号部１１２から取得されたテンプレート方式情報が、動き予測・補償方式としてインターテンプレート方式が採用されていることを表していると、ステップＳ１７７において、対象ブロックがインターテンプレートWeighted Prediction方式で符号化されていないと判定され、処理はステップＳ１８３に進む。

ステップＳ１８３において、インターＴＰ動き予測・補償部１２３は、ステップＳ１７６で探索された動きベクトルに基づいて予測画像を生成する。

また、可逆復号部１１２からインター予測モード情報が動き予測・補償部１２２に供給されると、ステップＳ１７４において、対象ブロックがインターテンプレートマッチング方式で符号化されていないと判定され、処理はステップＳ１８４に進む。

ステップＳ１８４において、動き予測・補償部１２２は、可逆復号部１１２からインター予測モード情報、参照フレーム情報、および動きベクトル情報を取得する。

ステップＳ１８５において、動き予測・補償部１２２は、ステップＳ１８４で取得したインター予測モード情報、参照フレーム情報、および動きベクトル情報に基づいて、インター予測モードの動き予測をし、予測画像を生成する。そして、処理は終了する。

このようにして、予測処理が実行される。

以上のように、本発明においては、画像符号化装置および画像復号装置において、インター予測する画像について、復号画像を用いて動き探索を行うインターテンプレートマッチング方式で動き予測を行うようにしたので、動きベクトル情報を送らずに、良質な画質を表示させることができる。

なお、上記説明においては、マクロブロックの大きさが、１６×１６画素の場合について説明してきたが、本発明は、”Video Coding Using Extended Block Sizes”,VCEG-AD09,ITU-Telecommunications Standardization Sector STUDY GROUP Question 16 - Contribution 123, Jan 2009に記載の拡張されたマクロブロックサイズに対しても適用することが可能である。

図２７は、拡張されたマクロブロックサイズの例を示す図である。上記記載では、マクロブロックサイズが３２×３２画素に拡張されている。

図２７の上段には、左から、３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロック（パーティション）に分割された３２×３２画素で構成されるマクロブロックが順に示されている。図２７の中段には、左から、１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックに分割された１６×１６画素で構成されるブロックが順に示されている。また、図２７の下段には、左から、８×８画素、８×４画素、４×８画素、および４×４画素のブロックに分割された８×８画素のブロックが順に示されている。

すなわち、３２×３２画素のマクロブロックは、図２７の上段に示される３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロックでの処理が可能である。

また、上段の右側に示される１６×１６画素のブロックは、Ｈ．２６４／ＡＶＣ方式と同様に、中段に示される１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックでの処理が可能である。

さらに、中段の右側に示される８×８画素のブロックは、Ｈ．２６４／ＡＶＣ方式と同様に、下段に示される８×８画素、８×４画素、４×８画素、および４×４画素のブロックでの処理が可能である。

このような階層構造を採用することにより、拡張されたマクロブロックサイズにおいては、１６×１６画素のブロック以下に関してＨ．２６４／ＡＶＣ方式と互換性を保ちながら、そのスーパーセットとして、より大きなブロックが定義されている。

以上のように提案される拡張されたマクロブロックサイズにも本発明を適用することができる。

以上においては、符号化方式／復号方式としてH.264/AVC方式が用いられたが、本発明は、その他のブロック単位で動き予測・補償処理を行う符号化方式／復号方式を用いる画像符号化装置/画像復号装置に適用することもできる。

また、本発明は、例えば、MPEG,H.26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルＴＶ（テレビジョン）、インターネット、および携帯電話機などのネットワークメディアを介して受信する際に、あるいは、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像符号化装置および画像復号装置に適用することができる。

上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む）、光磁気ディスクを含む）、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア、または、プログラムが一時的もしくは永続的に格納されるROMやハードディスクなどにより構成される。プログラム記録媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインタフェースを介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。

なお、本明細書において、プログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、上述した画像符号化装置５１や画像復号装置１０１は、任意の電子機器に適用することができる。以下にその例について説明する。

図２８は、本発明を適用した画像復号装置を用いるテレビジョン受像機の主な構成例を示すブロック図である。

図２８に示されるテレビジョン受像機３００は、地上波チューナ３１３、ビデオデコーダ３１５、映像信号処理回路３１８、グラフィック生成回路３１９、パネル駆動回路３２０、および表示パネル３２１を有する。

地上波チューナ３１３は、地上アナログ放送の放送波信号を、アンテナを介して受信し、復調し、映像信号を取得し、それをビデオデコーダ３１５に供給する。ビデオデコーダ３１５は、地上波チューナ３１３から供給された映像信号に対してデコード処理を施し、得られたデジタルのコンポーネント信号を映像信号処理回路３１８に供給する。

映像信号処理回路３１８は、ビデオデコーダ３１５から供給された映像データに対してノイズ除去などの所定の処理を施し、得られた映像データをグラフィック生成回路３１９に供給する。

グラフィック生成回路３１９は、表示パネル３２１に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成し、生成した映像データや画像データをパネル駆動回路３２０に供給する。また、グラフィック生成回路３１９は、項目の選択などにユーザにより利用される画面を表示するための映像データ（グラフィック）を生成し、それを番組の映像データに重畳したりすることによって得られた映像データをパネル駆動回路３２０に供給するといった処理も適宜行う。

パネル駆動回路３２０は、グラフィック生成回路３１９から供給されたデータに基づいて表示パネル３２１を駆動し、番組の映像や上述した各種の画面を表示パネル３２１に表示させる。

表示パネル３２１はLCD（Liquid Crystal Display）などよりなり、パネル駆動回路３２０による制御に従って番組の映像などを表示させる。

また、テレビジョン受像機３００は、音声A/D（Analog/Digital)変換回路３１４、音声信号処理回路３２２、エコーキャンセル／音声合成回路３２３、音声増幅回路３２４、およびスピーカ３２５も有する。

地上波チューナ３１３は、受信した放送波信号を復調することにより、映像信号だけでなく音声信号も取得する。地上波チューナ３１３は、取得した音声信号を音声A/D変換回路３１４に供給する。

音声A/D変換回路３１４は、地上波チューナ３１３から供給された音声信号に対してA/D変換処理を施し、得られたデジタルの音声信号を音声信号処理回路３２２に供給する。

音声信号処理回路３２２は、音声A/D変換回路３１４から供給された音声データに対してノイズ除去などの所定の処理を施し、得られた音声データをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、音声信号処理回路３２２から供給された音声データを音声増幅回路３２４に供給する。

音声増幅回路３２４は、エコーキャンセル／音声合成回路３２３から供給された音声データに対してD/A変換処理、増幅処理を施し、所定の音量に調整した後、音声をスピーカ３２５から出力させる。

さらに、テレビジョン受像機３００は、デジタルチューナ３１６およびMPEGデコーダ３１７も有する。

デジタルチューナ３１６は、デジタル放送（地上デジタル放送、BS（Broadcasting Satellite）／CS（Communications Satellite）デジタル放送）の放送波信号を、アンテナを介して受信し、復調し、MPEG-TS（Moving Picture Experts Group-Transport Stream）を取得し、それをMPEGデコーダ３１７に供給する。

MPEGデコーダ３１７は、デジタルチューナ３１６から供給されたMPEG-TSに施されているスクランブルを解除し、再生対象（視聴対象）になっている番組のデータを含むストリームを抽出する。MPEGデコーダ３１７は、抽出したストリームを構成する音声パケットをデコードし、得られた音声データを音声信号処理回路３２２に供給するとともに、ストリームを構成する映像パケットをデコードし、得られた映像データを映像信号処理回路３１８に供給する。また、MPEGデコーダ３１７は、MPEG-TSから抽出したEPG（Electronic Program Guide)データを図示せぬ経路を介してCPU３３２に供給する。

テレビジョン受像機３００は、このように映像パケットをデコードするMPEGデコーダ３１７として、上述した画像復号装置１０１を用いる。したがって、MPEGデコーダ３１７は、画像復号装置１０１の場合と同様に、Implicit Weighted Predictionにおける重み係数を算出するので、POCが等間隔でない場合であっても、その値に惑わされることなく、適切な重み係数の算出が可能となる。その結果、符号化効率の低下を抑制することができる。また、重み係数は、各テンプレートマッチングブロックに対して独立に算出されるので、画像のローカルな性質に基づいたWeighted Predictionを実現することができる。

MPEGデコーダ３１７から供給された映像データは、ビデオデコーダ３１５から供給された映像データの場合と同様に、映像信号処理回路３１８において所定の処理が施される。そして、所定の処理が施された映像データは、グラフィック生成回路３１９において、生成された映像データ等が適宜重畳され、パネル駆動回路３２０を介して表示パネル３２１に供給され、その画像が表示される。

MPEGデコーダ３１７から供給された音声データは、音声A/D変換回路３１４から供給された音声データの場合と同様に、音声信号処理回路３２２において所定の処理が施される。そして、所定の処理が施された音声データは、エコーキャンセル／音声合成回路３２３を介して音声増幅回路３２４に供給され、D/A変換処理や増幅処理が施される。その結果、所定の音量に調整された音声がスピーカ３２５から出力される。

また、テレビジョン受像機３００は、マイクロホン３２６、およびA/D変換回路３２７も有する。

A/D変換回路３２７は、音声会話用のものとしてテレビジョン受像機３００に設けられるマイクロホン３２６により取り込まれたユーザの音声の信号を受信する。A/D変換回路３２７は、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、テレビジョン受像機３００のユーザ（ユーザＡ）の音声のデータがA/D変換回路３２７から供給されている場合、ユーザＡの音声データを対象としてエコーキャンセルを行う。そして、エコーキャンセル／音声合成回路３２３は、エコーキャンセルの後、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路３２４を介してスピーカ３２５より出力させる。

さらに、テレビジョン受像機３００は、音声コーデック３２８、内部バス３２９、SDRAM（Synchronous Dynamic Random Access Memory)３３０、フラッシュメモリ３３１、CPU３３２、USB（Universal Serial Bus) I/F３３３、およびネットワークI/F３３４も有する。

A/D変換回路３２７は、音声会話用のものとしてテレビジョン受像機３００に設けられるマイクロホン３２６により取り込まれたユーザの音声の信号を受信する。A/D変換回路３２７は、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データを音声コーデック３２８に供給する。

音声コーデック３２８は、A/D変換回路３２７から供給された音声データを、ネットワーク経由で送信するための所定のフォーマットのデータに変換し、内部バス３２９を介してネットワークI/F３３４に供給する。

ネットワークI/F３３４は、ネットワーク端子３３５に装着されたケーブルを介してネットワークに接続される。ネットワークI/F３３４は、例えば、そのネットワークに接続される他の装置に対して、音声コーデック３２８から供給された音声データを送信する。また、ネットワークI/F３３４は、例えば、ネットワークを介して接続される他の装置から送信される音声データを、ネットワーク端子３３５を介して受信し、それを、内部バス３２９を介して音声コーデック３２８に供給する。

音声コーデック３２８は、ネットワークI/F３３４から供給された音声データを所定のフォーマットのデータに変換し、それをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、音声コーデック３２８から供給される音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路３２４を介してスピーカ３２５より出力させる。

SDRAM３３０は、CPU３３２が処理を行う上で必要な各種のデータを記憶する。

フラッシュメモリ３３１は、CPU３３２により実行されるプログラムを記憶する。フラッシュメモリ３３１に記憶されているプログラムは、テレビジョン受像機３００の起動時などの所定のタイミングでCPU３３２により読み出される。フラッシュメモリ３３１には、デジタル放送を介して取得されたEPGデータ、ネットワークを介して所定のサーバから取得されたデータなども記憶される。

例えば、フラッシュメモリ３３１には、CPU３３２の制御によりネットワークを介して所定のサーバから取得されたコンテンツデータを含むMPEG-TSが記憶される。フラッシュメモリ３３１は、例えばCPU３３２の制御により、そのMPEG-TSを、内部バス３２９を介してMPEGデコーダ３１７に供給する。

MPEGデコーダ３１７は、デジタルチューナ３１６から供給されたMPEG-TSの場合と同様に、そのMPEG-TSを処理する。このようにテレビジョン受像機３００は、映像や音声等よりなるコンテンツデータを、ネットワークを介して受信し、MPEGデコーダ３１７を用いてデコードし、その映像を表示させたり、音声を出力させたりすることができる。

また、テレビジョン受像機３００は、リモートコントローラ３５１から送信される赤外線信号を受光する受光部３３７も有する。

受光部３３７は、リモートコントローラ３５１からの赤外線を受光し、復調して得られたユーザ操作の内容を表す制御コードをCPU３３２に出力する。

CPU３３２は、フラッシュメモリ３３１に記憶されているプログラムを実行し、受光部３３７から供給される制御コードなどに応じてテレビジョン受像機３００の全体の動作を制御する。CPU３３２とテレビジョン受像機３００の各部は、図示せぬ経路を介して接続されている。

USB I/F３３３は、USB端子３３６に装着されたUSBケーブルを介して接続される、テレビジョン受像機３００の外部の機器との間でデータの送受信を行う。ネットワークI/F３３４は、ネットワーク端子３３５に装着されたケーブルを介してネットワークに接続し、ネットワークに接続される各種の装置と音声データ以外のデータの送受信も行う。

テレビジョン受像機３００は、MPEGデコーダ３１７として画像復号装置１０１を用いることにより、画像のローカルな性質に基づいた重み付け予測（Weighted Prediction）を行うことができる。その結果として、テレビジョン受像機３００は、アンテナを介して受信した放送波信号や、ネットワークを介して取得したコンテンツデータから、より高精細な復号画像を得て、表示することができる。

図２９は、本発明を適用した画像符号化装置および画像復号装置を用いる携帯電話機の主な構成例を示すブロック図である。

図２９に示される携帯電話機４００は、各部を統括的に制御するようになされた主制御部４５０、電源回路部４５１、操作入力制御部４５２、画像エンコーダ４５３、カメラI/F部４５４、LCD制御部４５５、画像デコーダ４５６、多重分離部４５７、記録再生部４６２、変復調回路部４５８、および音声コーデック４５９を有する。これらは、バス４６０を介して互いに接続されている。

また、携帯電話機４００は、操作キー４１９、CCD（Charge Coupled Devices）カメラ４１６、液晶ディスプレイ４１８、記憶部４２３、送受信回路部４６３、アンテナ４１４、マイクロホン（マイク）４２１、およびスピーカ４１７を有する。

電源回路部４５１は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話機４００を動作可能な状態に起動する。

携帯電話機４００は、CPU、ROMおよびRAM等でなる主制御部４５０の制御に基づいて、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

例えば、音声通話モードにおいて、携帯電話機４００は、マイクロホン（マイク）４２１で集音した音声信号を、音声コーデック４５９によってデジタル音声データに変換し、これを変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（音声信号）は、公衆電話回線網を介して通話相手の携帯電話機に供給される。

また、例えば、音声通話モードにおいて、携帯電話機４００は、アンテナ４１４で受信した受信信号を送受信回路部４６３で増幅し、さらに周波数変換処理およびアナログデジタル変換処理し、変復調回路部４５８でスペクトラム逆拡散処理し、音声コーデック４５９によってアナログ音声信号に変換する。携帯電話機４００は、その変換して得られたアナログ音声信号をスピーカ４１７から出力する。

更に、例えば、データ通信モードにおいて電子メールを送信する場合、携帯電話機４００は、操作キー４１９の操作によって入力された電子メールのテキストデータを、操作入力制御部４５２において受け付ける。携帯電話機４００は、そのテキストデータを主制御部４５０において処理し、LCD制御部４５５を介して、画像として液晶ディスプレイ４１８に表示させる。

また、携帯電話機４００は、主制御部４５０において、操作入力制御部４５２が受け付けたテキストデータやユーザ指示等に基づいて電子メールデータを生成する。携帯電話機４００は、その電子メールデータを、変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（電子メール）は、ネットワークおよびメールサーバ等を介して、所定のあて先に供給される。

また、例えば、データ通信モードにおいて電子メールを受信する場合、携帯電話機４００は、基地局から送信された信号を、アンテナ４１４を介して送受信回路部４６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機４００は、その受信信号を変復調回路部４５８でスペクトラム逆拡散処理して元の電子メールデータを復元する。携帯電話機４００は、復元された電子メールデータを、LCD制御部４５５を介して液晶ディスプレイ４１８に表示する。

なお、携帯電話機４００は、受信した電子メールデータを、記録再生部４６２を介して、記憶部４２３に記録する（記憶させる）ことも可能である。

この記憶部４２３は、書き換え可能な任意の記憶媒体である。記憶部４２３は、例えば、RAMや内蔵型フラッシュメモリ等の半導体メモリであってもよいし、ハードディスクであってもよいし、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアであってもよい。もちろん、これら以外のものであってもよい。

さらに、例えば、データ通信モードにおいて画像データを送信する場合、携帯電話機４００は、撮像によりCCDカメラ４１６で画像データを生成する。CCDカメラ４１６は、レンズや絞り等の光学デバイスと光電変換素子としてのCCDを有し、被写体を撮像し、受光した光の強度を電気信号に変換し、被写体の画像の画像データを生成する。その画像データを、カメラI/F部４５４を介して、画像エンコーダ４５３で、例えばMPEG２やMPEG４等の所定の符号化方式によって圧縮符号化することにより符号化画像データに変換する。

携帯電話機４００は、このような処理を行う画像エンコーダ４５３として、上述した画像符号化装置５１を用いる。したがって、画像エンコーダ４５３は、画像符号化装置５１の場合と同様に、Implicit Weighted Predictionにおける重み係数を算出するので、POCが等間隔でない場合であっても、その値に惑わされることなく、適切な重み係数の算出が可能となる。その結果、符号化効率の低下を抑制することができる。また、重み係数は、各テンプレートマッチングブロックに対して独立に算出されるので、画像のローカルな性質に基づいたWeighted Predictionを実現することができる。

なお、携帯電話機４００は、このとき同時に、CCDカメラ４１６で撮像中にマイクロホン（マイク）４２１で集音した音声を、音声コーデック４５９においてアナログデジタル変換し、さらに符号化する。

携帯電話機４００は、多重分離部４５７において、画像エンコーダ４５３から供給された符号化画像データと、音声コーデック４５９から供給されたデジタル音声データとを、所定の方式で多重化する。携帯電話機４００は、その結果得られる多重化データを、変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（画像データ）は、ネットワーク等を介して、通信相手に供給される。

なお、画像データを送信しない場合、携帯電話機４００は、CCDカメラ４１６で生成した画像データを、画像エンコーダ４５３を介さずに、LCD制御部４５５を介して液晶ディスプレイ４１８に表示させることもできる。

また、例えば、データ通信モードにおいて、簡易ホームページ等にリンクされた動画像ファイルのデータを受信する場合、携帯電話機４００は、基地局から送信された信号を、アンテナ４１４を介して送受信回路部４６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機４００は、その受信信号を変復調回路部４５８でスペクトラム逆拡散処理して元の多重化データを復元する。携帯電話機４００は、多重分離部４５７において、その多重化データを分離して、符号化画像データと音声データとに分ける。

携帯電話機４００は、画像デコーダ４５６において、符号化画像データを、MPEG２やMPEG４等の所定の符号化方式に対応した復号方式でデコードすることにより、再生動画像データを生成し、これを、LCD制御部４５５を介して液晶ディスプレイ４１８に表示させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる動画データが液晶ディスプレイ４１８に表示される。

携帯電話機４００は、このような処理を行う画像デコーダ４５６として、上述した画像復号装置１０１を用いる。したがって、画像デコーダ４５６は、画像復号装置１０１の場合と同様に、Implicit Weighted Predictionにおける重み係数を算出するので、POCが等間隔でない場合であっても、その値に惑わされることなく、適切な重み係数の算出が可能となる。その結果、符号化効率の低下を抑制することができる。また、重み係数は、各テンプレートマッチングブロックに対して独立に算出されるので、画像のローカルな性質に基づいたWeighted Predictionを実現することができる。

このとき、携帯電話機４００は、同時に、音声コーデック４５９において、デジタルの音声データをアナログ音声信号に変換し、これをスピーカ４１７より出力させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる音声データが再生される。

なお、電子メールの場合と同様に、携帯電話機４００は、受信した簡易ホームページ等にリンクされたデータを、記録再生部４６２を介して、記憶部４２３に記録する（記憶させる）ことも可能である。

また、携帯電話機４００は、主制御部４５０において、撮像されてCCDカメラ４１６で得られた２次元コードを解析し、２次元コードに記録された情報を取得することができる。

さらに、携帯電話機４００は、赤外線通信部４８１で赤外線により外部の機器と通信することができる。

携帯電話機４００は、画像エンコーダ４５３として画像符号化装置５１を用いることにより、例えばCCDカメラ４１６において生成された画像データを符号化して生成する符号化データの符号化効率を向上させることができる。結果として、携帯電話機４００は、符号化効率のよい符号化データ（画像データ）を、他の装置に提供することができる。

また、携帯電話機４００は、画像デコーダ４５６として画像復号装置１０１を用いることにより、精度の高い予測画像を生成することができる。その結果として、携帯電話機４００は、例えば、簡易ホームページにリンクされた動画像ファイルから、より高精細な復号画像を得て、表示することができる。

なお、以上において、携帯電話機４００が、CCDカメラ４１６を用いるように説明したが、このCCDカメラ４１６の代わりに、CMOS（Complementary Metal Oxide Semiconductor）を用いたイメージセンサ（CMOSイメージセンサ）を用いるようにしてもよい。この場合も、携帯電話機４００は、CCDカメラ４１６を用いる場合と同様に、被写体を撮像し、被写体の画像の画像データを生成することができる。

また、以上においては携帯電話機４００として説明したが、例えば、PDA（Personal Digital Assistants）、スマートフォン、UMPC（Ultra Mobile Personal Computer）、ネットブック、ノート型パーソナルコンピュータ等、この携帯電話機４００と同様の撮像機能や通信機能を有する装置であれば、どのような装置であっても携帯電話機４００の場合と同様に、画像符号化装置５１および画像復号装置１０１を適用することができる。

図３０は、本発明を適用した画像符号化装置および画像復号装置を用いるハードディスクレコーダの主な構成例を示すブロック図である。

図３０に示されるハードディスクレコーダ（HDDレコーダ）５００は、チューナにより受信された、衛星や地上のアンテナ等より送信される放送波信号（テレビジョン信号）に含まれる放送番組のオーディオデータとビデオデータを、内蔵するハードディスクに保存し、その保存したデータをユーザの指示に応じたタイミングでユーザに提供する装置である。

ハードディスクレコーダ５００は、例えば、放送波信号よりオーディオデータとビデオデータを抽出し、それらを適宜復号し、内蔵するハードディスクに記憶させることができる。また、ハードディスクレコーダ５００は、例えば、ネットワークを介して他の装置からオーディオデータやビデオデータを取得し、それらを適宜復号し、内蔵するハードディスクに記憶させることもできる。

さらに、ハードディスクレコーダ５００は、例えば、内蔵するハードディスクに記録されているオーディオデータやビデオデータを復号してモニタ５６０に供給し、モニタ５６０の画面にその画像を表示させる。また、ハードディスクレコーダ５００は、モニタ５６０のスピーカよりその音声を出力させることができる。

ハードディスクレコーダ５００は、例えば、チューナを介して取得された放送波信号より抽出されたオーディオデータとビデオデータ、または、ネットワークを介して他の装置から取得したオーディオデータやビデオデータを復号してモニタ５６０に供給し、モニタ５６０の画面にその画像を表示させる。また、ハードディスクレコーダ５００は、モニタ５６０のスピーカよりその音声を出力させることもできる。

もちろん、この他の動作も可能である。

図３０に示されるように、ハードディスクレコーダ５００は、受信部５２１、復調部５２２、デマルチプレクサ５２３、オーディオデコーダ５２４、ビデオデコーダ５２５、およびレコーダ制御部５２６を有する。ハードディスクレコーダ５００は、さらに、EPGデータメモリ５２７、プログラムメモリ５２８、ワークメモリ５２９、ディスプレイコンバータ５３０、OSD（On Screen Display）制御部５３１、ディスプレイ制御部５３２、記録再生部５３３、D/Aコンバータ５３４、および通信部５３５を有する。

また、ディスプレイコンバータ５３０は、ビデオエンコーダ５４１を有する。記録再生部５３３は、エンコーダ５５１およびデコーダ５５２を有する。

受信部５２１は、リモートコントローラ（図示せず）からの赤外線信号を受信し、電気信号に変換してレコーダ制御部５２６に出力する。レコーダ制御部５２６は、例えば、マイクロプロセッサなどにより構成され、プログラムメモリ５２８に記憶されているプログラムに従って、各種の処理を実行する。レコーダ制御部５２６は、このとき、ワークメモリ５２９を必要に応じて使用する。

通信部５３５は、ネットワークに接続され、ネットワークを介して他の装置との通信処理を行う。例えば、通信部５３５は、レコーダ制御部５２６により制御され、チューナ（図示せず）と通信し、主にチューナに対して選局制御信号を出力する。

復調部５２２は、チューナより供給された信号を、復調し、デマルチプレクサ５２３に出力する。デマルチプレクサ５２３は、復調部５２２より供給されたデータを、オーディオデータ、ビデオデータ、およびEPGデータに分離し、それぞれ、オーディオデコーダ５２４、ビデオデコーダ５２５、またはレコーダ制御部５２６に出力する。

オーディオデコーダ５２４は、入力されたオーディオデータを、例えばMPEG方式でデコードし、記録再生部５３３に出力する。ビデオデコーダ５２５は、入力されたビデオデータを、例えばMPEG方式でデコードし、ディスプレイコンバータ５３０に出力する。レコーダ制御部５２６は、入力されたEPGデータをEPGデータメモリ５２７に供給し、記憶させる。

ディスプレイコンバータ５３０は、ビデオデコーダ５２５またはレコーダ制御部５２６より供給されたビデオデータを、ビデオエンコーダ５４１により、例えばNTSC（National Television Standards Committee）方式のビデオデータにエンコードし、記録再生部５３３に出力する。また、ディスプレイコンバータ５３０は、ビデオデコーダ５２５またはレコーダ制御部５２６より供給されるビデオデータの画面のサイズを、モニタ５６０のサイズに対応するサイズに変換する。ディスプレイコンバータ５３０は、画面のサイズが変換されたビデオデータを、さらに、ビデオエンコーダ５４１によってNTSC方式のビデオデータに変換し、アナログ信号に変換し、ディスプレイ制御部５３２に出力する。

ディスプレイ制御部５３２は、レコーダ制御部５２６の制御のもと、OSD（On Screen Display）制御部５３１が出力したOSD信号を、ディスプレイコンバータ５３０より入力されたビデオ信号に重畳し、モニタ５６０のディスプレイに出力し、表示させる。

モニタ５６０にはまた、オーディオデコーダ５２４が出力したオーディオデータが、D/Aコンバータ５３４によりアナログ信号に変換されて供給されている。モニタ５６０は、このオーディオ信号を内蔵するスピーカから出力する。

記録再生部５３３は、ビデオデータやオーディオデータ等を記録する記憶媒体としてハードディスクを有する。

記録再生部５３３は、例えば、オーディオデコーダ５２４より供給されるオーディオデータを、エンコーダ５５１によりMPEG方式でエンコードする。また、記録再生部５３３は、ディスプレイコンバータ５３０のビデオエンコーダ５４１より供給されるビデオデータを、エンコーダ５５１によりMPEG方式でエンコードする。記録再生部５３３は、そのオーディオデータの符号化データとビデオデータの符号化データとをマルチプレクサにより合成する。記録再生部５３３は、その合成データをチャネルコーディングして増幅し、そのデータを、記録ヘッドを介してハードディスクに書き込む。

記録再生部５３３は、再生ヘッドを介してハードディスクに記録されているデータを再生し、増幅し、デマルチプレクサによりオーディオデータとビデオデータに分離する。記録再生部５３３は、デコーダ５５２によりオーディオデータおよびビデオデータをMPEG方
式でデコードする。記録再生部５３３は、復号したオーディオデータをD/A変換し、モニタ５６０のスピーカに出力する。また、記録再生部５３３は、復号したビデオデータをD/A変換し、モニタ５６０のディスプレイに出力する。

レコーダ制御部５２６は、受信部５２１を介して受信されるリモートコントローラからの赤外線信号により示されるユーザ指示に基づいて、EPGデータメモリ５２７から最新のEPGデータを読み出し、それをOSD制御部５３１に供給する。OSD制御部５３１は、入力されたEPGデータに対応する画像データを発生し、ディスプレイ制御部５３２に出力する。ディスプレイ制御部５３２は、OSD制御部５３１より入力されたビデオデータをモニタ５６０のディスプレイに出力し、表示させる。これにより、モニタ５６０のディスプレイには、EPG（電子番組ガイド）が表示される。

また、ハードディスクレコーダ５００は、インターネット等のネットワークを介して他の装置から供給されるビデオデータ、オーディオデータ、またはEPGデータ等の各種データを取得することができる。

通信部５３５は、レコーダ制御部５２６に制御され、ネットワークを介して他の装置から送信されるビデオデータ、オーディオデータ、およびEPGデータ等の符号化データを取得し、それをレコーダ制御部５２６に供給する。レコーダ制御部５２６は、例えば、取得したビデオデータやオーディオデータの符号化データを記録再生部５３３に供給し、ハードディスクに記憶させる。このとき、レコーダ制御部５２６および記録再生部５３３が、必要に応じて再エンコード等の処理を行うようにしてもよい。

また、レコーダ制御部５２６は、取得したビデオデータやオーディオデータの符号化データを復号し、得られるビデオデータをディスプレイコンバータ５３０に供給する。ディスプレイコンバータ５３０は、ビデオデコーダ５２５から供給されるビデオデータと同様に、レコーダ制御部５２６から供給されるビデオデータを処理し、ディスプレイ制御部５３２を介してモニタ５６０に供給し、その画像を表示させる。

また、この画像表示に合わせて、レコーダ制御部５２６が、復号したオーディオデータを、D/Aコンバータ５３４を介してモニタ５６０に供給し、その音声をスピーカから出力させるようにしてもよい。

さらに、レコーダ制御部５２６は、取得したEPGデータの符号化データを復号し、復号したEPGデータをEPGデータメモリ５２７に供給する。

以上のようなハードディスクレコーダ５００は、ビデオデコーダ５２５、デコーダ５５２、およびレコーダ制御部５２６に内蔵されるデコーダとして画像復号装置１０１を用いる。したがって、ビデオデコーダ５２５、デコーダ５５２、およびレコーダ制御部５２６に内蔵されるデコーダは、画像復号装置１０１の場合と同様に、Implicit Weighted Predictionにおける重み係数を算出するので、POCが等間隔でない場合であっても、その値に惑わされることなく、適切な重み係数の算出が可能となる。その結果、符号化効率の低下を抑制することができる。また、重み係数は、各テンプレートマッチングブロックに対して独立に算出されるので、画像のローカルな性質に基づいたWeighted Predictionを実現することができる。

したがって、ハードディスクレコーダ５００は、精度の高い予測画像を生成することができる。その結果として、ハードディスクレコーダ５００は、例えば、チューナを介して受信されたビデオデータの符号化データや、記録再生部５３３のハードディスクから読み出されたビデオデータの符号化データや、ネットワークを介して取得したビデオデータの符号化データから、より高精細な復号画像を得て、モニタ５６０に表示させることができる。

また、ハードディスクレコーダ５００は、エンコーダ５５１として画像符号化装置５１を用いる。したがって、エンコーダ５５１は、画像符号化装置５１の場合と同様に、Implicit Weighted Predictionにおける重み係数を算出するので、POCが等間隔でない場合であっても、その値に惑わされることなく、適切な重み係数の算出が可能となる。その結果、符号化効率の低下を抑制することができる。また、重み係数は、各テンプレートマッチングブロックに対して独立に算出されるので、画像のローカルな性質に基づいたWeighted Predictionを実現することができる。

したがって、ハードディスクレコーダ５００は、例えば、ハードディスクに記録する符号化データの符号化効率を向上させることができる。その結果として、ハードディスクレコーダ５００は、ハードディスクの記憶領域をより効率よく使用することができる。

なお、以上においては、ビデオデータやオーディオデータをハードディスクに記録するハードディスクレコーダ５００について説明したが、もちろん、記録媒体はどのようなものであってもよい。例えばフラッシュメモリ、光ディスク、またはビデオテープ等、ハードディスク以外の記録媒体を適用するレコーダであっても、上述したハードディスクレコーダ５００の場合と同様に、画像符号化装置５１および画像復号装置１０１を適用することができる。

図３１は、本発明を適用した画像復号装置および画像符号化装置を用いるカメラの主な構成例を示すブロック図である。

図３１に示されるカメラ６００は、被写体を撮像し、被写体の画像をLCD６１６に表示させたり、それを画像データとして、記録メディア６３３に記録したりする。

レンズブロック６１１は、光（すなわち、被写体の映像）を、CCD/CMOS６１２に入射させる。CCD/CMOS６１２は、CCDまたはCMOSを用いたイメージセンサであり、受光した光の強度を電気信号に変換し、カメラ信号処理部６１３に供給する。

カメラ信号処理部６１３は、CCD/CMOS６１２から供給された電気信号を、Ｙ，Ｃｒ，Ｃｂの色差信号に変換し、画像信号処理部６１４に供給する。画像信号処理部６１４は、コントローラ６２１の制御の下、カメラ信号処理部６１３から供給された画像信号に対して所定の画像処理を施したり、その画像信号をエンコーダ６４１で例えばMPEG方式により符号化したりする。画像信号処理部６１４は、画像信号を符号化して生成した符号化データを、デコーダ６１５に供給する。さらに、画像信号処理部６１４は、オンスクリーンディスプレイ（OSD）６２０において生成された表示用データを取得し、それをデコーダ６１５に供給する。

以上の処理において、カメラ信号処理部６１３は、バス６１７を介して接続されるDRAM（Dynamic Random Access Memory）６１８を適宜利用し、必要に応じて画像データや、その画像データが符号化された符号化データ等をそのDRAM６１８に保持させる。

デコーダ６１５は、画像信号処理部６１４から供給された符号化データを復号し、得られた画像データ（復号画像データ）をLCD６１６に供給する。また、デコーダ６１５は、画像信号処理部６１４から供給された表示用データをLCD６１６に供給する。LCD６１６は、デコーダ６１５から供給された復号画像データの画像と表示用データの画像を適宜合成し、その合成画像を表示する。

オンスクリーンディスプレイ６２０は、コントローラ６２１の制御の下、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを、バス６１７を介して画像信号処理部６１４に出力する。

コントローラ６２１は、ユーザが操作部６２２を用いて指令した内容を示す信号に基づいて、各種処理を実行するとともに、バス６１７を介して、画像信号処理部６１４、DRAM６１８、外部インタフェース６１９、オンスクリーンディスプレイ６２０、およびメディアドライブ６２３等を制御する。FLASH ROM６２４には、コントローラ６２１が各種処理を実行する上で必要なプログラムやデータ等が格納される。

例えば、コントローラ６２１は、画像信号処理部６１４やデコーダ６１５に代わって、DRAM６１８に記憶されている画像データを符号化したり、DRAM６１８に記憶されている符号化データを復号したりすることができる。このとき、コントローラ６２１は、画像信号処理部６１４やデコーダ６１５の符号化・復号方式と同様の方式によって符号化・復号処理を行うようにしてもよいし、画像信号処理部６１４やデコーダ６１５が対応していない方式により符号化・復号処理を行うようにしてもよい。

また、例えば、操作部６２２から画像印刷の開始が指示された場合、コントローラ６２１は、DRAM６１８から画像データを読み出し、それを、バス６１７を介して外部インタフェース６１９に接続されるプリンタ６３４に供給して印刷させる。

さらに、例えば、操作部６２２から画像記録が指示された場合、コントローラ６２１は、DRAM６１８から符号化データを読み出し、それを、バス６１７を介してメディアドライブ６２３に装着される記録メディア６３３に供給して記憶させる。

記録メディア６３３は、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアである。記録メディア６３３は、もちろん、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であっても良い。

また、メディアドライブ６２３と記録メディア６３３を一体化し、例えば、内蔵型ハードディスクドライブやSSD（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

外部インタフェース６１９は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタ６３４と接続される。また、外部インタフェース６１９には、必要に応じてドライブ６３１が接続され、磁気ディスク、光ディスク、あるいは光磁気ディスクなどのリムーバブルメディア６３２が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、FLASH ROM６２４にインストールされる。

さらに、外部インタフェース６１９は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。コントローラ６２１は、例えば、操作部６２２からの指示に従って、DRAM６１８から符号化データを読み出し、それを外部インタフェース６１９から、ネットワークを介して接続される他の装置に供給させることができる。また、コントローラ６２１は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース６１９を介して取得し、それをDRAM６１８に保持させたり、画像信号処理部６１４に供給したりすることができる。

以上のようなカメラ６００は、デコーダ６１５として画像復号装置１０１を用いる。したがって、デコーダ６１５は、画像復号装置１０１の場合と同様に、Implicit Weighted Predictionにおける重み係数を算出するので、POCが等間隔でない場合であっても、その値に惑わされることなく、適切な重み係数の算出が可能となる。その結果、符号化効率の低下を抑制することができる。また、重み係数は、各テンプレートマッチングブロックに対して独立に算出されるので、画像のローカルな性質に基づいたWeighted Predictionを実現することができる。

したがって、カメラ６００は、精度の高い予測画像を生成することができる。その結果として、カメラ６００は、例えば、CCD/CMOS６１２において生成された画像データや、DRAM６１８または記録メディア６３３から読み出されたビデオデータの符号化データや、ネットワークを介して取得したビデオデータの符号化データから、より高精細な復号画像を得て、LCD６１６に表示させることができる。

また、カメラ６００は、エンコーダ６４１として画像符号化装置５１を用いる。したがって、エンコーダ６４１は、画像符号化装置５１の場合と同様に、Implicit Weighted Predictionにおける重み係数を算出するので、POCが等間隔でない場合であっても、その値に惑わされることなく、適切な重み係数の算出が可能となる。その結果、符号化効率の低下を抑制することができる。また、重み係数は、各テンプレートマッチングブロックに対して独立に算出されるので、画像のローカルな性質に基づいたWeighted Predictionを実現することができる。

したがって、カメラ６００は、例えば、ハードディスクに記録する符号化データの符号化効率を向上させることができる。その結果として、カメラ６００は、DRAM６１８や記録メディア６３３の記憶領域をより効率よく使用することができる。

なお、コントローラ６２１が行う復号処理に画像復号装置１０１の復号方法を適用するようにしてもよい。同様に、コントローラ６２１が行う符号化処理に画像符号化装置５１の符号化方法を適用するようにしてもよい。

また、カメラ６００が撮像する画像データは動画像であってもよいし、静止画像であってもよい。

もちろん、画像符号化装置５１および画像復号装置１０１は、上述した装置以外の装置やシステムにも適用可能である。

５１画像符号化装置，７６インターテンプレート動き予測・補償部，７７重み係数算出部, １０１画像復号装置，１２３インターテンプレート動き予測・補償部，１２４重み係数算出部

Claims

復号対象のフレームの画像のブロックについて、インターテンプレートマッチング方式によるマッチング処理を行うマッチング手段と、
前記マッチング手段による前記マッチング処理におけるテンプレートの画素値を用いた重み付け予測を行う予測手段と
を備える画像処理装置。
前記フレームの画像は、Pピクチャであり、
前記重み付け予測は、Implicit Weighted Predictionである
請求項１に記載の画像処理装置。
前記予測手段は、前記テンプレートの画素値から算出された重み係数を用いて前記重み付け予測を行う
請求項２に記載の画像処理装置。
前記テンプレートの画素値の平均値をAve(B)とし、そのテンプレートと相関の最も高い、前記マッチングで参照される参照フレームの画像内の領域である参照テンプレートの画素値の平均値をAve(B')とし、前記重み係数をｗ₀としたときの式
ｗ₀＝Ave(B’)/Ave(B)
により前記重み係数を算出する算出手段をさらに備え、
前記予測手段は、前記ブロックの予測画素値をPred(A)とし、前記テンプレートと前記ブロックの位置関係と同一の位置関係を、前記参照テンプレートとの間に有する前記参照フレームの画像内の領域の画素値をPix(A’)としたときの、前記重み係数ｗ₀を用いた式
Pred(A)＝ｗ₀×Pix(A’)
により前記ブロックの前記予測画素値を算出する
請求項３に記載の画像処理装置。
前記算出手段は、前記重み係数ｗ₀をX/（2ⁿ）の形式で表される値に近似する
請求項４に記載の画像処理装置。
前記予測手段は、前記テンプレートの画素値から算出されたオフセットを用いて前記重み付け予測を行う
請求項２に記載の画像処理装置。
前記テンプレートの画素値の平均値をAve(B)とし、そのテンプレートと相関の最も高い、前記マッチングで参照される参照フレームの画像内の領域である参照テンプレートの画素値の平均値をAve(B')とし、前記オフセットをｄ₀としたときの式
ｄ₀＝Ave(B)−Ave(B’)
により前記オフセットを算出する算出手段をさらに備え、
前記予測手段は、前記ブロックの予測画素値をPred(A)とし、前記テンプレートと前記ブロックの位置関係と同一の位置関係を、前記参照テンプレートとの間に有する前記参照フレームの画像内の領域の予測画素値をPred(A’)としたときの、前記オフセットｄ₀を用いた式
Pred(A)＝Pred(A’)＋ｄ₀
により前記ブロックの前記予測画素値を算出する
請求項６に記載の画像処理装置。
前記予測手段は、前記ブロックについて、符号化時に重み付け予測としてImplicit Weighted Predictionが行われたことを表す情報を、前記フレームの画像としてのPピクチャのヘッダ部から抽出し、その情報に応じて、前記重み付け予測としてImplicit Weighted Predictionを行う
請求項２に記載の画像処理装置。
前記テンプレートの画素値から、前記重み付け予測に用いられる第１および第２の重み係数を算出する算出手段
をさらに備え、
前記算出手段は、前記テンプレートの画素値の平均値をAve_tmplt_Curとし、そのテンプレートと相関の最も高い、前記マッチングで参照される第１の参照フレームの画像内の領域である第１の参照プレートおよび第２の参照フレームの画像内の領域である第２の参照テンプレートの画素値の平均値をそれぞれAve_tmplt_L0，Ave_tmplt_L1とし、前記第１および第２の重み係数をそれぞれｗ₀，ｗ₁としたときの式
ｗ₀＝|Ave_tmplt_L1−Ave_tmplt_Cur|
ｗ₁＝|Ave_tmplt_L0−Ave_tmplt_Cur|
により前記第１および第２の重み係数を算出し、
その第１の重み係数ｗ₀と第２の重み係数ｗ₁を、式
ｗ₀＝ｗ₀/(ｗ₀＋ｗ₁)
ｗ₁＝ｗ₁/(ｗ₀＋ｗ₁)
により正規化し、
前記予測手段は、前記ブロックの予測画素値をPred_Curとし、前記テンプレートと前記ブロックの位置関係と同一の位置関係を、前記第１の参照テンプレートとの間に有する前記第１の参照フレームの画像内の領域の画素値および前記第２の参照テンプレートとの間に有する前記第２の参照フレームの画像内の領域の画素値をそれぞれPix_L0，Pix_L1としたときの、正規化後の第１の重み係数ｗ₀および前記第２の重み係数ｗ₁を用いた式 Pred_Cur＝ｗ₀×Pix_L0＋ｗ₁×Pix_L1
により前記ブロックの予測画素値を算出する
請求項１に記載の画像処理装置。
前記算出手段は、前記第１の重み係数ｗ₀および前記第２の重み係数ｗ₁をX/(2ⁿ)の形式で表される値に近似する
請求項９に記載の画像処理装置。
画像処理装置が、
復号対象のフレームの画像のブロックについて、インターテンプレートマッチング方式によるマッチング処理を行い、
前記マッチング処理におけるテンプレートの画素値を用いた重み付け予測を行うステップ
を含む画像処理方法。
符号化対象のフレームの画像のブロックについて、インターテンプレートマッチング方式によるマッチング処理を行うマッチング手段と、
前記マッチング手段による前記マッチング処理におけるテンプレートの画素値を用いた重み付け予測を行う予測手段と
を備える画像処理装置。
前記フレームの画像は、Pピクチャであり、
前記重み付け予測は、Implicit Weighted Predictionである
請求項１２に記載の画像処理装置。
前記ブロックについて、前記重み付け予測としてImplicit Weighted Predictionが行われたことを表す情報を、前記フレームの画像としてのPピクチャのヘッダ部に挿入する挿入手段を
さらに備える請求項１３に記載の画像処理装置。
画像処理装置が、
符号化対象のフレームの画像のブロックについて、インターテンプレートマッチング方式によるマッチング処理を行い、
前記マッチング処理におけるテンプレートの画素値を用いた重み付け予測を行うステップ
を含む画像処理方法。