WO2012077532A1

WO2012077532A1 - 画像処理装置、画像処理方法、およびプログラム

Info

Publication number: WO2012077532A1
Application number: PCT/JP2011/077509
Authority: WO
Inventors: 健治近藤
Original assignee: ソニー株式会社
Priority date: 2010-12-07
Filing date: 2011-11-29
Publication date: 2012-06-14
Also published as: US20130195187A1; CN103238331A; JP2012124673A

Abstract

本発明は、インター予測時に分数精度の動き補償処理を行う場合において、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を軽減することができる画像処理装置、画像処理方法、およびプログラムに関する。参照画像読出部４１は、インター予測における予測画像の画素の参照画像上の水平方向および垂直方向の位置が、1/2画素位置ではない分数画素位置である場合、直交する2つの斜め方向に並ぶ参照画素を含む所定の参照画素を読み出す。FIRフィルタ４２は、読み出された所定の参照画素を用いて、参照画像の分数位置の画素を予測画像の画素として演算する。本発明は、例えば、H．264/AVC方式で圧縮符号化する符号化装置に適用することができる。

Description

画像処理装置、画像処理方法、およびプログラム

　本発明は、画像処理装置、画像処理方法、およびプログラムに関し、特に、インター予測時に分数精度の動き補償処理を行う場合において、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を軽減することができるようにした画像処理装置、画像処理方法、およびプログラムに関する。

　画像を圧縮する標準規格として、H．264/MPEG（Moving Picture Experts Group）-4 Part10 Advanced Video Coding（以下H．264/AVCという）がある。

　H.264/AVCにおいては、フレームまたはフィールド間の相関に注目したインター予測が行われる。インター予測では、既に保存されている参照可能な画像内の一部の領域を用いて動き補償処理が行われ、予測画像が生成される。

　近年、この動き補償処理において、動きベクトルの分解能を2分の1または4分の1といった分数精度に向上させることが考えられている。

　このような分数精度の動き補償処理においては、参照画像の隣接する画素の間にSub pelと呼ばれる仮想的な分数位置の画素を設定し、そのSub pelを生成する処理（以下、インターポーレーションという）が追加して行われる（例えば、特許文献１参照）。即ち、分数精度の動き補償処理では、動きベクトルの最小分解能が画素の分数倍になるため、分数位置の画素を生成するためのインターポーレーションが行われる。

　インターポーレーションに用いられるフィルタであるインターポーレーションフィルタ（Interpolation filter(IF)）としては、通常、有限インパルス応答フィルタ(FIR（Finite Impulse Response） Filter)が用いられる。

　例えば、従来のインターポーレーションでは、インターポーレーションフィルタとして6タップのFIRフィルタが用いられる。また、インターポーレーションフィルタの構造には、Non-separable 2D構造とSeparable 2D 構造がある。

　Non-separable 2D構造のインターポーレーションフィルタが用いられる場合、Sub pelごとに6×6画素の整数位置の画素に対して1回の演算が行われることにより、各Sub pelが生成される。この場合、1回の演算でSub pelが生成されるので遅延量は少ないが、タップ数の2乗個の演算を行う必要があるので処理量は大きい。

　一方、separable 2D構造のインターポーレーションフィルタが用いられる場合、水平方向の位置が分数位置であるSub pelを生成するための演算と、垂直方向の位置が分数位置であるSub pelを生成するための演算が別々に行われる。

　例えば、図１に示すような水平方向の位置のみが1/2画素位置であるSub pel bは、Sub pel bと水平方向の位置が同一の位置の斜線が付された正方形で表される整数位置の6画素を用いた演算により生成される。また、垂直方向の位置のみが1/2画素位置であるSub pel hは、Sub pel hと垂直方向の位置が同一の位置の斜線が付された正方形で表される整数位置の6画素を用いた演算により生成される。

　さらに、水平方向および垂直方向の両方の位置が1/2画素位置であるSub pel jは、斜線が付された正方形で表される整数位置の6×6画素を水平方向に並ぶ6画素単位で用いた6回の演算の後、その演算の結果得られるSub pel jと水平方向の位置が同一の位置である6画素を用いた演算が行われることにより生成される。そして、1/4画素位置の画素a，c乃至g，i、およびｋ乃至oは、両隣の画素b,h,jまたは斜線が付された正方形で表される整数位置の画素を用いて生成される。

　なお、図１において、英字が記述されていない正方形は整数位置の画素を表し、英字が記述されている正方形は、その英字のSub pelを表している。このことは、後述する図３においても同様である。

　図１に示したように、従来のインターポーレーションでは、インターポーレーションにより生成されるSub pelの周辺の最大6×6画素が必要である。従って、分数精度の動き補償処理では、動き補償処理の対象となるブロックよりも非常に広い領域の画素が必要になる。

　例えば、図２に示すように、4×4画素のブロックに対して分数精度の動き補償処理が行われる場合、そのブロックに対応する水玉が付された正方形で表される4×4画素と、その4×4画素の外側の斜線が付された正方形で表される画素とを含む9×9画素が必要となる。従って、インター予測時に分数精度の動き補償処理が行われる場合、参照画像を記憶するメモリの帯域の使用量は大きい。

　また、separable 2D構造のインターポーレーションフィルタが用いられる場合、全てのSub pelの生成に6×6画素の整数位置の画素を用いる必要がないので、Non-separable 2D構造のインターポーレーションフィルタに比べて処理量は少なくなるが、演算回数は多くなる。特に、Sub pel jを生成する場合、整数位置の6×6画素を水平方向に並ぶ6画素単位で用いた6回の演算の後、その演算の結果得られる6画素を用いた演算を行う必要があるので、演算回数が多く、遅延量が大きい。

　そこで、インターポーレーションフィルタにおいて、処理量および遅延量を軽減するために、図３に示すように、Sub pel e,g,j,m,oを、斜め方向に並ぶ整数位置の画素を用いた1回の演算で生成する方法が検討されている。

　具体的には、図３に示す方法では、Sub pel eとSub pel oは、大まかな水玉が付された正方形が表す6個の画素を用いた1回の演算で生成される。また、Sub pel gおよびSub pel mは、細かい水玉が付された正方形が表す6個の画素を用いた1回の演算で生成される。さらに、Sub pel jは、大まかな水玉が付された正方形が表す6個の画素と、細かい水玉が付された正方形が表す6個の画素の両方を用いた1回の演算で生成される。

Dmytro Rusanovskyy,Kemal Ugur, Antti Hallapuro,Jani Lainema,and Moncef Gabbouj,Video Coding With Low-Complexity Directional Adaptive Interpolation Filters, IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY,AUGUST 2009,VOL.19,No.8

　図３に示す方法では、Sub pel eのインターポーレーションに斜め方向に並ぶ大まかな水玉が付された正方形が表す6個の画素が用いられるので、その斜め方向に関してはSub pel eの特性は良好である。しかしながら、大まかな水玉が付された正方形が表す6個の画素が並ぶ方向と直交する方向、即ち細かい水玉が付された正方形が表す6個の画素が並ぶ方向に関してはSub pel eの特性が劣化し、その結果インター予測の精度が劣化する。このことは、Sub pel o,g,mについても同様である。

　また、Sub pel jのインターポーレーションには、直交する2つの斜め方向に並ぶ、大まかな水玉が付された正方形が表す6個の画素と、細かい水玉が付された正方形が表すた6個の画素が用いられるので、斜め方向に関してはSub pel jの特性は良好である。しかしながら、水平方向および垂直方向に関してはSub pel jの特性が劣化し、その結果、インター予測の精度が劣化する。

　本発明は、このような状況に鑑みてなされたものであり、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を軽減することができるようにするものである。

本発明の一側面の画像処理装置は、インター予測における参照画像から所定の画素を読み出す画素読出手段と、前記画素読出手段により読み出された前記所定の画素を用いて、前記参照画像の分数画素位置の画素を前記インター予測における予測画像の画素として演算する演算手段とを備え、前記画素読出手段は、前記予測画像の画素の前記参照画像上の水平方向および垂直方向の位置が、1/2画素位置ではない分数画素位置である場合、前記参照画像の直交する2つの斜め方向に並ぶ画素を含む前記所定の画素を読み出す画像処理装置である。

　本発明の一側面の画像処理方法およびプログラムは、本発明の一側面の画像処理装置に対応する。

　本発明の一側面においては、インター予測における参照画像から所定の画素が読み出され、読み出された前記所定の画素を用いて、前記参照画像の分数画素位置の画素が前記インター予測における予測画像の画素として演算される。なお、前記予測画像の画素の前記参照画像上の水平方向および垂直方向の位置が、1/2画素位置ではない分数画素位置である場合、前記所定の画素は、前記参照画像の直交する2つの斜め方向に並ぶ画素を含む。

　本発明によれば、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を軽減することができる。

Sub pelの生成に用いられる画素の一例を示す図である。分数精度の動き補償処理が行われる場合の参照画素の範囲を示す図である。 Sub pelの生成に用いられる画素の他の例を示す図である。本発明を適用した画像処理装置としての符号化装置の一実施の形態の構成例を示すブロック図である。図４のインター予測部の構成例を示すブロック図である。 Sub pel a,b,cである予測画素の生成に用いられる参照画素の例を示す図である。 Sub pel d,h,lである予測画素の生成に用いられる参照画素の例を示す図である。 Sub pel e,oである予測画素の生成に用いられる参照画素の例を示す図である。 Sub pel e,oの参照画像上の位置から同一の距離の参照画素を示す図である。 Sub pel e,oである予測画素の生成に用いられる参照画素の他の例を示す図である。 Sub pel eである予測画素の生成に用いられる参照画素のさらに他の例を示す図である。 Sub pel oである予測画素の生成に用いられる参照画素のさらに他の例を示す図である。 Sub pel g,mである予測画素の生成に用いられる参照画素の例を示す図である。 Sub pel g,mの参照画像上の位置から同一の距離の参照画素を示す図である。 Sub pel g,mである予測画素の生成に用いられる参照画素の他の例を示す図である。 Sub pel gである予測画素の生成に用いられる参照画素のさらに他の例を示す図である。 Sub pel mである予測画素の生成に用いられる参照画素のさらに他の例を示す図である。 Sub pel jである予測画素の生成に用いられる参照画素の例を示す図である。 Sub pel jの参照画像上の位置から同一の距離の参照画素を示す図である。 Sub pel jである予測画素の生成に用いられる参照画素の他の例を示す図である。任意の分数位置の予測画素を生成するために必要な参照画素の例を示す図である。 Sub pel eである予測画素の生成に用いられるフィルタ係数の例を示す図である。 Sub pel oである予測画素の生成に用いられるフィルタ係数の例を示す図である。 Sub pel gである予測画素の生成に用いられるフィルタ係数の例を示す図である。 Sub pel mである予測画素の生成に用いられるフィルタ係数の例を示す図である。 Sub pel jである予測画素の生成に用いられるフィルタ係数の例を示す図である。図４の符号化装置による符号化処理を説明する第１のフローチャートである。図４の符号化装置による符号化処理を説明する第２のフローチャートである。インター予測処理の詳細を説明するフローチャートである。本発明を適用した画像処理装置としての復号装置の構成例を示すブロック図である。図３０の復号装置による復号処理を説明するフローチャートである。コンピュータの一実施の形態の構成例を示すブロック図である。テレビジョン受像機の主な構成例を示すブロック図である。携帯電話機の主な構成例を示すブロック図である。ハードディスクレコーダの主な構成例を示すブロック図である。カメラの主な構成例を示すブロック図である。

　＜一実施の形態＞
　［符号化装置の一実施の形態の構成例］
　図４は、本発明を適用した画像処理装置としての符号化装置の一実施の形態の構成例を示すブロック図である。

　図４の符号化装置１０は、A/D変換部１１、画面並べ替えバッファ１２、演算部１３、直交変換部１４、量子化部１５、可逆符号化部１６、蓄積バッファ１７、逆量子化部１８、逆直交変換部１９、加算部２０、デブロックフィルタ２１、フレームメモリ２２、イントラ予測部２３、インター予測部２４、動き予測部２５、選択部２６、およびレート制御部２７により構成される。図４の符号化装置１０は、入力された画像をH．264/AVC方式で圧縮符号化する。

　具体的には、符号化装置１０のA/D変換部１１は、入力信号として入力されたフレーム単位の画像をA/D変換し、画面並べ替えバッファ１２に出力して記憶させる。画面並べ替えバッファ１２は、記憶した表示の順番のフレーム単位の画像を、GOP（Group of Picture）構造に応じて、符号化のための順番に並べ替え、演算部１３、イントラ予測部２３、および動き予測部２５に出力する。

　演算部１３は、差分演算手段として機能し、選択部２６から供給される予測画像と、画面並べ替えバッファ１２から出力された符号化対象の画像の差分を演算する。具体的には、演算部１３は、画面並べ替えバッファ１２から出力された符号化対象の画像から、選択部２６から供給される予測画像を減算する。演算部１３は、減算の結果得られる画像を、残差情報として直交変換部１４に出力する。なお、選択部２６から予測画像が供給されない場合、演算部１３は、画面並べ替えバッファ１２から読み出された画像をそのまま残差情報として直交変換部１４に出力する。

　直交変換部１４は、演算部１３からの残差情報に対して離散コサイン変換、カルーネン・レーベ変換等の直交変換を施し、その結果得られる係数を量子化部１５に供給する。

　量子化部１５は、直交変換部１４から供給される係数を量子化する。量子化された係数は、可逆符号化部１６に入力される。

　可逆符号化部１６は、最適イントラ予測モードを示す情報（以下、イントラ予測モード情報という）をイントラ予測部２３から取得し、最適インター予測モードを示す情報（以下、インター予測モード情報という）、動きベクトルなどをインター予測部２４から取得する。

　可逆符号化部１６は、量子化部１５から供給される量子化された係数に対して、可変長符号化（例えば、CAVLC（Context-Adaptive Variable Length Coding）など）、算術符号化（例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）など）などの可逆符号化を行い、その結果得られる情報を圧縮画像とする。また、可逆符号化部１６は、イントラ予測モード情報、または、インター予測モード情報および動きベクトルなどを可逆符号化し、その結果得られる情報を圧縮画像に付加されるヘッダ情報とする。可逆符号化部１６は、可逆符号化の結果得られるヘッダ情報が付加された圧縮画像を画像圧縮情報として蓄積バッファ１７に供給し、蓄積させる。

蓄積バッファ１７は、可逆符号化部１６から供給される画像圧縮情報を、一時的に記憶し、例えば、後段の図示せぬ記録装置や伝送路などに出力する。

　また、量子化部１５より出力された、量子化された係数は、逆量子化部１８にも入力され、逆量子化された後、逆直交変換部１９に供給される。

　逆直交変換部１９は、逆量子化部１８から供給される係数に対して、逆離散コサイン変換、逆カルーネン・レーベ変換等の逆直交変換を施し、その結果得られる残差情報を加算部２０に供給する。　

　加算部２０は、加算演算手段として機能し、逆直交変換部１９から供給される復号対象の画像としての残差情報と、選択部２６から供給される予測画像を加算して、局部的に復号された画像を得る。なお、選択部２６から予測画像が供給されない場合、加算部２０は、逆直交変換部１９から供給される残差情報を局部的に復号された画像とする。加算部２０は、局部的に復号された画像をデブロックフィルタ２１に供給するとともに、参照画像としてイントラ予測部２３に供給する。

　デブロックフィルタ２１は、加算部２０から供給される局部的に復号された画像をフィルタリングすることにより、ブロック歪を除去する。デブロックフィルタ２１は、その結果得られる画像をフレームメモリ２２に供給し、蓄積させる。フレームメモリ２２に蓄積された画像は、参照画像としてインター予測部２４および動き予測部２５に出力される。

　イントラ予測部２３は、画面並べ替えバッファ１２から読み出された画像と、加算部２０から供給された参照画像とに基づいて、候補となる全てのイントラ予測モードのイントラ予測を行い、予測画像を生成する。

　また、イントラ予測部２３は、候補となる全てのイントラ予測モードに対してコスト関数値（詳細は後述する）を算出する。そして、イントラ予測部２３は、コスト関数値が最小となるイントラ予測モードを最適イントラ予測モードに決定する。イントラ予測部２３は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、選択部２６に供給する。イントラ予測部２３は、選択部２６から最適イントラ予測モードで生成された予測画像の選択が通知された場合、イントラ予測モード情報を可逆符号化部１６に供給する。

　なお、コスト関数値は、RD(Rate Distortion)コストともいい、例えば、H．264/AVC方式における参照ソフトウェアであるJM(Joint Model)で定められているような、High Complexity モードか、Low Complexity モードのいずれかの手法に基づいて算出される。

　具体的には、コスト関数値の算出手法としてHigh Complexity モードが採用される場合、候補となる全ての予測モードに対して、仮に可逆符号化までが行われ、次の式（１）で表わされるコスト関数値が各予測モードに対して算出される。

　Cost(Mode)=D＋λ・R　　　　　　　　　　　　　　　　　・・・（１）

　Dは、原画像と復号画像の差分（歪）、Rは、直交変換の係数まで含んだ発生符号量、λは、量子化パラメータQPの関数として与えられるラグランジュ乗数である。

　一方、コスト関数値の算出手法としてLow Complexity モードが採用される場合、候補となる全ての予測モードに対して、復号画像の生成、および、予測モードを示す情報などのヘッダビットの算出が行われ、次の式（２）で表わされるコスト関数が各予測モードに対して算出される。

　Cost(Mode)=D＋QPtoQuant(QP)・Header_Bit　　　　　　　・・・（２）

　Dは、原画像と復号画像の差分（歪）、Header_Bitは、予測モードに対するヘッダビット、QPtoQuantは、量子化パラメータQPの関数として与えられる関数である。

　Low Complexity モードにおいては、全ての予測モードに対して、復号画像を生成するだけでよく、可逆符号化を行う必要がないため、演算量が少なくて済む。なお、ここでは、コスト関数値の算出手法としてHigh Complexity モードが採用されるものとする。

　インター予測部２４は、動き予測部２５から供給されるインター予測モード情報と動きベクトルに基づいて、フレームメモリ２２から参照画像を読み出す。インター予測部２４は、動きベクトルとフレームメモリ２２から読み出された参照画像とに基づいて、インター予測処理を行う。具体的には、インター予測部２４は、動きベクトルに基づいて参照画像に対してインターポーレーションを行うことにより、分数精度の動き補償処理を行う。インター予測部２４は、その結果生成される予測画像と、動き予測部２５から供給されるコスト関数値とを選択部２６に供給する。また、インター予測部２４は、選択部２６から最適インター予測モードで生成された予測画像の選択が通知された場合、インター予測モード情報、対応する動きベクトルなどを可逆符号化部１６に出力する。

　動き予測部２５は、画面並べ替えバッファ１２から供給される画像と、フレームメモリ２２から供給される参照画像とに基づいて、候補となる全てのインター予測モードの動き予測処理を行い、分数精度の動きベクトルを生成する。具体的には、動き予測部２５は、インター予測モードごとに、参照画像に対してインター予測部２４と同様の手法でインターポーレーションを行う。そして、動き予測部２５は、インター予測モードごとに、インターポーレーション後の参照画像と、画面並べ替えバッファ１２から供給される画像とのマッチングを行い、分数精度の動きベクトルを生成する。本実施の形態では、インターポーレーションにより1/2画素位置および1/4画素位置のSub pelが生成され、動きベクトルの精度は、1/4画素精度であるものとする。

　このとき、動き予測部２５は、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。そして、動き予測部２５は、インター予測モード情報、並びに、対応する動きベクトルおよびコスト関数値をインター予測部２４に供給する。

　なお、インター予測モードとは、インター予測の対象とするブロックのサイズ、予測方向、および参照インデックスを表す情報である。インター予測の対象とするブロックのサイズとしては、4×4画素、8×8画素、16×16画素、32×32画素、64×64画素といった正方形のサイズや、4×8画素、8×4画素、8×16画素、16×8画素、16×32画素、32×16画素、32×64画素、64×32画素といった長方形のサイズなどがある。予測方向には、インター予測の対象とする画像よりも表示時刻が早い参照画像を用いた前方向の予測（L0予測）と、インター予測の対象とする画像よりも表示時刻が遅い参照画像を用いた後方向の予測（L1予測）がある。また、参照インデックスとは、参照画像を特定するための番号であり、例えば、インター予測の対象とする画像に近い画像の参照インデックスほど番号が小さい。

　選択部２６は、イントラ予測部２３およびインター予測部２４から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちのいずれかを、最適予測モードに決定する。そして、選択部２６は、最適予測モードの予測画像を、演算部１３および加算部２０に供給する。また、選択部２６は、最適予測モードの予測画像の選択をイントラ予測部２３またはインター予測部２４に通知する。

　レート制御部２７は、蓄積バッファ１７に蓄積された画像圧縮情報に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１５の量子化動作のレートを制御する。
　［インター予測部の構成例］
　図５は、図４のインター予測部２４の構成例を示すブロック図である。

　なお、図５では、説明の便宜上、インター予測部２４のインター予測処理を行うブロックのみが図示されており、コスト関数値、インター予測モード情報、動きベクトルなどを出力するブロックは省略されている。

　図５において、インター予測部２４は、参照画像読出部４１、FIRフィルタ４２、およびフィルタ係数メモリ４３により構成される。

　インター予測部２４の参照画像読出部４１は、図４の動き予測部２５から供給されるインター予測モード情報のうちの参照インデックスおよび予測方向に基づいて、フレームメモリ２２に記憶されている画像のうちの参照画像を特定する。参照画像読出部４１は、インター予測モード情報のうちのブロックのサイズと動きベクトルの整数値に基づいて、予測画像の生成に用いられる参照画像の画素（以下、参照画素という）をフレームメモリ２２から読み出し、一時的に保持する。

　参照画像読出部４１は、画素読出手段として機能する。参照画像読出部４１は、予測画像の画素（以下、予測画素という）ごとに、一時的に保持されている参照画素のうち、その予測画素の生成に用いられる参照画素を読み出す。参照画像読出部４１は、読みされた参照画素をFIRフィルタ４２に供給する。

　FIRフィルタ４２は、演算手段として機能し、参照画像読出部４１から供給される参照画素と、フィルタ係数メモリ４３から供給されるフィルタ係数を用いて演算を行う。具体的には、FIRフィルタ４２は、各参照画素と、その参照画素に対するフィルタ係数を乗算し、その結果得られる乗算値とオフセット値を加算する演算を行う。FIRフィルタ４２は、予測画素の参照画像上の位置に応じて、演算の結果得られる1個の画素を予測画素として選択部２６（図４）に供給するか、複数回の演算の結果得られる複数の画素に対して所定の演算を行い、その結果得られる1個の画素を予測画素として選択部２６に供給する。

　フィルタ係数メモリ４３は、動きベクトルの分数値に対応付けて各参照画素に対するフィルタ係数を記憶している。フィルタ係数メモリ４３は、図４の動き予測部２５から供給される動きベクトルの分数値に基づいて、その分数値に対応付けて記憶されている各参照画素に対するフィルタ係数をFIRフィルタ４２に供給する。

　［参照画素の説明］
　図６乃至図２０は、予測画素の生成に用いられる参照画素の例を説明する図である。

　なお、図６乃至図２０において、英字が付された正方形はSub Pelを表し、英字が付されていない正方形は参照画素を表す。また、水玉が付されている正方形は予測画素の生成に用いられる参照画素を表している。さらに、実線の円は、予測画素の生成に用いられる参照画素を囲んだものであり、点線の円は、その円で囲まれた英字が付されていない正方形が表す参照画素が、従来の図３の方法で予測画素の生成に用いられる参照画素であることを表している。

　図６は、垂直方向の位置が整数位置であり、水平方向の位置が分数位置である予測画素の生成に用いられる参照画素の例を示す図である。

　図６に示すように、予測画素が、垂直方向の位置が整数位置であり、水平方向の位置が分数位置であるSub pel a,b,cである場合、実線の内側の円で囲まれた大まかな水玉が付された正方形が表す8個の参照画素が、予測画素の生成に用いられる。具体的には、Sub pel a,b,cの左右に2個ずつ隣接する4個の参照画素と、その参照画素を除く、Sub pel a,b,c を挟む垂直方向の2ラインのSub pel a,b,cに近い順の4個の参照画素とが予測画素の生成に用いられる。

　なお、Sub pel a,b,cの生成には、図６の細かい水玉が付された正方形が表す4個の参照画素をさらに含む、実線の外側の円で囲まれた水玉が付された正方形が表す、Sub pel a,b,cを中心とする4×3参照画素が用いられるようにしてもよい。

　以上のように、図４の符号化装置１０では、予測画素が、垂直方向の位置が整数位置であり、水平方向の位置が分数位置であるSub pel a,b,cである場合、水平方向に並ぶ参照画素だけでなく、垂直方向に並ぶ参照画素も用いて予測画素が生成される。従って、予測画素の水平方向および垂直方向の特性を良好にすることができる。

　これに対して、従来の図３の方法における参照画素は、図６の点線で囲まれた正方形が表す、Sub pel a,b,cの左右に3個ずつ位置する6個の参照画素であり、従来の図３の方法では、垂直方向に並ぶ参照画素が用いられない。従って、予測画素の垂直方向の特性は良くない。

　また、FIRフィルタ４２がSIMD（Single Instruction Multiple Data）演算を行う場合、図６に示したようにSub pel a,b,cの生成に用いられる参照画素の数が2のべき乗である8個であると、演算を効率的に行うことができる。

　さらに、図６の実線で囲まれた水玉が付された正方形が表す参照画素の位置は、図６の点線で囲まれた正方形が表す従来の図３の方法における参照画素に比べて、Sub pel a,b,cに近い。

　図７は、水平方向の位置が整数位置であり、垂直方向の位置が分数位置である予測画素の生成に用いられる参照画素の例を示す図である。

　図７に示すように、予測画素が、水平方向の位置が整数位置であり、垂直方向の位置が分数位置であるSub pel d,h,lである場合、実線の内側の円で囲まれた大まかな水玉が付された正方形が表す8個の参照画素が予測画素の生成に用いられる。具体的には、Sub pel d,h,lの上下をに2個ずつ位置する4個の参照画素と、その参照画素を除く、Sub pel d,h,lを挟む水平方向の2ラインのSub pel d,h,lに近い順の4個の参照画素とが予測画素の生成に用いられる。

　なお、Sub pel d,h,lの生成には、図７の細かい水玉が付された正方形が表す4個の参照画素をさらに含む、実線の外側の円で囲まれた水玉が付された正方形が表す、Sub pel d,h,lを中心とする3×4参照画素が用いられるようにしてもよい。

　以上のように、符号化装置１０では、予測画素が、水平方向の位置が整数位置であり、垂直方向の位置が分数位置であるSub pel d,h,lである場合、垂直方向に並ぶ参照画素だけでなく、水平方向に並ぶ参照画素も用いて予測画素が生成される。従って、予測画素の垂直方向および水平方向の特性を良好にすることができる。

　これに対して、従来の図３の方法における参照画素は、図７の点線で囲まれた正方形が表す、Sub pel d,h,lの上下に3個ずつ位置する6個の参照画素であり、従来の図３の方法では、水平方向に並ぶ参照画素が用いられない。従って、予測画素の水平方向の特性は良くない。

　また、FIRフィルタ４２がSIMD演算を行う場合、図７に示したようにSub pel d,h,lの生成に用いられる参照画素の数が2のべき乗である8個であると、演算を効率的に行うことができる。

　さらに、図７の実線で囲まれた水玉が付された正方形が表す参照画素の位置は、図７の点線で囲まれた正方形が表す従来の図３の方法における参照画素に比べて、Sub pel d,h,lに近い。

　図８は、水平方向および垂直方向の位置が1/4画素位置である左上および右下の予測画素の生成に用いられる参照画素の例を示す図である。

　図８に示すように、予測画素が、水平方向および垂直方向の位置が1/4画素位置である左上および右下のSub pel e,oである場合、実線の円で囲まれた大まかな水玉が付された正方形が表す6個の参照画素が予測画素の生成に用いられる。具体的には、Sub pel e,oが並ぶ斜め方向に並ぶSub pel e,oに近い順の4個の参照画素と、その斜め方向と直交する方向に並ぶSub pel e,oに近い順の2個の参照画素とが予測画素の生成に用いられる。

　このように、符号化装置１０では、予測画素が、水平方向および垂直方向の位置が1/4画素位置である左上および右下のSub pel e,oである場合、Sub pel e,o が並ぶ斜め方向に並ぶ参照画素だけでなく、その方向に直交する方向に並ぶ参照画素も用いて予測画素が生成される。従って、予測画素の斜め方向の特性を良好にすることができる。

　これに対して、従来の図３の方法における参照画素は、図８の点線で囲まれた正方形が表す、Sub pel e,oを中心とするSub pel e,oが並ぶ斜め方向に並ぶ6個の参照画素であり、従来の図３の方法では、その斜め方向に直交する方向に並ぶ参照画素が用いられない。従って、Sub pel e,oが並ぶ斜め方向に直交する方向の予測画素の特性が、従来のSeparable 2D 構造のインターポーレーションフィルタが用いられる場合に比べて劣化する。

　また、図９に示すように、Sub pel e,oが並ぶ斜め方向に直交する方向に並ぶSub pel e,oに近い順の2個の参照画素は、Sub pel e,oの参照画像上の位置からの距離が等しい。従って、この2個の参照画素に対するフィルタ係数は対照性により同一となる。よって、図５のFIRフィルタ４２は、この2個の参照画素について、参照画素を加算した後にフィルタ係数を乗算することができる。その結果、乗算回数を削減することができる。

　図１０は、水平方向および垂直方向の位置が1/4画素位置である左上および右下の予測画素の生成に用いられる参照画素の他の例を示す図である。

　図１０の例では、予測画素が、水平方向および垂直方向の位置が1/4画素位置である左上および右下のSub pel e,oである場合、図８の例の6個の参照画素と、図１０の細かい水玉が付された正方形が表す4個の参照画素からなる、実線の外側の円で囲まれた水玉が付された正方形が表す10個の参照画素が、予測画素の生成に用いられる。具体的には、Sub pel e,oが並ぶ斜め方向に並ぶSub pel e,oに近い順の4個の参照画素と、その斜め方向と直交する3方向に2個ずつ並ぶSub pel e,oに近い順の合計6個の参照画素とが、予測画素の生成に用いられる。

　図１１は、予測画素がSub pel eである場合の予測画素の生成に用いられる参照画素のさらに他の例を示す図である。

　図１１の例では、予測画素がSub pel eである場合、図８の例の6個の参照画素と、図１１の細かい水玉が付された正方形が表す2個の参照画素からなる、実線の外側の円で囲まれた水玉が付された正方形が表す8個の参照画素が、予測画素の生成に用いられる。具体的には、Sub pel e,oが並ぶ斜め方向に並ぶSub pel eに近い順の4個の参照画素と、その斜め方向と直交する2方向に2個ずつ並ぶSub pel eに近い順の合計4個の参照画素とが、予測画素の生成に用いられる。

　図１２は、予測画素がSub pel oである場合の予測画素の生成に用いられる参照画素のさらに他の例を示す図である。

　図１２の例では、予測画素がSub pel oである場合、図８の例の6個の参照画素と、図１２の細かい水玉が付された正方形が表す2個の参照画素からなる、実線の外側の円で囲まれた水玉が付された正方形が表す8個の参照画素が、予測画素の生成に用いられる。具体的には、Sub pel e,oが並ぶ斜め方向に並ぶSub pel oに近い順の4個の参照画素と、その斜め方向と直交する2方向に2個ずつ並ぶSub pel oに近い順の合計4個の参照画素とが、予測画素の生成に用いられる。

　FIRフィルタ４２がSIMD演算を行う場合、図１１および図１２に示したようにSub pel e,oの生成に用いられる参照画素の数が2のべき乗である8個であると、演算を効率的に行うことができる。

　さらに、図８や図１０乃至図１２の実線で囲まれた水玉が付された正方形が表す参照画素の位置は、図８や図１０乃至図１２の点線で囲まれた正方形が表す従来の図３の方法における参照画素に比べて、Sub pel e,oに近い。

　図１３は、水平方向および垂直方向の位置が1/4画素位置である右上および左下の予測画素の生成に用いられる参照画素の例を示す図である。

　図１３に示すように、予測画素が、水平方向および垂直方向の位置が1/4画素位置である右上および左下のSub pel g,mである場合、実線の円で囲まれた大まかな水玉が付された正方形が表す6個の参照画素が予測画素の生成に用いられる。具体的には、Sub pel g,m が並ぶ斜め方向に並ぶSub pel g,mに近い順の4個の参照画素と、その斜め方向と直交する方向に並ぶSub pel g,mに近い順の2個の参照画素とが予測画素の生成に用いられる。

　このように、符号化装置１０では、予測画素が、水平方向および垂直方向の位置が1/4画素位置である右上および左下のSub pel g,mである場合、Sub pel g,m が並ぶ斜め方向に並ぶ参照画素だけでなく、その方向に直交する方向に並ぶ参照画素も用いて予測画素が生成される。従って、予測画素の斜め方向の特性を良好にすることができる。

　これに対して、従来の図３の方法における参照画素は、図１３の点線で囲まれた正方形が表す、Sub pel g,mを中心とするSub pel g,mが並ぶ斜め方向に並ぶ6個の参照画素であり、従来の図３の方法では、その斜め方向に直交する方向に並ぶ参照画素が用いられない。従って、Sub pel g,mが並ぶ斜め方向に直交する方向の予測画素の特性が、従来のSeparable 2D 構造のインターポーレーションフィルタが用いられる場合に比べて劣化する。

　また、図１４に示すように、Sub pel g,mが並ぶ斜め方向に直交する方向に並ぶSub pel g,mに近い順の2個の参照画素は、Sub pel g,mの参照画像上の位置からの距離が等しい。従って、この2個の参照画素に対するフィルタ係数は対照性により同一となる。よって、FIRフィルタ４２は、この2個の参照画素について、参照画素を加算した後にフィルタ係数を乗算することができる。その結果、乗算回数を削減することができる。

　図１５は、水平方向および垂直方向の位置が1/4画素位置である右上および左下の予測画素の生成に用いられる参照画素の他の例を示す図である。

　図１５の例では、予測画素が、水平方向および垂直方向の位置が1/4画素位置である右上および左下のSub pel g,mである場合、図１３の例の6個の参照画素と、図１５の細かい水玉が付された正方形が表す4個の参照画素からなる、実線の外側の円で囲まれた水玉が付された正方形が表す10個の参照画素が、予測画素の生成に用いられる。具体的には、Sub pel g,mが並ぶ斜め方向に並ぶSub pel g,mに近い順の4個の参照画素と、その斜め方向と直交する3方向に2個ずつ並ぶSub pel g,mに近い順の合計6個の参照画素とが、予測画素の生成に用いられる。

　図１６は、予測画素がSub pel gである場合の予測画素の生成に用いられる参照画素のさらに他の例を示す図である。

　図１６の例では、予測画素がSub pel gである場合、図１３の例の6個の参照画素と、図１６の細かい水玉が付された正方形が表す2個の参照画素からなる、実線の外側の円で囲まれた水玉が付された正方形が表す8個の参照画素が、予測画素の生成に用いられる。具体的には、Sub pel g,mが並ぶ斜め方向に並ぶSub pel gに近い順の4個の参照画素と、その斜め方向と直交する2方向に2個ずつ並ぶSub pel gに近い順の合計4個の参照画素とが、予測画素の生成に用いられる。

　図１７は、予測画素がSub pel mである場合の予測画素の生成に用いられる参照画素のさらに他の例を示す図である。

　図１７の例では、予測画素がSub pel mである場合、図１３の例の6個の参照画素と、図１７の細かい水玉が付された正方形が表す2個の参照画素からなる、実線の外側の円で囲まれた水玉が付された正方形が表す8個の参照画素が、予測画素の生成に用いられる。具体的には、Sub pel g,mが並ぶ斜め方向に並ぶSub pel mに近い順の4個の参照画素と、その斜め方向と直交する2方向に2個ずつ並ぶSub pel mに近い順の合計4個の参照画素とが、予測画素の生成に用いられる。

　FIRフィルタ４２がSIMD演算を行う場合、図１６および図１７に示したようにSub pel g,mの生成に用いられる参照画素の数が2のべき乗である8個であると、演算を効率的に行うことができる。

　さらに、図１３や図１５乃至図１７の実線で囲まれた水玉が付された正方形が表す参照画素の位置は、図１３や図１５乃至図１７の点線で囲まれた正方形が表す従来の図３の方法における参照画素に比べて、Sub pel g,mに近い。

　図１８は、水平方向および垂直方向の位置が1/2画素位置である予測画素の生成に用いられる参照画素の例を示す図である。

　図１８に示すように、予測画素が、水平方向および垂直方向の位置が1/2画素位置であるSub pel jである場合、実線の円で囲まれた大まかな水玉が付された正方形が表す12個の参照画素が予測画素の生成に用いられる。具体的には、Sub pel jを挟む水平方向の2ラインのSub pel j に近い順の8個の参照画素と、その参照画素を除く、Sub pel jを挟む垂直方向に並ぶ2ラインのSub pel j に近い順の4個の参照画素とが予測画素の生成に用いられる。

　このように、符号化装置１０では、予測画素が、水平方向および垂直方向の位置が1/2画素位置であるSub pel jである場合、Sub pel jの位置で直交する2つの斜め方向に位置する参照画素だけでなく、Sub pel jを挟んで水平方向および垂直方向に並ぶ参照画素も用いて予測画素が生成される。従って、予測画素の特性を良好にすることができる。

　これに対して、従来の図３の方法における参照画素は、図１８の点線で囲まれた正方形が表す、Sub pel jを中心として直交する2つの斜め方向に6個ずつ並ぶ合計12個の参照画素であり、従来の図３の方法では、水平方向および垂直方向に並ぶ参照画素が用いられない。従って、水平方向および垂直方向の予測画素の特性が、従来のSeparable 2D 構造のインターポーレーションフィルタが用いられる場合に比べて劣化する。

　また、図１９に示すように、Sub pel jから最も近い2×2参照画素は、Sub pel jの参照画像上の位置からの距離が等しい。また、その2×2参照画素以外のSub pel jから2番目に近い8個の参照画素も、Sub pel jの参照画像上の位置からの距離が等しい。従って、2×2参照画素どうし、および、その参照画素以外の8個の参照画素どうしのフィルタ係数は対照性により同一となる。よって、FIRフィルタ４２は、この2×2参照画素、および、その参照画素以外の8個の参照画素について、それぞれ、参照画素を加算した後にフィルタ係数を乗算することができる。その結果、乗算回数を削減することができる。

　図２０は、水平方向および垂直方向の位置が1/2画素位置である予測画素の生成に用いられる参照画素の他の例を示す図である。

　図２０の例では、予測画素が、水平方向および垂直方向の位置が1/2画素位置であるSub pel jである場合、図１８の例の12個の参照画素と、図２０の細かい水玉が付された正方形が表す4個の参照画素からなる、実線の外側の円で囲まれた水玉が付された正方形が表す16個の参照画素が、予測画素の生成に用いられる。具体的には、Sub pel jを中心とする4×4参照画素が、予測画素の生成に用いられる。

　FIRフィルタ４２がSIMD演算を行う場合、図２０に示したようにSub pel jの生成に用いられる参照画素の数が2のべき乗である16個であると、演算を効率的に行うことができる。

　また、図１８や図２０の実線で囲まれた水玉が付された正方形が表す参照画素の位置は、図１８や図２０の点線で囲まれた正方形が表す従来の図３の方法における参照画素に比べて、Sub pel jに近い。

　図２１は、インター予測ブロックのブロックサイズが4×４画素である場合に、任意の分数位置の予測画素を生成するために必要な参照画素の例を示す図である。

　なお、図２１において、正方形は参照画素を表している。また、水玉が付されている正方形は、予測画素の生成に用いられる参照画素のうちのインター予測のブロックのサイズの範囲内の参照画素を表し、斜線が付されている正方形は、インター予測のブロックのサイズの範囲を超えた範囲の参照画素を表している。

　図２１の例では、Sub pel a乃至e,g,h,j,l,m,oが、図６乃至図２０で説明した参照画素を用いて生成され、Sub pel f,i,k,nは、隣接するSub pelを用いて生成される。

　この場合、図２１に示すように、任意の分数位置の予測画素を生成するために必要な参照画素の範囲は、インター予測のブロックのサイズである4×4画素の範囲と、その範囲の左隣および真上の1画素分と右隣および真下の2画素分の範囲の7×7画素となる。

　このように、図６乃至図２０で説明した参照画素は、従来の図３の方法における参照画素に比べて、より予測画素に近い位置にあるため、従来の図３の方法に比べて、任意の分数位置の予測画素を生成するために必要な参照画素の数は少なくて済む。その結果、フレームメモリ２２のメモリ帯域の使用量を削減することができる。

　これに対して、従来の図３の方法の場合、任意の分数位置の予測画素を生成するために必要な参照画素の範囲は、図２に示した場合と同様の9×9画素となる。そして、実際には、フレームメモリへのアクセスは１画素単位で行うことは困難であるため、メモリ帯域の使用量は9×9画素より大きい。

　［フィルタ係数の例］
　図２２乃至図２６は、図５のFIRフィルタ４２に記憶されるフィルタ係数の例を示す図である。

　図２２に示すように、Sub pel eである予測画素の生成に用いられるフィルタ係数は、最も近い参照画素（以下、直近参照画素という）に対するフィルタ係数、直近参照画素の右隣および真下の参照画素に対するフィルタ係数、直近参照画素の右下の参照画素に対するフィルタ係数、その参照画素の右下の参照画素に対するフィルタ係数、直近参照画素の左上の参照画素に対するフィルタ係数の順に大きい。図２２の例では、直近参照画素に対するフィルタ係数が122であり、直近参照画素の右隣および真下の参照画素に対するフィルタ係数が64である。また、直近参照画素の右下の参照画素に対するフィルタ係数が17であり、その参照画素の右下の参照画素に対するフィルタ係数が-4であり、直近参照画素の左上の参照画素に対するフィルタ係数が-7である。

　図２３に示すように、Sub pel oである予測画素の生成に用いられるフィルタ係数は、直近参照画素に対するフィルタ係数、直近参照画素の左隣および真上の参照画素に対するフィルタ係数、直近参照画素の左上の参照画素に対するフィルタ係数、その参照画素の左上の参照画素に対するフィルタ係数、直近参照画素の右下の参照画素に対するフィルタ係数の順に大きい。図２３の例では、直近参照画素に対するフィルタ係数が122であり、直近参照画素の左隣および真上の参照画素に対するフィルタ係数が64である。また、直近参照画素の左上の参照画素に対するフィルタ係数が17であり、その参照画素の左上の参照画素に対するフィルタ係数が-4であり、直近参照画素の右下の参照画素に対するフィルタ係数が-7である。

　図２４に示すように、Sub pel gである予測画素の生成に用いられるフィルタ係数は、直近参照画素に対するフィルタ係数、直近参照画素の左隣および真下の参照画素に対するフィルタ係数、直近参照画素の左下の参照画素に対するフィルタ係数、その参照画素の左下の参照画素に対するフィルタ係数、直近参照画素の右上の参照画素に対するフィルタ係数の順に大きい。図２４の例では、直近参照画素に対するフィルタ係数が122であり、直近参照画素の左隣および真下の参照画素に対するフィルタ係数が64である。また、直近参照画素の左下の参照画素に対するフィルタ係数が17であり、その参照画素の左下の参照画素に対するフィルタ係数が-4であり、直近参照画素の右上の参照画素に対するフィルタ係数が-7である。

　図２５に示すように、Sub pel mである予測画素の生成に用いられるフィルタ係数は、直近参照画素に対するフィルタ係数、直近参照画素の右隣および真上の参照画素に対するフィルタ係数、直近参照画素の右上の参照画素に対するフィルタ係数、その参照画素の右上の参照画素に対するフィルタ係数、直近参照画素の左下の参照画素に対するフィルタ係数の順に大きい。図２５の例では、直近参照画素に対するフィルタ係数が122であり、直近参照画素の右隣および真上の参照画素に対するフィルタ係数が64である。また、直近参照画素の右上の参照画素に対するフィルタ係数が17であり、その参照画素の右上の参照画素に対するフィルタ係数が-4であり、直近参照画素の左下の参照画素に対するフィルタ係数が-7である。

　図２６に示すように、Sub pel jである予測画素の生成に用いられるフィルタ係数は、Sub pel jに近い順に大きい。具体的には、直近参照画素に対するフィルタ係数、その参照画素以外の参照画素に対するフィルタ係数の順に大きい。図２２の例では、直近参照画素に対するフィルタ係数が48であり、その参照画素以外の参照画素に対するフィルタ係数が8である。

　なお、図２２乃至図２６に示したフィルタ係数は、FIRフィルタ４２による演算を簡単にするために実際のフィルタ係数を256倍にしたものである。従って、図２２乃至図２６に示したフィルタ係数がフィルタ係数メモリ４３に記憶されている場合には、FIRフィルタ４２は、以下の式（３）により、各参照画素に対するフィルタ係数と各参照画素を乗算し、その結果得られる乗算値とオフセット値を加算した後、256で除算する。

　なお、式（３）において、Yは、予測画素を表し、h_ｉはi番目の参照画素に対するフィルタ係数を表し、P_ｉはi番目の参照画素を表している。また、128はオフセット値である。

　［符号化装置の処理の説明］
　図２７および図２８は、図４の符号化装置１０による符号化処理を説明するフローチャートである。この符号化処理は、例えば、入力信号としてフレーム単位の画像が符号化装置１０に入力されるたびに行われる。

　図２７のステップＳ１１において、符号化装置１０のA/D変換部１１は、入力信号として入力されたフレーム単位の画像をA/D変換し、画面並べ替えバッファ１２に出力して記憶させる。

　ステップＳ１２において、画面並べ替えバッファ１２は、記憶した表示の順番のフレームの画像を、GOP構造に応じて、符号化のための順番に並べ替える。画面並べ替えバッファ１２は、並べ替え後のフレーム単位の画像を、演算部１３、イントラ予測部２３、および動き予測部２５に供給する。

　なお、以下のステップＳ１３乃至Ｓ３０の処理は、例えばマクロブロック単位で行われる。但し、先頭フレームの先頭のマクロブロックの処理時には、参照画像が存在しないため、ステップＳ１３乃至Ｓ２０およびＳ２８の処理は行われず、先頭フレームの画像が残差情報および局部的に復号された画像とされる。

　ステップＳ１３において、イントラ予測部２３は、画面並べ替えバッファ１２から供給される画像と、加算部２０から供給される参照画像とに基づいて、候補となる全てのイントラ予測モードのイントラ予測を行い、予測画像を生成する。また、イントラ予測部２３は、候補となる全てのイントラ予測モードに対してコスト関数値を算出する。そして、イントラ予測部２３は、コスト関数値が最小となるイントラ予測モードを最適イントラ予測モードに決定する。イントラ予測部２３は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、選択部２６に供給する。

　ステップＳ１４において、動き予測部２５は、画面並べ替えバッファ１２から供給される画像に対して、フレームメモリ２２から供給される参照画像を用いて、候補となる全てのインター予測モードの動き予測処理を行い、分数精度の動きベクトルを生成する。また、動き予測部２５は、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。そして、動き予測部２５は、インター予測モード情報、並びに、対応する動きベクトルおよびコスト関数値をインター予測部２４に供給する。

　ステップＳ１５において、インター予測部２４は、動き予測部２５から供給される動きベクトルとインター予測モード情報に基づいてインター予測処理を行う。このインター予測処理の詳細は、後述する図２９を参照して説明する。インター予測部２４は、インター予測処理の結果生成される予測画像と、動き予測部２５から供給されるコスト関数値とを選択部２６に供給する。

　ステップＳ１６において、選択部２６は、イントラ予測部２３およびインター予測部２４から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちのコスト関数値が最小となる方を、最適予測モードに決定する。そして、選択部２６は、最適予測モードの予測画像を、演算部１３および加算部２０に供給する。

　ステップＳ１７において、選択部２６は、最適予測モードが最適インター予測モードであるかどうかを判定する。ステップＳ１７で最適予測モードが最適インター予測モードであると判定された場合、選択部２６は、最適インター予測モードで生成された予測画像の選択をインター予測部２４に通知する。これにより、インター予測部２４は、インター予測モード情報、対応する動きベクトルなどを可逆符号化部１６に出力する。

　そして、ステップＳ１８において、可逆符号化部１６は、インター予測部２４から供給されるインター予測モード情報、動きベクトルなどを可逆符号化し、その結果得られる情報を圧縮画像に付加されるヘッダ情報とする。そして、処理はステップＳ２０に進む。

　一方、ステップＳ１７で最適予測モードが最適インター予測モードではないと判定された場合、即ち最適予測モードが最適イントラ予測モードである場合、選択部２６は、最適イントラ予測モードで生成された予測画像の選択をイントラ予測部２３に通知する。これにより、イントラ予測部２３は、イントラ予測モード情報を可逆符号化部１６に供給する。

　そして、ステップＳ１９において、可逆符号化部１６は、イントラ予測部２３から供給されるイントラ予測モード情報などを可逆符号化し、その結果得られる情報を圧縮画像に付加されるヘッダ情報とする。そして、処理はステップＳ２０に進む。

　ステップＳ２０において、演算部１３は、画面並べ替えバッファ１２から供給される画像から、選択部２６から供給される予測画像を減算する。演算部１３は、減算の結果得られる画像を、残差情報として直交変換部１４に出力する。

　ステップＳ２１において、直交変換部１４は、演算部１３からの残差情報に対して直交変換を施し、その結果得られる係数を量子化部１５に供給する。

　ステップＳ２２において、量子化部１５は、直交変換部１４から供給される係数を量子化する。量子化された係数は、可逆符号化部１６と逆量子化部１８に入力される。

　ステップＳ２３において、可逆符号化部１６は、量子化部１５から供給される量子化された係数を可逆符号化し、その結果得られる情報を圧縮画像とする。そして、可逆符号化部１６は、ステップＳ１８またはＳ１９の処理で生成されたヘッダ情報を圧縮画像に付加し、画像圧縮情報を生成する。

　図２８のステップＳ２４において、可逆符号化部１６は、画像圧縮情報を蓄積バッファ１７に供給し、蓄積させる。

　ステップＳ２５において、蓄積バッファ１７は、蓄積されている画像圧縮情報を、例えば、後段の図示せぬ記録装置や伝送路などに出力する。

　ステップＳ２６において、逆量子化部１８は、量子化部１５から供給される量子化された係数を逆量子化する。

　ステップＳ２７において、逆直交変換部１９は、逆量子化部１８から供給される係数に対して逆直交変換を施し、その結果得られる残差情報を加算部２０に供給する。

　ステップＳ２８において、加算部２０は、逆直交変換部１９から供給される残差情報と、選択部２６から供給される予測画像を加算し、局部的に復号された画像を得る。加算部２０は、得られた画像をデブロックフィルタ２１に供給するとともに、参照画像としてイントラ予測部２３に供給する。

　ステップＳ２９において、デブロックフィルタ２１は、加算部２０から供給される局部的に復号された画像に対してフィルタリングを行うことにより、ブロック歪を除去する。

　ステップＳ３０において、デブロックフィルタ２１は、フィルタリング後の画像をフレームメモリ２２に供給し、蓄積させる。フレームメモリ２２に蓄積された画像は、参照画像としてインター予測部２４および動き予測部２５に出力される。そして、処理は終了する。

　図２９は、図２７のステップＳ１５のインター予測処理の詳細を説明するフローチャートである。

　図２９のステップＳ５０において、インター予測部２４の参照画像読出部４１（図５）は、図４の動き予測部２５から供給されるインター予測モード情報のうちの予測方向と参照インデックスに基づいて、フレームメモリ２２に記憶されている画像のうちの参照画像を特定する。

　ステップＳ５１において、参照画像読出部４１は、インター予測モード情報のうちのインター予測のブロックのサイズに基づいて、予測画像のサイズを決定する。

　ステップＳ５２において、参照画像読出部４１は、インター予測モード情報のうちの動きベクトルの整数値および予測画像のサイズに基づいて、その予測画像の生成に用いられる参照画素をフレームメモリ２２から読み出し、一時的に保持する。

　ステップＳ５３において、参照画像読出部４１は、予測画像を構成する予測画素のうち、まだステップＳ５３の処理で生成対象の予測画素に決定されていない予測画素を生成対象の予測画素に決定する。

　ステップＳ５４において、参照画像読出部４１は、生成対象の予測画素の参照画像上の位置に基づいて、ステップＳ５２で読み出された参照画素のうちの、予測画素の生成に用いられる参照画素をFIRフィルタ４２に供給する。

　ステップＳ５５において、フィルタ係数メモリ４３は、図４の動き予測部２５から供給される動きベクトルの分数値に基づいて、その分数値に対応付けて記憶されているフィルタ係数を読み出し、FIRフィルタ４２に供給する。

　ステップＳ５６において、FIRフィルタ４２は、参照画像読出部４１から供給される参照画素とフィルタ係数を用いて演算を行う。

　ステップＳ５７において、FIRフィルタ４２は、生成対象の予測画素がSub pel f,i,k,nであるかどうかを判定する。ステップＳ５７で生成対象の予測画素がSub pel f,i,k,nであると判定された場合、処理はステップＳ５８に進む。

　ステップＳ５８において、FIRフィルタ４２は、生成対象の予測画素が生成可能であるかどうか、即ち生成対象の予測画素の生成に用いられる全てのSub pelが生成されたかどうかを判定する。

　ステップＳ５８で生成対象の予測画素が生成可能ではないと判定された場合、処理はステップＳ５４に戻り、生成対象の予測画素が生成可能になるまで、ステップＳ５４乃至Ｓ５８の処理が繰り返される。

　一方、ステップＳ５８で生成対象の予測画素が生成可能であると判定された場合、FIRフィルタ４２は、ステップＳ５６の演算の結果得られた画素を用いて所定の演算を行うことにより予測画素を生成し、処理をステップＳ５９に進める。

　また、ステップＳ５７で生成対象の予測画素がSub pel f,i,k,nではないと判定された場合、処理はステップＳ５９に進む。

　ステップＳ５９において、FIRフィルタ４２は、ステップＳ５８の処理で生成された予測画素を選択部２６に出力するか、または、ステップＳ５６の演算の結果得られる1個の画素を予測画素として出力する。

　ステップＳ６０において、参照画像読出部４１は、全ての予測画素が生成されたか、即ちステップＳ５３で予測画像を構成する全ての予測画素を生成対象の予測画素に決定したかどうかを判定する。ステップＳ６０でまだ全ての予測画素が生成されていないと判定された場合、処理はステップＳ５３に戻り、全ての予測画素が生成されるまで、ステップＳ５３乃至Ｓ５９の処理が繰り返される。

　一方、ステップＳ６０で全ての予測画素が生成されたと判定された場合、処理は図２７のステップＳ１５に戻り、ステップＳ１６に進む。

　以上のように、符号化装置１０は、インター予測時において、予測画素の参照画像上の水平方向および垂直方向の位置が1/2画素位置ではない分数位置である場合、直交する2方向に並ぶ参照画素を用いて予測画素を生成する。例えば、符号化装置１０は、直交する2つの斜め方向に並ぶ参照画素を用いてSub pel e,o,g,mである予測画素を生成する。

　これにより、従来のseparable 2D構造のインターポーレーションフィルタが用いられる場合に比べて処理量および遅延量が軽減され、さらに、従来の図３の方法に比べて、直交する2つの斜め方向のうちの一方の方向に関する予測画素の特性が向上する。即ち、符号化装置１０は、インター予測の精度の劣化を抑制しつつ、インター予測の処理量および遅延量を軽減することができる。

　［復号装置の構成例］
　図３０は、図４の符号化装置１０から出力される画像圧縮情報を復号する、本発明を適用した画像処理装置としての復号装置の構成例を示すブロック図である。

　図３０の復号装置１００は、蓄積バッファ１０１、可逆復号化部１０２、逆量子化部１０３、逆直交変換部１０４、加算部１０５、デブロックフィルタ１０６、画面並べ替えバッファ１０７、D/A変換部１０８、フレームメモリ１０９、イントラ予測部１１０、インター予測部１１１、およびスイッチ１１２により構成される。

　復号装置１００の蓄積バッファ１０１は、図４の符号化装置１０から画像圧縮情報を受け取り、蓄積する。蓄積バッファ１０１は、蓄積されている画像圧縮情報を可逆復号化部１０２に供給する。

　可逆復号化部１０２は、蓄積バッファ１０１からの画像圧縮情報に対して、可変長復号や、算術復号等の可逆復号を施すことで、量子化された係数とヘッダを得る。可逆復号化部１０２は、量子化された係数を逆量子化部１０３に供給する。また、可逆復号化部１０２は、ヘッダに含まれるイントラ予測モード情報などをイントラ予測部１１０に供給し、動きベクトルとインター予測モード情報などをインター予測部１１１に供給する。さらに、可逆復号化部１０２は、ヘッダに含まれるイントラ予測モード情報またはインター予測モード情報をスイッチ１１２に供給する。

　逆量子化部１０３、逆直交変換部１０４、加算部１０５、デブロックフィルタ１０６、フレームメモリ１０９、イントラ予測部１１０、および、インター予測部１１１は、図４の逆量子化部１８、逆直交変換部１９、加算部２０、デブロックフィルタ２１、フレームメモリ２２、イントラ予測部２３、および、インター予測部２４とそれぞれ同様の処理を行い、これにより、画像が復号される。

　具体的には、逆量子化部１０３は、可逆復号化部１０２からの量子化された係数を逆量子化し、その結果得られる係数を逆直交変換部１０４に供給する。

　逆直交変換部１０４は、逆量子化部１０３からの係数に対して、逆離散コサイン変換、逆カルーネン・レーベ変換等の逆直交変換を施し、その結果得られる残差情報を加算部１０５に供給する。

　加算部１０５は、加算演算手段として機能し、逆直交変換部１０４から供給される復号対象の画像としての残差情報と、スイッチ１１２から供給される予測画像を加算し、その結果得られる画像をデブロックフィルタ１０６に供給するとともに、参照画像としてイントラ予測部１１０に供給する。なお、スイッチ１１２から予測画像が供給されない場合、加算部１０５は、逆直交変換部１０４から供給される残差情報である画像をデブロックフィルタ１０６に供給するとともに、参照画像としてイントラ予測部１１０に供給する。

　デブロックフィルタ１０６は、加算部１０５から供給される画像をフィルタリングすることにより、ブロック歪を除去する。デブロックフィルタ１０６は、その結果得られる画像をフレームメモリ１０９に供給し、蓄積させるとともに、画面並べ替えバッファ１０７に供給する。フレームメモリ１０９に蓄積された画像は、参照画像としてインター予測部１１１に供給される。

　画面並べ替えバッファ１０７は、デブロックフィルタ１０６から供給される画像をフレーム単位で記憶する。画面並べ替えバッファ１０７は、記憶した符号化のための順番のフレーム単位の画像を、元の表示の順番に並び替え、D/A変換部１０８に供給する。

　D/A変換部１０８は、画面並べ替えバッファ１０７から供給されるフレーム単位の画像をD/A変換し、出力信号として出力する。

　イントラ予測部１１０は、加算部１０５から供給される参照画像を用いて、可逆復号化部１０２から供給されるイントラ予測モード情報が表すイントラ予測モードのイントラ予測を行い、予測画像を生成する。そして、イントラ予測部１１０は、予測画像をスイッチ１１２に供給する。

　インター予測部１１１は、図５に示したインター予測部２４と同様に構成される。インター予測部１１１は、可逆復号化部１０２から供給されるインター予測モード情報と動きベクトルに基づいて、フレームメモリ１０９から参照画像を読み出す。インター予測部１１１は、動きベクトルとフレームメモリ１０９から読み出された参照画像とに基づいて、インター予測処理を行う。インター予測部１１１は、その結果生成される予測画像をスイッチ１１２に供給する。

　スイッチ１１２は、可逆復号化部１０２からイントラ予測モード情報が供給された場合、イントラ予測部１１０から供給される予測画像を加算部１０５に供給する。一方、可逆復号化部１０２からインター予測モード情報が供給された場合、インター予測部１１１から供給される予測画像を加算部１０５に供給する。

　［復号装置の処理の説明］
　図３１は、図３０の復号装置１００による復号処理を説明するフローチャートである。この復号処理は、例えば、フレーム単位の画像圧縮情報が復号装置１００に入力されるたびに行われる。

　図３１のステップＳ１０１において、復号装置１００の蓄積バッファ１０１は、図４の符号化装置１０からフレーム単位の画像圧縮情報を受け取り、蓄積する。蓄積バッファ１０１は、蓄積されている画像圧縮情報を可逆復号化部１０２に供給する。なお、以下のステップＳ１０２乃至Ｓ１１０の処理は、例えばマクロブック単位で行われる。

　ステップＳ１０２において、可逆復号化部１０２は、蓄積バッファ１０１からの画像圧縮情報を可逆復号し、量子化された係数とヘッダを得る。可逆復号化部１０２は、量子化された係数を逆量子化部１０３に供給する。また、可逆復号化部１０２は、ヘッダに含まれるイントラ予測モード情報などをイントラ予測部１１０に供給し、動きベクトルとインター予測モード情報などをインター予測部１１１に供給する。さらに、可逆復号化部１０２は、ヘッダに含まれるイントラ予測モード情報またはインター予測モード情報をスイッチ１１２に供給する。

　ステップＳ１０３において、逆量子化部１０３は、可逆復号化部１０２からの量子化された係数を逆量子化し、その結果得られる係数を逆直交変換部１０４に供給する。

　ステップＳ１０４において、逆直交変換部１０４は、逆量子化部１０３からの係数に対して逆直交変換を施し、その結果得られる残差情報を加算部１０５に供給する。

　ステップＳ１０５において、インター予測部１１１は、可逆復号化部１０２からインター予測モード情報が供給されたかどうかを判定する。ステップＳ１０５でインター予測モード情報が供給されたと判定された場合、処理はステップＳ１０６に進む。

　ステップＳ１０６において、インター予測部１１１は、可逆復号化部１０２から供給される動きベクトルとインター予測モード情報に基づいて、図２９で説明したインター予測処理を行う。インター予測部１１１は、その結果生成される予測画像を、スイッチ１１２を介して加算部１０５に供給し、処理をステップＳ１０８に進める。

　一方、ステップＳ１０５でインター予測モード情報が供給されていないと判定された場合、即ちイントラ予測モード情報がイントラ予測部１１０に供給された場合、処理はステップＳ１０７に進む。

　ステップＳ１０７において、イントラ予測部１１０は、加算部１０５から供給される参照画像を用いて、可逆復号化部１０２から供給されるイントラ予測モード情報が表すイントラ予測モードのイントラ予測を行う。そして、イントラ予測部１１０は、その結果生成される予測画像を、スイッチ１１２を介して加算部１０５に供給し、処理をステップＳ１０８に進める。

　ステップＳ１０８において、加算部１０５は、逆直交変換部１０４から供給される残差情報と、スイッチ１１２から供給される予測画像を加算する。加算部１０５は、その結果得られる画像をデブロックフィルタ１０６に供給するとともに、参照画像としてイントラ予測部１１０に供給する。なお、先頭のフレームの先頭のマクロブロックの処理時には、参照画像は存在しないため、ステップＳ１０５乃至Ｓ１０８の処理は行われず、残差情報である画像がデブロックフィルタ１０６に供給されるとともに、参照画像としてイントラ予測部１１０に供給される。

　ステップＳ１０９において、デブロックフィルタ１０６は、加算部１０５から供給される画像に対してフィルタリングを行い、ブロック歪を除去する。

　ステップＳ１１０において、デブロックフィルタ１０６は、フィルタリング後の画像をフレームメモリ１０９に供給し、蓄積させるとともに、画面並べ替えバッファ１０７に供給する。フレームメモリ１０９に蓄積された画像は、参照画像としてインター予測部１１１に供給される。

　ステップＳ１１１において、画面並べ替えバッファ１０７は、デブロックフィルタ１０６から供給される画像をフレーム単位で記憶し、記憶した符号化のための順番のフレーム単位の画像を、元の表示の順番に並び替え、D/A変換部１０８に供給する。

　ステップＳ１１２において、D/A変換部１０８は、画面並べ替えバッファ１０７から供給されるフレーム単位の画像をD/A変換し、出力信号として出力する。

　以上のように、復号装置１００は、インター予測時において、符号化装置１０と同様に、予測画素の参照画像上の水平方向および垂直方向の位置が1/2画素位置ではない分数位置である場合、直交する2方向に並ぶ参照画素を用いて予測画素を生成する。その結果、復号装置１００は、インター予測の精度の劣化を抑制しつつ、インター予測の処理量および遅延量を軽減することができる。

　なお、フィルタ係数は、可変であってもよい。この場合、FIRフィルタ４２およびフィルタ係数メモリ４３の代わりに、アダプティブ・インターポーレーション・フィルタ（AIF）が用いられる。AIFについては、例えば、Yuri Vatis, Joern Ostermann,”Prediction of P- and B-Frames Using a Two-dimensional Non-separable Adaptive Wiener Interpolation Filter for H.264/AVC”, ITU-T SG16 VCEG 30th Meeting, Hangzhou China, October 2006，Steffen Wittmann,Thomas Wedi,”Separable adaptive inerpolation filte”, ITU-T SG16COM16-C219-E,June 2007,Dmytro Rusanovskyy, et al., “Improvements on Enhanced Directional Adaptive Filtering (EDAIF-2)”, COM 16 - C 125 - E, January 2009等の文献に記載されている。

　本実施の形態では、符号化方式としてH．264/AVC方式をベースに用いるようにしたが、本発明はこれに限らず、その他の動き予測・補償処理を行う符号化方式／復号方式を用いる符号化装置/復号装置に適用することもできる。

　また、本発明は、例えば、MPEG，H．26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮する方式で圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して受信する際に用いられる符号化装置および復号装置に適用することができる。また、本発明は、光ディスク、磁気ディスク、フラッシュメモリなどの記憶メディアに対して処理する際に用いられる符号化装置および復号装置に適用することができる。さらに、本発明は、それらの符号化装置および復号装置などに含まれる動き予測補償装置にも適用することができる。

　[本発明を適用したコンピュータの説明]
　次に、上述した符号化処理や復号処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。符号化処理や復号処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。

　そこで、図３２は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。

　プログラムは、コンピュータに内蔵されている記録媒体としての記憶部４０８やROM（Read Only Memory）４０２に予め記録しておくことができる。

　あるいはまた、プログラムは、リムーバブルメディア４１１に格納（記録）しておくことができる。このようなリムーバブルメディア４１１は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブルメディア４１１としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)，MO(Magneto Optical)ディスク，DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。

　なお、プログラムは、上述したようなリムーバブルメディア４１１からドライブ４１０を介してコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵する記憶部４０８にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、デジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。

　コンピュータは、CPU(Central Processing Unit)４０１を内蔵しており、CPU４０１には、バス４０４を介して、入出力インタフェース４０５が接続されている。

　CPU４０１は、入出力インタフェース４０５を介して、ユーザによって、入力部４０６が操作等されることにより指令が入力されると、それに従って、ROM４０２に格納されているプログラムを実行する。あるいは、CPU４０１は、記憶部４０８に格納されたプログラムを、RAM(Random Access Memory)４０３にロードして実行する。

　これにより、CPU４０１は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU４０１は、その処理結果を、必要に応じて、例えば、入出力インタフェース４０５を介して、出力部４０７から出力、あるいは、通信部４０９から送信、さらには、記憶部４０８に記録等させる。

　なお、入力部４０６は、キーボードや、マウス、マイク等で構成される。また、出力部４０７は、LCD(Liquid Crystal Display)やスピーカ等で構成される。

　ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含む。

　また、プログラムは、１のコンピュータ（プロセッサ）により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。

［テレビジョン受像機の構成例］
　図３３は、本発明を適用した復号装置を用いるテレビジョン受像機の主な構成例を示すブロック図である。

　図３３に示されるテレビジョン受像機５００は、地上波チューナ５１３、ビデオデコーダ５１５、映像信号処理回路５１８、グラフィック生成回路５１９、パネル駆動回路５２０、および表示パネル５２１を有する。

　地上波チューナ５１３は、地上アナログ放送の放送波信号を、アンテナを介して受信し、復調し、映像信号を取得し、それをビデオデコーダ５１５に供給する。ビデオデコーダ５１５は、地上波チューナ５１３から供給された映像信号に対してデコード処理を施し、得られたデジタルのコンポーネント信号を映像信号処理回路５１８に供給する。

　映像信号処理回路５１８は、ビデオデコーダ５１５から供給された映像データに対してノイズ除去などの所定の処理を施し、得られた映像データをグラフィック生成回路５１９に供給する。

　グラフィック生成回路５１９は、表示パネル５２１に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成し、生成した映像データや画像データをパネル駆動回路５２０に供給する。また、グラフィック生成回路５１９は、項目の選択などにユーザにより利用される画面を表示するための映像データ（グラフィック）を生成し、それを番組の映像データに重畳したりすることによって得られた映像データをパネル駆動回路５２０に供給するといった処理も適宜行う。

　パネル駆動回路５２０は、グラフィック生成回路５１９から供給されたデータに基づいて表示パネル５２１を駆動し、番組の映像や上述した各種の画面を表示パネル５２１に表示させる。

　表示パネル５２１はLCD（Liquid Crystal Display）などよりなり、パネル駆動回路５２０による制御に従って番組の映像などを表示させる。

　また、テレビジョン受像機５００は、音声A/D（Analog/Digital)変換回路５１４、音声信号処理回路５２２、エコーキャンセル／音声合成回路５２３、音声増幅回路５２４、およびスピーカ５２５も有する。

　地上波チューナ５１３は、受信した放送波信号を復調することにより、映像信号だけでなく音声信号も取得する。地上波チューナ５１３は、取得した音声信号を音声A/D変換回路５１４に供給する。

　音声A/D変換回路５１４は、地上波チューナ５１３から供給された音声信号に対してA/D変換処理を施し、得られたデジタルの音声信号を音声信号処理回路５２２に供給する。

　音声信号処理回路５２２は、音声A/D変換回路５１４から供給された音声データに対してノイズ除去などの所定の処理を施し、得られた音声データをエコーキャンセル／音声合成回路５２３に供給する。

　エコーキャンセル／音声合成回路５２３は、音声信号処理回路５２２から供給された音声データを音声増幅回路５２４に供給する。

　音声増幅回路５２４は、エコーキャンセル／音声合成回路５２３から供給された音声データに対してD/A変換処理、増幅処理を施し、所定の音量に調整した後、音声をスピーカ５２５から出力させる。

　さらに、テレビジョン受像機５００は、デジタルチューナ５１６およびMPEGデコーダ５１７も有する。

　デジタルチューナ５１６は、デジタル放送（地上デジタル放送、BS（Broadcasting Satellite）／CS（Communications Satellite）デジタル放送）の放送波信号を、アンテナを介して受信し、復調し、MPEG-TS（Moving Picture Experts Group-Transport Stream）を取得し、それをMPEGデコーダ５１７に供給する。

　MPEGデコーダ５１７は、デジタルチューナ５１６から供給されたMPEG-TSに施されているスクランブルを解除し、再生対象（視聴対象）になっている番組のデータを含むストリームを抽出する。MPEGデコーダ５１７は、抽出したストリームを構成する音声パケットをデコードし、得られた音声データを音声信号処理回路５２２に供給するとともに、ストリームを構成する映像パケットをデコードし、得られた映像データを映像信号処理回路５１８に供給する。また、MPEGデコーダ５１７は、MPEG-TSから抽出したEPG（Electronic Program Guide)データを図示せぬ経路を介してCPU５３２に供給する。

　テレビジョン受像機５００は、このように映像パケットをデコードするMPEGデコーダ５１７として、上述した復号装置１００を用いる。したがって、MPEGデコーダ５１７では、復号装置１００の場合と同様に、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を軽減することができる。

　MPEGデコーダ５１７から供給された映像データは、ビデオデコーダ５１５から供給された映像データの場合と同様に、映像信号処理回路５１８において所定の処理が施される。そして、所定の処理が施された映像データは、グラフィック生成回路５１９において、生成された映像データ等が適宜重畳され、パネル駆動回路５２０を介して表示パネル５２１に供給され、その画像が表示される。

　MPEGデコーダ５１７から供給された音声データは、音声A/D変換回路５１４から供給された音声データの場合と同様に、音声信号処理回路５２２において所定の処理が施される。そして、所定の処理が施された音声データは、エコーキャンセル／音声合成回路５２３を介して音声増幅回路５２４に供給され、D/A変換処理や増幅処理が施される。その結果、所定の音量に調整された音声がスピーカ５２５から出力される。

　また、テレビジョン受像機５００は、マイクロホン５２６、およびA/D変換回路５２７も有する。

　A/D変換回路５２７は、音声会話用のものとしてテレビジョン受像機５００に設けられるマイクロホン５２６により取り込まれたユーザの音声の信号を受信する。A/D変換回路５２７は、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データをエコーキャンセル／音声合成回路５２３に供給する。

　エコーキャンセル／音声合成回路５２３は、テレビジョン受像機５００のユーザ（ユーザＡ）の音声のデータがA/D変換回路５２７から供給されている場合、ユーザＡの音声データを対象としてエコーキャンセルを行う。そして、エコーキャンセル／音声合成回路５２３は、エコーキャンセルの後、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路５２４を介してスピーカ５２５より出力させる。

　さらに、テレビジョン受像機５００は、音声コーデック５２８、内部バス５２９、SDRAM（Synchronous Dynamic Random Access Memory)５３０、フラッシュメモリ５３１、CPU５３２、USB（Universal Serial Bus) I/F５３３、およびネットワークI/F５３４も有する。

　A/D変換回路５２７は、音声会話用のものとしてテレビジョン受像機５００に設けられるマイクロホン５２６により取り込まれたユーザの音声の信号を受信する。A/D変換回路５２７は、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データを音声コーデック５２８に供給する。

　音声コーデック５２８は、A/D変換回路５２７から供給された音声データを、ネットワーク経由で送信するための所定のフォーマットのデータに変換し、内部バス５２９を介してネットワークI/F５３４に供給する。

　ネットワークI/F５３４は、ネットワーク端子５３５に装着されたケーブルを介してネットワークに接続される。ネットワークI/F５３４は、例えば、そのネットワークに接続される他の装置に対して、音声コーデック５２８から供給された音声データを送信する。また、ネットワークI/F５３４は、例えば、ネットワークを介して接続される他の装置から送信される音声データを、ネットワーク端子５３５を介して受信し、それを、内部バス５２９を介して音声コーデック５２８に供給する。

　音声コーデック５２８は、ネットワークI/F５３４から供給された音声データを所定のフォーマットのデータに変換し、それをエコーキャンセル／音声合成回路５２３に供給する。

　エコーキャンセル／音声合成回路５２３は、音声コーデック５２８から供給される音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路５２４を介してスピーカ５２５より出力させる。

　SDRAM５３０は、CPU５３２が処理を行う上で必要な各種のデータを記憶する。

　フラッシュメモリ５３１は、CPU５３２により実行されるプログラムを記憶する。フラッシュメモリ５３１に記憶されているプログラムは、テレビジョン受像機５００の起動時などの所定のタイミングでCPU５３２により読み出される。フラッシュメモリ５３１には、デジタル放送を介して取得されたEPGデータ、ネットワークを介して所定のサーバから取得されたデータなども記憶される。

　例えば、フラッシュメモリ５３１には、CPU５３２の制御によりネットワークを介して所定のサーバから取得されたコンテンツデータを含むMPEG-TSが記憶される。フラッシュメモリ５３１は、例えばCPU５３２の制御により、そのMPEG-TSを、内部バス５２９を介してMPEGデコーダ５１７に供給する。

　MPEGデコーダ５１７は、デジタルチューナ５１６から供給されたMPEG-TSの場合と同様に、そのMPEG-TSを処理する。このようにテレビジョン受像機５００は、映像や音声等よりなるコンテンツデータを、ネットワークを介して受信し、MPEGデコーダ５１７を用いてデコードし、その映像を表示させたり、音声を出力させたりすることができる。

　また、テレビジョン受像機５００は、リモートコントローラ５５１から送信される赤外線信号を受光する受光部５３７も有する。

　受光部５３７は、リモートコントローラ５５１からの赤外線を受光し、復調して得られたユーザ操作の内容を表す制御コードをCPU５３２に出力する。

　CPU５３２は、フラッシュメモリ５３１に記憶されているプログラムを実行し、受光部５３７から供給される制御コードなどに応じてテレビジョン受像機５００の全体の動作を制御する。CPU５３２とテレビジョン受像機５００の各部は、図示せぬ経路を介して接続されている。

　USB I/F５３３は、USB端子５３６に装着されたUSBケーブルを介して接続される、テレビジョン受像機５００の外部の機器との間でデータの送受信を行う。ネットワークI/F５３４は、ネットワーク端子５３５に装着されたケーブルを介してネットワークに接続し、ネットワークに接続される各種の装置と音声データ以外のデータの送受信も行う。

　テレビジョン受像機５００は、MPEGデコーダ５１７として復号装置１００を用いることにより、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を軽減することができる。

［携帯電話機の構成例］
　図３４は、本発明を適用した符号化装置および復号装置を用いる携帯電話機の主な構成例を示すブロック図である。

　図３４に示される携帯電話機６００は、各部を統括的に制御するようになされた主制御部６５０、電源回路部６５１、操作入力制御部６５２、画像エンコーダ６５３、カメラI/F部６５４、LCD制御部６５５、画像デコーダ６５６、多重分離部６５７、記録再生部６６２、変復調回路部６５８、および音声コーデック６５９を有する。これらは、バス６６０を介して互いに接続されている。

　また、携帯電話機６００は、操作キー６１９、CCD（Charge Coupled Devices）カメラ６１６、液晶ディスプレイ６１８、記憶部６２３、送受信回路部６６３、アンテナ６１４、マイクロホン（マイク）６２１、およびスピーカ６１７を有する。

　電源回路部６５１は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話機６００を動作可能な状態に起動する。

　携帯電話機６００は、CPU、ROMおよびRAM等でなる主制御部６５０の制御に基づいて、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

　例えば、音声通話モードにおいて、携帯電話機６００は、マイクロホン（マイク）６２１で集音した音声信号を、音声コーデック６５９によってデジタル音声データに変換し、これを変復調回路部６５８でスペクトラム拡散処理し、送受信回路部６６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機６００は、その変換処理により得られた送信用信号を、アンテナ６１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（音声信号）は、公衆電話回線網を介して通話相手の携帯電話機に供給される。

　また、例えば、音声通話モードにおいて、携帯電話機６００は、アンテナ６１４で受信した受信信号を送受信回路部６６３で増幅し、さらに周波数変換処理およびアナログデジタル変換処理し、変復調回路部６５８でスペクトラム逆拡散処理し、音声コーデック６５９によってアナログ音声信号に変換する。携帯電話機６００は、その変換して得られたアナログ音声信号をスピーカ６１７から出力する。

　更に、例えば、データ通信モードにおいて電子メールを送信する場合、携帯電話機６００は、操作キー６１９の操作によって入力された電子メールのテキストデータを、操作入力制御部６５２において受け付ける。携帯電話機６００は、そのテキストデータを主制御部６５０において処理し、LCD制御部６５５を介して、画像として液晶ディスプレイ６１８に表示させる。

　また、携帯電話機６００は、主制御部６５０において、操作入力制御部６５２が受け付けたテキストデータやユーザ指示等に基づいて電子メールデータを生成する。携帯電話機６００は、その電子メールデータを、変復調回路部６５８でスペクトラム拡散処理し、送受信回路部６６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機６００は、その変換処理により得られた送信用信号を、アンテナ６１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（電子メール）は、ネットワークおよびメールサーバ等を介して、所定のあて先に供給される。

　また、例えば、データ通信モードにおいて電子メールを受信する場合、携帯電話機６００は、基地局から送信された信号を、アンテナ６１４を介して送受信回路部６６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機６００は、その受信信号を変復調回路部６５８でスペクトラム逆拡散処理して元の電子メールデータを復元する。携帯電話機６００は、復元された電子メールデータを、LCD制御部６５５を介して液晶ディスプレイ６１８に表示する。

　なお、携帯電話機６００は、受信した電子メールデータを、記録再生部６６２を介して、記憶部６２３に記録する（記憶させる）ことも可能である。

　この記憶部６２３は、書き換え可能な任意の記憶媒体である。記憶部６２３は、例えば、RAMや内蔵型フラッシュメモリ等の半導体メモリであってもよいし、ハードディスクであってもよいし、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアであってもよい。もちろん、これら以外のものであってもよい。

　さらに、例えば、データ通信モードにおいて画像データを送信する場合、携帯電話機６００は、撮像によりCCDカメラ６１６で画像データを生成する。CCDカメラ６１６は、レンズや絞り等の光学デバイスと光電変換素子としてのCCDを有し、被写体を撮像し、受光した光の強度を電気信号に変換し、被写体の画像の画像データを生成する。その画像データを、カメラI/F部６５４を介して、画像エンコーダ６５３で、例えばMPEG２やMPEG４等の所定の符号化方式によって圧縮符号化することにより符号化画像データに変換する。

　携帯電話機６００は、このような処理を行う画像エンコーダ６５３として、上述した符号化装置１０を用いる。したがって、画像エンコーダ６５３は、符号化装置１０の場合と同様に、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を軽減することができる。

　なお、携帯電話機６００は、このとき同時に、CCDカメラ６１６で撮像中にマイクロホン（マイク）６２１で集音した音声を、音声コーデック６５９においてアナログデジタル変換し、さらに符号化する。

　携帯電話機６００は、多重分離部６５７において、画像エンコーダ６５３から供給された符号化画像データと、音声コーデック６５９から供給されたデジタル音声データとを、所定の方式で多重化する。携帯電話機６００は、その結果得られる多重化データを、変復調回路部６５８でスペクトラム拡散処理し、送受信回路部６６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機６００は、その変換処理により得られた送信用信号を、アンテナ６１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（画像データ）は、ネットワーク等を介して、通信相手に供給される。

　なお、画像データを送信しない場合、携帯電話機６００は、CCDカメラ６１６で生成した画像データを、画像エンコーダ６５３を介さずに、LCD制御部６５５を介して液晶ディスプレイ６１８に表示させることもできる。

　また、例えば、データ通信モードにおいて、簡易ホームページ等にリンクされた動画像ファイルのデータを受信する場合、携帯電話機６００は、基地局から送信された信号を、アンテナ６１４を介して送受信回路部６６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機６００は、その受信信号を変復調回路部６５８でスペクトラム逆拡散処理して元の多重化データを復元する。携帯電話機６００は、多重分離部６５７において、その多重化データを分離して、符号化画像データと音声データとに分ける。

　携帯電話機６００は、画像デコーダ６５６において、符号化画像データを、MPEG２やMPEG４等の所定の符号化方式に対応した復号方式でデコードすることにより、再生動画像データを生成し、これを、LCD制御部６５５を介して液晶ディスプレイ６１８に表示させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる動画データが液晶ディスプレイ６１８に表示される。

　携帯電話機６００は、このような処理を行う画像デコーダ６５６として、上述した復号装置１００を用いる。したがって、画像デコーダ６５６は、復号装置１００の場合と同様に、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を軽減することができる。

　このとき、携帯電話機６００は、同時に、音声コーデック６５９において、デジタルの音声データをアナログ音声信号に変換し、これをスピーカ６１７より出力させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる音声データが再生される。

　なお、電子メールの場合と同様に、携帯電話機６００は、受信した簡易ホームページ等にリンクされたデータを、記録再生部６６２を介して、記憶部６２３に記録する（記憶させる）ことも可能である。

　また、携帯電話機６００は、主制御部６５０において、撮像されてCCDカメラ６１６で得られた２次元コードを解析し、２次元コードに記録された情報を取得することができる。

　さらに、携帯電話機６００は、赤外線通信部６８１で赤外線により外部の機器と通信することができる。

　携帯電話機６００は、画像エンコーダ６５３として符号化装置１０を用いることにより、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を軽減することができる。

　また、携帯電話機６００は、画像デコーダ６５６として復号装置１００を用いることにより、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を削減することができる。

　なお、以上において、携帯電話機６００が、CCDカメラ６１６を用いるように説明したが、このCCDカメラ６１６の代わりに、CMOS（Complementary Metal Oxide Semiconductor）を用いたイメージセンサ（CMOSイメージセンサ）を用いるようにしてもよい。この場合も、携帯電話機６００は、CCDカメラ６１６を用いる場合と同様に、被写体を撮像し、被写体の画像の画像データを生成することができる。

　また、以上においては携帯電話機６００として説明したが、例えば、PDA（Personal Digital Assistants）、スマートフォン、UMPC（Ultra Mobile Personal Computer）、ネットブック、ノート型パーソナルコンピュータ等、この携帯電話機６００と同様の撮像機能や通信機能を有する装置であれば、どのような装置であっても携帯電話機６００の場合と同様に、符号化装置１０および復号装置１００を適用することができる。

［ハードディスクレコーダの構成例］
　図３５は、本発明を適用した符号化装置および復号装置を用いるハードディスクレコーダの主な構成例を示すブロック図である。

　図３５に示されるハードディスクレコーダ（HDDレコーダ）７００は、チューナにより受信された、衛星や地上のアンテナ等より送信される放送波信号（テレビジョン信号）に含まれる放送番組のオーディオデータとビデオデータを、内蔵するハードディスクに保存し、その保存したデータをユーザの指示に応じたタイミングでユーザに提供する装置である。

　ハードディスクレコーダ７００は、例えば、放送波信号よりオーディオデータとビデオデータを抽出し、それらを適宜復号し、内蔵するハードディスクに記憶させることができる。また、ハードディスクレコーダ７００は、例えば、ネットワークを介して他の装置からオーディオデータやビデオデータを取得し、それらを適宜復号し、内蔵するハードディスクに記憶させることもできる。

　さらに、ハードディスクレコーダ７００は、例えば、内蔵するハードディスクに記録されているオーディオデータやビデオデータを復号してモニタ７６０に供給し、モニタ７６０の画面にその画像を表示させる。また、ハードディスクレコーダ７００は、モニタ７６０のスピーカよりその音声を出力させることができる。

　ハードディスクレコーダ７００は、例えば、チューナを介して取得された放送波信号より抽出されたオーディオデータとビデオデータ、または、ネットワークを介して他の装置から取得したオーディオデータやビデオデータを復号してモニタ７６０に供給し、モニタ７６０の画面にその画像を表示させる。また、ハードディスクレコーダ７００は、モニタ７６０のスピーカよりその音声を出力させることもできる。

　もちろん、この他の動作も可能である。

　図３５に示されるように、ハードディスクレコーダ７００は、受信部７２１、復調部７２２、デマルチプレクサ７２３、オーディオデコーダ７２４、ビデオデコーダ７２５、およびレコーダ制御部７２６を有する。ハードディスクレコーダ７００は、さらに、EPGデータメモリ７２７、プログラムメモリ７２８、ワークメモリ７２９、ディスプレイコンバータ７３０、OSD（On Screen Display）制御部７３１、ディスプレイ制御部７３２、記録再生部７３３、D/Aコンバータ７３４、および通信部７３５を有する。

　また、ディスプレイコンバータ７３０は、ビデオエンコーダ７４１を有する。記録再生部７３３は、エンコーダ７５１およびデコーダ７５２を有する。

　受信部７２１は、リモートコントローラ（図示せず）からの赤外線信号を受信し、電気信号に変換してレコーダ制御部７２６に出力する。レコーダ制御部７２６は、例えば、マイクロプロセッサなどにより構成され、プログラムメモリ７２８に記憶されているプログラムに従って、各種の処理を実行する。レコーダ制御部７２６は、このとき、ワークメモリ７２９を必要に応じて使用する。

　通信部７３５は、ネットワークに接続され、ネットワークを介して他の装置との通信処理を行う。例えば、通信部７３５は、レコーダ制御部７２６により制御され、チューナ（図示せず）と通信し、主にチューナに対して選局制御信号を出力する。

　復調部７２２は、チューナより供給された信号を、復調し、デマルチプレクサ７２３に出力する。デマルチプレクサ７２３は、復調部７２２より供給されたデータを、オーディオデータ、ビデオデータ、およびEPGデータに分離し、それぞれ、オーディオデコーダ７２４、ビデオデコーダ７２５、またはレコーダ制御部７２６に出力する。

　オーディオデコーダ７２４は、入力されたオーディオデータを、例えばMPEG方式でデコードし、記録再生部７３３に出力する。ビデオデコーダ７２５は、入力されたビデオデータを、例えばMPEG方式でデコードし、ディスプレイコンバータ７３０に出力する。レコーダ制御部７２６は、入力されたEPGデータをEPGデータメモリ７２７に供給し、記憶させる。

　ディスプレイコンバータ７３０は、ビデオデコーダ７２５またはレコーダ制御部７２６より供給されたビデオデータを、ビデオエンコーダ７４１により、例えばNTSC（National Television Standards Committee）方式のビデオデータにエンコードし、記録再生部７３３に出力する。また、ディスプレイコンバータ７３０は、ビデオデコーダ７２５またはレコーダ制御部７２６より供給されるビデオデータの画面のサイズを、モニタ７６０のサイズに対応するサイズに変換する。ディスプレイコンバータ７３０は、画面のサイズが変換されたビデオデータを、さらに、ビデオエンコーダ７４１によってNTSC方式のビデオデータに変換し、アナログ信号に変換し、ディスプレイ制御部７３２に出力する。

　ディスプレイ制御部７３２は、レコーダ制御部７２６の制御のもと、OSD（On Screen Display）制御部７３１が出力したOSD信号を、ディスプレイコンバータ７３０より入力されたビデオ信号に重畳し、モニタ７６０のディスプレイに出力し、表示させる。

　モニタ７６０にはまた、オーディオデコーダ７２４が出力したオーディオデータが、D/Aコンバータ７３４によりアナログ信号に変換されて供給されている。モニタ７６０は、このオーディオ信号を内蔵するスピーカから出力する。

　記録再生部７３３は、ビデオデータやオーディオデータ等を記録する記憶媒体としてハードディスクを有する。

　記録再生部７３３は、例えば、オーディオデコーダ７２４より供給されるオーディオデータを、エンコーダ７５１によりMPEG方式でエンコードする。また、記録再生部７３３は、ディスプレイコンバータ７３０のビデオエンコーダ７４１より供給されるビデオデータを、エンコーダ７５１によりMPEG方式でエンコードする。記録再生部７３３は、そのオーディオデータの符号化データとビデオデータの符号化データとをマルチプレクサにより合成する。記録再生部７３３は、その合成データをチャネルコーディングして増幅し、そのデータを、記録ヘッドを介してハードディスクに書き込む。

　記録再生部７３３は、再生ヘッドを介してハードディスクに記録されているデータを再生し、増幅し、デマルチプレクサによりオーディオデータとビデオデータに分離する。記録再生部７３３は、デコーダ７５２によりオーディオデータおよびビデオデータをMPEG方式でデコードする。記録再生部７３３は、復号したオーディオデータをD/A変換し、モニタ７６０のスピーカに出力する。また、記録再生部７３３は、復号したビデオデータをD/A変換し、モニタ７６０のディスプレイに出力する。

　レコーダ制御部７２６は、受信部７２１を介して受信されるリモートコントローラからの赤外線信号により示されるユーザ指示に基づいて、EPGデータメモリ７２７から最新のEPGデータを読み出し、それをOSD制御部７３１に供給する。OSD制御部７３１は、入力されたEPGデータに対応する画像データを発生し、ディスプレイ制御部７３２に出力する。ディスプレイ制御部７３２は、OSD制御部７３１より入力されたビデオデータをモニタ７６０のディスプレイに出力し、表示させる。これにより、モニタ７６０のディスプレイには、EPG（電子番組ガイド）が表示される。

　また、ハードディスクレコーダ７００は、インターネット等のネットワークを介して他の装置から供給されるビデオデータ、オーディオデータ、またはEPGデータ等の各種データを取得することができる。

　通信部７３５は、レコーダ制御部７２６に制御され、ネットワークを介して他の装置から送信されるビデオデータ、オーディオデータ、およびEPGデータ等の符号化データを取得し、それをレコーダ制御部７２６に供給する。レコーダ制御部７２６は、例えば、取得したビデオデータやオーディオデータの符号化データを記録再生部７３３に供給し、ハードディスクに記憶させる。このとき、レコーダ制御部７２６および記録再生部７３３が、必要に応じて再エンコード等の処理を行うようにしてもよい。

　また、レコーダ制御部７２６は、取得したビデオデータやオーディオデータの符号化データを復号し、得られるビデオデータをディスプレイコンバータ７３０に供給する。ディスプレイコンバータ７３０は、ビデオデコーダ７２５から供給されるビデオデータと同様に、レコーダ制御部７２６から供給されるビデオデータを処理し、ディスプレイ制御部７３２を介してモニタ７６０に供給し、その画像を表示させる。

　また、この画像表示に合わせて、レコーダ制御部７２６が、復号したオーディオデータを、D/Aコンバータ７３４を介してモニタ７６０に供給し、その音声をスピーカから出力させるようにしてもよい。

　さらに、レコーダ制御部７２６は、取得したEPGデータの符号化データを復号し、復号したEPGデータをEPGデータメモリ７２７に供給する。

　以上のようなハードディスクレコーダ７００は、ビデオデコーダ７２５、デコーダ７５２、およびレコーダ制御部７２６に内蔵されるデコーダとして復号装置１００を用いる。したがって、ビデオデコーダ７２５、デコーダ７５２、およびレコーダ制御部７２６に内蔵されるデコーダは、復号装置１００の場合と同様に、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を削減することができる。

　また、ハードディスクレコーダ７００は、エンコーダ７５１として符号化装置１０を用いる。したがって、エンコーダ７５１は、符号化装置１０の場合と同様にインター予測の精度の劣化を抑制しつつ、処理量および遅延量を削減することができる。

　なお、以上においては、ビデオデータやオーディオデータをハードディスクに記録するハードディスクレコーダ７００について説明したが、もちろん、記録媒体はどのようなものであってもよい。例えばフラッシュメモリ、光ディスク、またはビデオテープ等、ハードディスク以外の記録媒体を適用するレコーダであっても、上述したハードディスクレコーダ７００の場合と同様に、符号化装置１０および復号装置１００を適用することができる。

［カメラの構成例］
　図３６は、本発明を適用した符号化装置および復号装置を用いるカメラの主な構成例を示すブロック図である。

　図３６に示されるカメラ８００は、被写体を撮像し、被写体の画像をLCD８１６に表示させたり、それを画像データとして、記録メディア８３３に記録したりする。

　レンズブロック８１１は、光（すなわち、被写体の映像）を、CCD/CMOS８１２に入射させる。CCD/CMOS８１２は、CCDまたはCMOSを用いたイメージセンサであり、受光した光の強度を電気信号に変換し、カメラ信号処理部８１３に供給する。

　カメラ信号処理部８１３は、CCD/CMOS８１２から供給された電気信号を、Ｙ，Ｃｒ，Ｃｂの色差信号に変換し、画像信号処理部８１４に供給する。画像信号処理部８１４は、コントローラ８２１の制御の下、カメラ信号処理部８１３から供給された画像信号に対して所定の画像処理を施したり、その画像信号をエンコーダ８４１で例えばMPEG方式により符号化したりする。画像信号処理部８１４は、画像信号を符号化して生成した符号化データを、デコーダ８１５に供給する。さらに、画像信号処理部８１４は、オンスクリーンディスプレイ（OSD）８２０において生成された表示用データを取得し、それをデコーダ８１５に供給する。

　以上の処理において、カメラ信号処理部８１３は、バス８１７を介して接続されるDRAM（Dynamic Random Access Memory）８１８を適宜利用し、必要に応じて画像データや、その画像データが符号化された符号化データ等をそのDRAM８１８に保持させる。

　デコーダ８１５は、画像信号処理部８１４から供給された符号化データを復号し、得られた画像データ（復号画像データ）をLCD８１６に供給する。また、デコーダ８１５は、画像信号処理部８１４から供給された表示用データをLCD８１６に供給する。LCD８１６は、デコーダ８１５から供給された復号画像データの画像と表示用データの画像を適宜合成し、その合成画像を表示する。

　オンスクリーンディスプレイ８２０は、コントローラ８２１の制御の下、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを、バス８１７を介して画像信号処理部８１４に出力する。

　コントローラ８２１は、ユーザが操作部８２２を用いて指令した内容を示す信号に基づいて、各種処理を実行するとともに、バス８１７を介して、画像信号処理部８１４、DRAM８１８、外部インタフェース８１９、オンスクリーンディスプレイ８２０、およびメディアドライブ８２３等を制御する。FLASH ROM８２４には、コントローラ８２１が各種処理を実行する上で必要なプログラムやデータ等が格納される。

　例えば、コントローラ８２１は、画像信号処理部８１４やデコーダ８１５に代わって、DRAM８１８に記憶されている画像データを符号化したり、DRAM８１８に記憶されている符号化データを復号したりすることができる。このとき、コントローラ８２１は、画像信号処理部８１４やデコーダ８１５の符号化・復号方式と同様の方式によって符号化・復号処理を行うようにしてもよいし、画像信号処理部８１４やデコーダ８１５が対応していない方式により符号化・復号処理を行うようにしてもよい。

　また、例えば、操作部８２２から画像印刷の開始が指示された場合、コントローラ８２１は、DRAM８１８から画像データを読み出し、それを、バス８１７を介して外部インタフェース８１９に接続されるプリンタ８３４に供給して印刷させる。

　さらに、例えば、操作部８２２から画像記録が指示された場合、コントローラ８２１は、DRAM８１８から符号化データを読み出し、それを、バス８１７を介してメディアドライブ８２３に装着される記録メディア８３３に供給して記憶させる。

　記録メディア８３３は、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアである。記録メディア８３３は、もちろん、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であっても良い。

　また、メディアドライブ８２３と記録メディア８３３を一体化し、例えば、内蔵型ハードディスクドライブやSSD（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

　外部インタフェース８１９は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタ８３４と接続される。また、外部インタフェース８１９には、必要に応じてドライブ８３１が接続され、磁気ディスク、光ディスク、あるいは光磁気ディスクなどのリムーバブルメディア８３２が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、FLASH ROM８２４にインストールされる。

　さらに、外部インタフェース８１９は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。コントローラ８２１は、例えば、操作部８２２からの指示に従って、DRAM８１８から符号化データを読み出し、それを外部インタフェース８１９から、ネットワークを介して接続される他の装置に供給させることができる。また、コントローラ８２１は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース８１９を介して取得し、それをDRAM８１８に保持させたり、画像信号処理部８１４に供給したりすることができる。

　以上のようなカメラ８００は、デコーダ８１５として復号装置１００用いる。したがって、デコーダ８１５は、復号装置１００の場合と同様に、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を削減することができる。

　また、カメラ８００は、エンコーダ８４１として符号化装置１０を用いる。したがって、エンコーダ８４１は、符号化装置１０の場合と同様に、インター予測の精度の劣化を抑制しつつ、処理量および遅延量を削減することができる。

　なお、コントローラ８２１が行う復号処理に復号装置１００の復号方法を適用するようにしてもよい。同様に、コントローラ８２１が行う符号化処理に符号化装置１０の符号化方法を適用するようにしてもよい。

　また、カメラ８００が撮像する画像データは動画像であってもよいし、静止画像であってもよい。

　もちろん、符号化装置１０および復号装置１００は、上述した装置以外の装置やシステムにも適用可能である。

　なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

　１０　符号化装置，　１３　演算部，　２０　加算部,　２４　インター予測部，　４１　参照画素読出部，　４２　FIRフィルタ，　１００　復号装置，　１０５　加算部，　１１１　インター予測部

Claims

　インター予測における参照画像から所定の画素を読み出す画素読出手段と、
　前記画素読出手段により読み出された前記所定の画素を用いて、前記参照画像の分数画素位置の画素を前記インター予測における予測画像の画素として演算する演算手段と
　を備え、
　前記画素読出手段は、前記予測画像の画素の前記参照画像上の水平方向および垂直方向の位置が、1/2画素位置ではない分数画素位置である場合、前記参照画像の直交する2つの斜め方向に並ぶ画素を含む前記所定の画素を読み出す
　画像処理装置。
　前記所定の画素は、前記予測画像の画素の前記参照画像上の位置から等距離にある画素を含む
　請求項１に記載の画像処理装置。
　前記画素読出手段は、前記予測画像の画素の前記参照画像上の水平方向および垂直方向の位置が、1/2画素位置ではない分数画素位置である場合、前記参照画像の直交する2つの斜め方向に並ぶ画素のうちの、前記予測画像の画素の前記参照画像上の位置から近い順の所定数の画素を含む前記所定の画素を読み出す
　請求項１に記載の画像処理装置。
　前記画素読出手段は、前記予測画像の画素の前記参照画像上の水平方向および垂直方向の位置が、1/2画素位置である場合、前記参照画像の直交する2方向と、その2方向とは異なる直交する2方向に並ぶ画素を含む前記所定の画素を読み出す
　請求項１に記載の画像処理装置。
　前記画素読出手段は、前記予測画像の画素の前記参照画像上の水平方向および垂直方向の位置が、1/2画素位置である場合、前記参照画像の水平方向および垂直方向並びに直交する2つの斜め方向に並ぶ画素を含む前記所定の画素を読み出す
　請求項４に記載の画像処理装置。
　前記画素読出手段は、前記予測画像の画素の前記参照画像上の水平方向および垂直方向の一方の位置が分数画素位置であり、他方の位置が整数画素位置である場合、前記参照画像の直交する2方向に並ぶ画素を含む前記所定の画素を読み出す
　請求項１に記載の画像処理装置。
　前記画素読出手段は、前記予測画像の画素の前記参照画像上の水平方向および垂直方向の一方の位置が分数画素位置であり、他方の位置が整数画素位置である場合、前記参照画像の水平方向および垂直方向に並ぶ画素を含む前記所定の画素を読み出す
　請求項６に記載の画像処理装置。
　前記予測画像と符号化対象の画像の差分を演算する差分演算手段
　をさらに備える
　請求項１に記載の画像処理装置。
　前記予測画像と復号対象の画像を加算する加算演算手段
　をさらに備える
　請求項１に記載の画像処理装置。
　画像処理装置が、
　インター予測における参照画像から所定の画素を読み出す画素読出ステップと、
　前記画素読出ステップの処理により読み出された前記所定の画素を用いて、前記参照画像の分数画素位置の画素を前記インター予測における予測画像の画素として演算する演算ステップと
　を含み、
　前記画素読出ステップの処理では、前記予測画像の画素の前記参照画像上の水平方向および垂直方向の位置が、1/2画素位置ではない分数画素位置である場合、前記参照画像の直交する2つの斜め方向に並ぶ画素を含む前記所定の画素を読み出す
　画像処理方法。
　コンピュータに、
　インター予測における参照画像から所定の画素を読み出す画素読出ステップと、
　前記画素読出ステップの処理により読み出された前記所定の画素を用いて、前記参照画像の分数画素位置の画素を前記インター予測における予測画像の画素として演算する演算ステップと
　を含み、
　前記画素読出ステップの処理では、前記予測画像の画素の前記参照画像上の水平方向および垂直方向の位置が、1/2画素位置ではない分数画素位置である場合、前記参照画像の直交する2つの斜め方向に並ぶ画素を含む前記所定の画素を読み出す
　処理を実行させるためのプログラム。