JPWO2010010943A1

JPWO2010010943A1 - 画像処理装置および方法

Info

Publication number: JPWO2010010943A1
Application number: JP2010521746A
Authority: JP
Inventors: 央二中神; 田中　潤一; 潤一田中; 矢ケ崎　陽一; 陽一矢ケ崎
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2008-07-25
Filing date: 2009-07-24
Publication date: 2012-01-05
Also published as: EP2306734A4; CN102100072B; EP2306734A1; BRPI0915975A2; WO2010010943A1; CN102100072A; US20110123131A1; KR101612977B1; RU2494568C2; US8483495B2; RU2011101989A; KR20110053947A

Abstract

本発明は、処理負担を大きくすることなく、精度の高い予測画像を生成することができるようにする画像処理装置および方法に関する。参照フレームからは、１６×１６画素のマクロブロック単位の画像にａ画素の幅の帯領域を余白領域として付けた画像が動き補償画像として抽出され、フィルタリング処理の入力画像とされる。ａはFIRフィルタのタップ数に応じて決まる値である。このような動き補償画像を入力画像としてフィルタリング処理が行われ、１６×１６画素の予測画像がフィルタリング処理の出力画像として出力される。予測画像は、加算回路において逆直交変換回路の出力画像と加算され、加算結果の画像が復号フレームを構成するマクロブロックとして用いられる。本発明は、予測符号化を行う装置、予測符号化によって符号化された情報を復号する装置に適用することができる。

Description

本発明は、画像処理装置および方法に関し、特に、処理負担を大きくすることなく、精度の高い予測画像を生成することができるようにした画像処理装置および方法に関する。

従来、MPEG(Moving Picture Experts Group)、H.26xなどの、動き補償と、離散コサイン変換、カルーネン・レーベ変換、またはウェーブレット変換等の直交変換とを用いた符号化方式が、動画像を扱う場合の符号化方式として一般に利用されている。これらの動画像符号化方式においては、符号化の対象になる入力の画像信号がもつ特性のうち、空間方向および時間方向の相関を利用することで符号量の削減が図られている。

例えば、H.264においては、時間方向の相関を利用して、フレーム間予測（インター予測）の対象になるフレームであるインターフレームを生成する際に、片方向予測若しくは双方向予測が用いられる。フレーム間予測は、異なる時刻のフレームに基づいて予測画像を生成するものである。

図１は、片方向予測の例を示す図である。

図１に示されるように、符号化対象になっている現在時刻のフレームである符号化フレームＰ₀を片方向予測によって生成する場合、現在時刻より時間的に過去、または未来の時刻における符号化済みのフレームを参照フレームとして動き補償が行われる。時間方向の相関を利用し、予測画像と実際の画像との残差を符号化することで、符号量を削減することが可能になる。参照フレームを指定する情報とその参照フレームの参照先の位置を指定する情報として、それぞれ、参照フレーム情報と動きベクトルが用いられ、これらの情報が符号化側から復号側に伝送される。

ここで、参照フレームの枚数は１枚とは限らない。例えば、H.264においては複数枚のフレームを参照フレームとすることが可能とされている。図１に示されるように符号化フレームＰ₀に時間的に近い順に２枚のフレームを参照フレームＲ₀，Ｒ₁とした場合、参照フレームＲ₀またはＲ₁の任意の画素の画素値から、符号化フレームＰ₀内の任意のマクロブロックの画素値を予測することができる。

図１のそれぞれのフレームの内側に示される枠はマクロブロックを表す。予測対象としている符号化フレームＰ₀のマクロブロックをマクロブロックMB_P0とすると、このマクロブロックMB_P0に対応する参照フレームＲ₀のマクロブロックは動きベクトルMV₀によって指定されるマクロブロックMB_R0となる。また、参照フレームＲ₁のマクロブロックは動きベクトルMV₁によって指定されるマクロブロックMB_R1となる。

マクロブロックMB_R0，MB_R1の画素値（動き補償画像の画素値）をMC₀(i,j)，MC₁(i,j)とすると、片方向予測においてはいずれかの動き補償画像の画素値が予測画像の画素値として用いられるから、予測画像Pred（i,j）は下式（１）により表される。(i,j)はマクロブロック内における画素の相対位置を表し、０≦ｉ≦１６、０≦ｊ≦１６となる。式（１）における「｜｜」はMC₀（i,j）とMC₁（i,j）のうちのいずれかの値をとることを表す。

なお、１６×１６画素の１つのマクロブロックを１６×８画素などのサイズにさらに細かくブロック分割し、分割したブロックごとに、異なる参照フレームを参照先として動き補償を行うことも可能とされている。整数精度の動きベクトルではなく、小数精度の動きベクトルを伝送し、規格で定められたFIRフィルタを用いて補間することにより、対応する参照先の位置の周辺の画素の画素値を動き補償に用いることも可能とされている。

図２は、双方向予測の例を示す図である。

図２に示されるように、符号化対象になっている現在時刻のフレームである符号化フレームＢ₀を双方向予測によって生成する場合、現在時刻より時間的に過去、および未来の時刻における符号化済みのフレームを参照フレームとして動き補償が行われる。符号化済みの複数枚のフレームを参照フレームとし、それらとの相関を利用して予測画像と実際の画像との残差を符号化することで符号量を削減することが可能になる。H.264においては、過去の複数枚のフレームと未来の複数枚のフレームを参照フレームとすることも可能とされている。

図２に示されるように、符号化フレームＢ₀を基準として過去と未来のフレームを１枚ずつ参照フレームＬ₀，Ｌ₁とした場合、参照フレームＬ₀，Ｌ₁の任意の画素の画素値から、符号化フレームＢ₀内の任意のマクロブロックの画素値を予測することができる。

図２の例においては、符号化フレームＢ₀のマクロブロックMB_B0に対応する参照フレームＬ₀のマクロブロックは動きベクトルMV₀によって指定されるマクロブロックMB_L0とされている。また、符号化フレームＢ₀のマクロブロックMB_B0に対応する参照フレームＬ₁のマクロブロックは動きベクトルMV₁によって指定されるマクロブロックMB_L1とされている。

マクロブロックMB_L0，MB_L1の画素値をそれぞれMC₀（i,j），MC₁（i,j）とすると、予測画像Pred（i,j）の画素値Pred（i,j）は、下式（２）に示すようにそれらの平均値として求められる。

以上のような片方向予測を用いた動き補償においては、動きベクトルの精度を上げたり、マクロブロックのサイズを細かくしたりして予測画像の精度を向上させ、実際の画像との残差を低減させることで符号化効率の向上を図るようにしていた。

また、双方向予測を用いた動き補償においては、時間的に近くにある参照フレームの画素の画素値の平均を予測画像の画素の画素値として用いることで、確率的にみても予測残差を安定して減らすことを実現できるようにしていた。

"Improving Resolution by Image Registration", MICHAL IRANI AND SHMUEL PELEG, Department of Computer Science, The Hebrew University of Jerusalem, 91904 Jerusalem, Israel, Communicated by Rama Chellapa, Received June 16, 1989; accepted May 25, 1990

従来の片方向予測の場合、複数枚の参照フレームが選択可能なときであっても、符号化フレームの画素値としては、いずれか１つの参照フレームの画素値を選択的に用いる必要がある。従って、選択されなかった参照フレームは動き補償に用いられないため、参照フレームと符号化フレームの時間相関が十分に利用されているとはいえず、符号化効率向上の観点からは改善の余地があるといえる。

また、従来の双方向予測の場合、２枚の参照フレームの画素値の平均値を符号化フレームの画素値として用いることで、時間的なローパスフィルタ処理が行われることになり、予測画像から高周波成分が失われてしまう。その結果、高周波成分を含むような残差信号を符号化できないことから、復号して得られた画像は高周波成分が失われたものになり、解像度感が劣化してしまうことになる。

本発明はこのような状況に鑑みてなされたものであり、処理負担を大きくすることなく、精度の高い予測画像を生成することができるようにするものである。

本発明の一側面の画像処理装置は、フィルタリング処理に用いるフィルタのタップ数に応じて、復号済みの参照フレームのブロックである参照ブロックを含むマクロブロックの外側に位置し前記参照ブロックと接する帯領域の幅方向の画素数を決定する決定手段と、フィルタリング処理の対象とする画像を構成するブロックに対応する前記参照フレームのブロックである参照ブロックが、前記参照ブロックを含むマクロブロックの外周と接する場合、前記参照ブロックと前記決定手段により決定された画素数に対応する帯領域とを、前記参照フレームから取得する取得手段と、前記取得手段により取得された参照ブロックと前記帯領域の画像を対象として、フィルタリング処理を行うフィルタリング手段とを有する。

前記取得手段は、前記参照ブロックが前記参照ブロックを含むマクロブロックの外周と接することがない場合、前記参照ブロックを前記参照フレームから取得することができる。

前記決定手段は、前記フィルタリング処理に用いられるフィルタのタップ数を２で除算して得られた値以下の最大の整数と同じ数の画素数を、前記帯領域の幅方向の画素数として決定することができる。

前記フィルタリング手段は、複数の画像の差分画像にローパスフィルタをかける第１のフィルタ手段と、前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像にハイパスフィルタをかける第２のフィルタ手段と、前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像と前記第２のフィルタ手段によりハイパスフィルタがかけられることによって得られた画像とを、複数の画像のうちのいずれかに加算して、マクロブロック単位の予測画像を生成する加算手段とを有することができる。

フレームを構成するマクロブロック単位で復号処理が行われることによって得られた復号済みのフレームを前記参照フレームとして記憶する記憶手段を更に有し、前記取得手段は、前記参照ブロックと前記帯領域とを、前記記憶手段により記憶された参照フレームから取得することができる。

前記参照ブロックを動きベクトルに基づいて特定する特定手段を更に有することができる。

前記フィルタはFIRフィルタであるようにすることができる。

本発明の一側面の画像処理方法は、フィルタリング処理に用いるフィルタのタップ数に応じて、復号済みの参照フレームのブロックである参照ブロックを含むマクロブロックの外側に位置し前記参照ブロックと接する帯領域の幅方向の画素数を決定する決定ステップと、フィルタリング処理の対象とする画像を構成するブロックに対応する前記参照フレームのブロックである参照ブロックが、前記参照ブロックを含むマクロブロックの外周と接する場合、前記参照ブロックと前記決定ステップにおいて決定された画素数に対応する帯領域とを、前記参照フレームから取得する取得ステップと、前記取得ステップにおいて取得された参照ブロックと前記帯領域の画像を対象として、フィルタリング処理を行うフィルタリングステップとを有する。

本発明の一側面においては、フィルタリング処理に用いるフィルタのタップ数に応じて、復号済みの参照フレームのブロックである参照ブロックを含むマクロブロックの外側に位置し参照ブロックと接する帯領域の幅方向の画素数が決定され、フィルタリング処理の対象とする画像を構成するブロックに対応する参照フレームのブロックである参照ブロックが、参照ブロックを含むマクロブロックの外周と接する場合、参照ブロックと決定された画素数に対応する帯領域とが、参照フレームから取得され、取得された参照ブロックと帯領域の画像を対象として、フィルタリング処理が行われる。

本発明の一側面によれば、処理負担を大きくすることなく、精度の高い予測画像を生成することができる。

片方向予測の例を示す図である。双方向予測の例を示す図である。本発明の一実施形態に係る復号装置の構成例を示すブロック図である。第３の予測モードの概念を示す図である。図３の動き予測・補償回路の構成例を示すブロック図である。参照フレームの例を示す図である。参照フレームの他の例を示す図である。図５のフィルタリング回路の構成例を示すブロック図である。復号装置の復号処理について説明するフローチャートである。図９のステップＳ９において行われる動き予測・補償処理について説明するフローチャートである。符号化装置の構成例を示すブロック図である。図１１のモード決定回路の構成例を示すブロック図である。図１１の動き予測・補償回路の構成例を示すブロック図である。符号化装置の符号化処理について説明するフローチャートである。図１４のステップＳ５８において行われるモード決定処理について説明するフローチャートである。図１４のステップＳ６１において行われる動き予測・補償処理について説明するフローチャートである。フィルタリング回路の他の構成例を示すブロック図である。フィルタリング回路のさらに他の構成例を示すブロック図である。３枚の参照フレームを用いる場合の例を示す図である。３枚の参照フレームを用いる場合のフィルタリング回路の構成例を示すブロック図である。画素の補間の例を示す図である。余白領域が付加された動き補償画像を用いた処理の概念を示す図である。動き補償画像の例を示す図である。図５の予測回路の構成例を示すブロック図である。予測回路の動き補償処理について説明するフローチャートである。復号対象のマクロブロックの分割の例を示す図である。参照フレームの例を示す図である。図２７のマクロブロックを構成するブロックの例を示す図である。余白領域の例を示す図である。余白領域の例を示す図である。余白領域の例を示す図である。余白領域の例を示す図である。余白領域の例を示す図である。余白領域の例を示す図である。余白領域の例を示す図である。余白領域の例を示す図である。動き補償画像の例を示す図である。 FIRフィルタの例を示す図である。フィルタリング処理の例を示す図である。図８のフィルタリング回路により生成された予測画像を用いて符号化を行った結果を示す図である。図８のフィルタリング回路により生成された予測画像を用いて符号化を行った他の結果を示す図である。パーソナルコンピュータの構成例を示すブロック図である。本発明を適用したテレビジョン受像機の主な構成例を示すブロック図である。本発明を適用した携帯電話機の主な構成例を示すブロック図である。本発明を適用したハードディスクレコーダの主な構成例を示すブロック図である。本発明を適用したカメラの主な構成例を示すブロック図である。

図３は、本発明の一実施形態に係る復号装置１の構成例を示すブロック図である。

復号装置１に対しては、後述する符号化装置により圧縮符号化された画像情報がケーブル、ネットワーク、またはリムーバブルメディアを介して入力される。圧縮画像情報は、例えば、H.264規格に従って圧縮符号化された画像情報である。

蓄積バッファ１１は、圧縮画像情報として入力されたビットストリームを順に記憶する。蓄積バッファ１１に記憶された情報は、適宜、フレームを構成するマクロブロックなどの所定の単位の画像毎に可逆復号回路１２により読み出される。H.264規格においては、１６×１６画素のマクロブロック単位ではなく、それをさらに分割した８×８画素、４×４画素などのブロック単位で処理を行うことも可能とされている。

可逆復号回路１２は、蓄積バッファ１１から読み出した画像に対して、可変長復号処理、算術復号処理等の、符号化方式に対応する復号処理を施す。可逆復号回路１２は、復号処理を施すことによって得られた、量子化された変換係数を逆量子化回路１３に出力する。

また、可逆復号回路１２は、復号の対象になっている画像のヘッダに含まれる識別フラグに基づいて、その画像がイントラ符号化された画像であるのかインター符号化された画像であるのかを識別する。可逆復号回路１２は、復号の対象になっている画像がイントラ符号化された画像であると判断した場合、その画像のヘッダに格納されたイントラ予測モード情報をイントラ予測回路２２に出力する。イントラ予測モード情報には、処理の単位となるブロックのサイズなどのイントラ予測に関する情報が含まれる。

可逆復号回路１２は、復号の対象になっている画像がインター符号化された情報であると判断した場合、その画像のヘッダに格納された動きベクトルと識別フラグを動き予測・補償回路２１に出力する。識別フラグにより、インター予測によって予測画像を生成する際の予測のモードが識別される。識別フラグは、例えば、マクロブロック単位、フレーム単位で設定される。

予測のモードとして、図１の片方向予測のモード、図２の双方向予測のモードの他に、時間的に一方向または双方向にある複数の参照フレームから抽出した動き補償画像にフィルタリングを施して予測画像を生成する第３の予測モードが用意されている。

図４は、第３の予測モードの概念を示す図である。

図４の例においては、現在のフレーム（予測フレーム）の時刻を基準として、時間的に１時刻前にあるフレームが参照フレームＲ₀とされ、参照フレームＲ₀の１時刻前にあるフレームが参照フレームＲ₁とされている。この場合、第３の予測モードによれば、参照フレームＲ₀，Ｒ₁から抽出された動き補償画像MC₀，MC₁がフィルタリング回路に入力され、フィルタリング回路から出力された画像の画素値が、対象のマクロブロックである予測画像の画素値とされる。

以下、図１を参照して説明したような、一方向にある複数の参照フレームから抽出した動き補償画像のうちのいずれかの動き補償画像の画素値を予測画像の画素値とする予測のモードを単に片方向予測モードという。また、図２を参照して説明したような、双方向にある複数の参照フレームからそれぞれ抽出した動き補償画像の画素値の平均値を予測画像の画素値とする予測のモードを単に双方向予測モードという。

一方向または双方向にある複数の参照フレームから抽出したそれぞれの動き補償画像に対してフィルタリングを施して予測画像の画素値を求める図４に示されるような第３の予測のモードをフィルタリング予測モードという。フィルタリング予測モードについては後に詳述する。

図３の説明に戻り、逆量子化回路１３は、可逆復号回路１２から供給された量子化された状態の変換係数に対して、符号化側における量子化方式に対応する方式で逆量子化を行う。逆量子化回路１３は、逆量子化を行うことによって得られた変換係数を逆直交変換回路１４に出力する。

逆直交変換回路１４は、離散コサイン変換、カルーネン・レーベ変換等の、符号化側における直交変換方式に対応する方式で例えば４次の逆直交変換を逆量子化回路１３から供給された変換係数に対して施し、得られた画像を加算回路１５に出力する。

加算回路１５は、逆直交変換回路１４から供給された復号画像と、動き予測・補償回路２１から、またはイントラ予測回路２２からスイッチ２３を介して供給された予測画像を合成し、合成画像をデブロックフィルタ１６に出力する。

デブロックフィルタ１６は、加算回路１５から供給された画像に含まれるブロック歪を除去し、ブロック歪を除去した画像を出力する。デブロックフィルタ１６から出力された画像は並べ替えバッファ１７とフレームメモリ１９に供給される。

並べ替えバッファ１７は、デブロックフィルタ１６から供給された画像を一時的に記憶する。並べ替えバッファ１７は、記憶している例えばマクロブロック単位の画像から各フレームを生成し、生成したフレームを表示順などの所定の順番に並べ替えてD/A(Digital/Analog)変換回路１８に出力する。

D/A変換回路１８は、並べ替えバッファ１７から供給された各フレームに対してD/A変換を施し、各フレームの信号を外部に出力する。

フレームメモリ１９は、デブロックフィルタ１６から供給された画像を一時的に記憶する。フレームメモリ１９に記憶された情報は、スイッチ２０を介して、動き予測・補償回路２１またはイントラ予測回路２２に供給される。

スイッチ２０は、予測画像をインター予測により生成する場合、端子ａ₁に接続し、イントラ予測により生成する場合、端子ｂ₁に接続する。スイッチ２０の切り替えは例えば制御回路３１により制御される。

動き予測・補償回路２１は、可逆復号回路１２から供給された識別フラグに従って予測モードを決定し、フレームメモリ１９に記憶されている復号済みのフレームの中から、参照フレームとして用いるフレームを予測モードに応じて選択する。動き予測・補償回路２１は、参照フレームを構成するマクロブロックの中から、対象とする予測画像に対応するマクロブロックを可逆復号回路１２から供給された動きベクトルに基づいて決定し、決定したマクロブロックを動き補償画像として抽出する。動き予測・補償回路２１は、動き補償画像の画素値から予測画像の画素値を予測モードに応じて求め、画素値を求めた予測画像を、スイッチ２３を介して加算回路１５に出力する。

イントラ予測回路２２は、可逆復号回路１２から供給されたイントラ予測モード情報に従ってイントラ予測を行い、予測画像を生成する。イントラ予測回路２２は、生成した予測画像を、スイッチ２３を介して加算回路１５に出力する。

スイッチ２３は、動き予測・補償回路２１により予測画像が生成された場合、端子ａ₂に接続し、イントラ予測回路２２により予測画像が生成された場合、端子ｂ₂に接続する。スイッチ２３の切り替えも例えば制御回路３１により制御される。

制御回路３１は、スイッチ２０，２３の接続を切り替えるなどして、復号装置１の全体の動作を制御する。処理対象の画像がイントラ符号化された画像であるのかインター符号化された画像であるのかの識別が制御回路３１により行われるようにしてもよい。

図５は、図３の動き予測・補償回路２１の構成例を示すブロック図である。

図５に示されるように、動き予測・補償回路２１は、予測モード決定回路４１、片方向予測回路４２、双方向予測回路４３、予測回路４４、およびフィルタリング回路４５から構成される。可逆復号回路１２から供給された動きベクトルと識別フラグは予測モード決定回路４１に入力される。

予測モード決定回路４１は、可逆復号回路１２から供給された識別フラグに従って予測モードを決定する。予測モード決定回路４１は、片方向予測によって予測画像の生成を行うことを決定した場合、動きベクトルを片方向予測回路４２に出力し、双方向予測によって予測画像の生成を行うことを決定した場合、動きベクトルを双方向予測回路４３に出力する。また、予測モード決定回路４１は、フィルタリング予測によって予測画像の生成を行うことを決定した場合、動きベクトルを予測回路４４に出力する。

このように、フィルタリング予測を識別することができるようにするため、従来のH.264規格で定められている、片方向予測を表す値、双方向予測を表す値とは異なる値を、識別フラグの値として設定することが可能とされている。なお、識別フラグに従って予測モードが決定されるのではなく、情報量を削減するため、予め決められた方法により予測モードが決定されるようにしてもよい。

片方向予測回路４２は、図１に示されるように、時間的に一方向にある複数のフレームを参照フレームとし、予測画像に対応する参照フレームのマクロブロックを動きベクトルに基づいて決定する。また、片方向予測回路４２は、決定したそれぞれの参照フレームのマクロブロックを動き補償画像としてフレームメモリ１９から読み出し、いずれかの動き補償画像の画素値を予測画像の画素値とすることによって予測画像を生成する。片方向予測回路４２は、予測画像を加算回路１５に出力する。片方向予測回路４２による片方向予測としては、例えばH.264規格で規定された片方向予測が用いられる。

双方向予測回路４３は、図２に示されるように、時間的に双方向にある複数のフレームを参照フレームとし、予測画像に対応する参照フレームのマクロブロックを動きベクトルに基づいて決定する。また、双方向予測回路４３は、決定したそれぞれの参照フレームのマクロブロックを動き補償画像としてフレームメモリ１９から読み出し、読み出した動き補償画像の画素値の平均を予測画像の画素値とすることによって予測画像を生成する。双方向予測回路４３は、予測画像を加算回路１５に出力する。双方向予測回路４３による双方向予測としては、例えばH.264規格で規定された双方向予測が用いられる。

予測回路４４は、時間的に一方向、または双方向にある複数のフレームを参照フレームとして決定する。どのフレームを参照フレームとするのかは、予め決定されているようにしてもよいし、識別フラグとともに符号化側から伝送されてきた情報により指定されるようにしてもよい。

図６は、参照フレームの例を示す図である。

図６の例においては、図４を参照して説明したものと同様に、予測フレームの時刻を基準として、時間的に１時刻前とその１時刻前にある２枚のフレームが参照フレームとされている。２枚の参照フレームのうち、予測フレームにより近い、１時刻前のフレームが参照フレームＲ₀とされ、参照フレームＲ₀の１時刻前のフレームが参照フレームＲ₁とされている。

図７は、参照フレームの他の例を示す図である。

図７の例においては、予測フレームの時刻を基準として、時間的に１時刻前と１時刻後にある２枚のフレームが参照フレームとされている。２枚の参照フレームのうち、予測フレームの１時刻前のフレームが参照フレームＬ₀とされ、１時刻後のフレームが参照フレームＬ₁とされている。

このように、フィルタリング予測においては、時間的に一方向にある複数のフレーム、または双方向にある複数のフレームが参照フレームとして用いられる。

また、予測回路４４は、図６、図７に示されるようにして決定した参照フレームの復号済みのマクロブロックのうち、予測画像に対応するマクロブロックを予測モード決定回路４１から供給された動きベクトルに基づいて決定する。

予測回路４４は、決定したそれぞれの参照フレームのマクロブロックを動き補償画像としてフレームメモリ１９から読み出し、読み出した動き補償画像をフィルタリング回路４５に出力する。動きベクトルが、１６×１６画素などのマクロブロック単位で行われるのではなく、マクロブロックをさらに分割したブロック単位で行われるようにしてもよい。フィルタリング回路４５に対しては、例えばマクロブロック単位の画像が入力される。図５において、予測回路４４からフィルタリング回路４５に向かう矢印として２本の矢印が示されていることは２つの動き補償画像が供給されることを表している。

フィルタリング回路４５は、予測回路４４から供給された動き補償画像を入力としてフィルタリングを行い、フィルタリングを行うことによって得られた予測画像を加算回路１５に出力する。

図８は、フィルタリング回路４５の構成例を示すブロック図である。図８の構成を有するフィルタリング回路４５においては、時間領域の信号に対してフィルタリングが施される。

図８に示されるように、フィルタリング回路４５は、差分計算回路５１、ローパスフィルタ回路５２、ゲイン調整回路５３、ハイパスフィルタ回路５４、ゲイン調整回路５５、加算回路５６、および加算回路５７から構成される。予測回路４４から供給された動き補償画像MC₀は差分計算回路５１と加算回路５７に入力され、動き補償画像MC₁は差分計算回路５１に入力される。

図６に示されるように片方向予測によって予測画像を生成する場合、例えば、予測画像との相関がより高いと考えられる参照フレームＲ₀から抽出された画像が動き補償画像MC₀とされ、参照フレームＲ₁から抽出された画像が動き補償画像MC₁とされる。参照フレームＲ₀から抽出された画像が動き補償画像MC₁とされ、参照フレームＲ₁から抽出された画像が動き補償画像MC₀とされるようにしてもよい。

一方、図７に示されるように双方向予測によって予測画像を生成する場合、例えば、１時刻前の参照フレームＬ₀から抽出された画像が動き補償画像MC₀とされ、１時刻後の参照フレームＬ₁から抽出された画像が動き補償画像MC₁とされる。参照フレームＬ₀から抽出された画像が動き補償画像MC₁とされ、参照フレームＬ₁から抽出された画像が動き補償画像MC₀とされるようにしてもよい。

差分計算回路５１は、動き補償画像MC₀と動き補償画像MC₁の差分を計算し、差分画像をローパスフィルタ回路５２に出力する。差分画像Ｄは下式（３）により表される。

式（３）において、(i,j)は動き補償画像内における画素の相対位置を表し、１６×１６画素のマクロブロック単位で処理が行われるようになされている場合、０≦ｉ≦１６、０≦ｊ≦１６となる。以下、同様とする。

ローパスフィルタ回路５２はFIRフィルタ回路を有する。ローパスフィルタ回路５２は、差分計算回路５１から供給された差分画像Ｄに対してローパスフィルタをかけ、得られた画像をゲイン調整回路５３とハイパスフィルタ回路５４に出力する。ローパスフィルタをかけることによって得られた画像である差分画像Ｄ’は下式（４）により表される。式（４）のLPF（Ｘ）は、入力画像Ｘに対して２次元のFIRフィルタを用いてローパスフィルタをかけることを表す。

ゲイン調整回路５３は、ローパスフィルタ回路５２から供給された差分画像Ｄ’のゲインを調整し、ゲインを調整した画像を加算回路５６に出力する。ゲイン調整回路５３の出力画像Ｘ(i,j)は下式（５）により表される。

ハイパスフィルタ回路５４はFIRフィルタ回路を有する。ハイパスフィルタ回路５４は、ローパスフィルタ回路５２から供給された差分画像Ｄ’に対してハイパスフィルタをかけ、得られた画像をゲイン調整回路５５に出力する。ハイパスフィルタをかけることによって得られた画像である差分画像Ｄ’’は下式（６）により表される。式（６）のHPF（Ｘ）は、入力画像Ｘに対して２次元のFIRフィルタを用いてハイパスフィルタをかけることを表す。

ゲイン調整回路５５は、ハイパスフィルタ回路５４から供給された差分画像Ｄ’’のゲインを調整し、ゲインを調整した画像を加算回路５６に出力する。ゲイン調整回路５５の出力画像Ｙ(i,j)は下式（７）により表される。

式（５）のα、式（７）のβの値としては、例えばα＝０．８、β＝０．２といった値が選ばれるが、予測画素の精度を上げるためにこれ以外の値とされるようにしてもよい。また、入力シーケンスの性質などに応じて適応的に変えるようにしてもよい。

加算回路５６は、ゲイン調整された画像Ｘ(i,j)と画像Ｙ(i,j)を加算し、加算して得られた画像を出力する。加算回路５６の出力画像Ｚ(i,j)は下式（８）により表される。

出力画像Ｚ(i,j)は、動き補償画像MC₀と動き補償画像MC₁の差分、すなわち相関から求められる、画像の高周波成分を表すものになる。

加算回路５７は、動き補償画像MC₀に対して、加算回路５６から供給された出力画像Ｚ(i,j)を足し込み、得られた画像を予測画像として加算回路１５に出力する。加算回路５７の最終出力である予測画像Ｓ(i,j)は下式（９）により表される。

このように、フィルタリング予測モードによれば、高周波成分を表す画像を動き補償画像MC₀に足し込むことによって得られた画像が予測画像として生成される。この予測画像は、単純に双方向予測を行った場合に得られる予測画像と較べて高周波成分をより多く含むものになる。上述したように、複数の動き補償画像の画素値の平均が画素値として求められるから、双方向予測を行うことによって生成される予測画像は高周波成分が失われたものになるといえる。

また、高周波成分を多く含む予測画像が加算回路１５において復号画像に加算されるから、最終的に復号装置１から出力される画像も高周波成分を多く含む高精細なものになる。

さらに、単純に片方向予測を行った場合と較べて、画像の時間相関をより効率的に利用して予測画像を生成することが可能になる。上述したように、複数の動き補償画像のうちのいずれかの動き補償画像の画素値が用いられるから、片方向予測によって生成される予測画像は、画像の時間相関を十分に利用して生成したものとはいえない。

ここで、以上の構成を有する復号装置１の処理について説明する。

はじめに、図９のフローチャートを参照して、復号装置１の復号処理について説明する。

図９の処理は、例えば蓄積バッファ１１に記憶された情報から、１６×１６画素のマクロブロックなどの所定のサイズの画像が可逆復号回路１２により読み出されたときに開始される。図９の各ステップの処理は、適宜、他のステップの処理と並行して、または他のステップと順番を変えて行われる。後述する各フローチャートにおける各ステップの処理も同様である。

ステップＳ１において、可逆復号回路１２は、蓄積バッファ１１から読み出した画像に対して復号処理を施し、量子化された変換係数を逆量子化回路１３に出力する。また、可逆復号回路１２は、復号対象の画像がイントラ符号化された画像である場合、イントラ予測モード情報をイントラ予測回路２２に出力し、インター符号化された画像である場合、動きベクトルと識別フラグを動き予測・補償回路２１に出力する。

ステップＳ２において、逆量子化回路１３は、符号化側における量子化方式に対応する方式で逆量子化を行い、変換係数を逆直交変換回路１４に出力する。

ステップＳ３において、逆直交変換回路１４は、逆量子化回路１３から供給された変換係数に対して逆直交変換を施し、得られた画像を加算回路１５に出力する。

ステップＳ４において、加算回路１５は、逆直交変換回路１４から供給された復号画像と、動き予測・補償回路２１から、またはイントラ予測回路２２から供給された予測画像を合成し、合成画像をデブロックフィルタ１６に出力する。

ステップＳ５において、デブロックフィルタ１６は、フィルタリングを施すことによって、合成画像に含まれるブロック歪を除去し、ブロック歪を除去した画像を出力する。

ステップＳ６において、フレームメモリ１９は、デブロックフィルタ１６から供給された画像を一時的に記憶する。

ステップＳ７において、制御回路３１は、対象の画像がイントラ符号化された画像であるか否かを判定する。

イントラ符号化された画像であるとステップＳ７において判定された場合、ステップＳ８において、イントラ予測回路２２は、イントラ予測を行うことによって予測画像を生成し、生成した予測画像を加算回路１５に出力する。

一方、イントラ符号化された画像ではない、すなわちインター符号化された画像であるとステップＳ７において判定された場合、ステップＳ９において、動き予測・補償回路２１により動き予測・補償処理が行われる。動き予測・補償処理が行われることによって生成された予測画像は加算回路１５に出力される。動き予測・補償処理については図１０のフローチャートを参照して後述する。

ステップＳ１０において、制御回路３１は、１フレーム全体のマクロブロックについて以上の処理を行ったか否かを判定し、処理を行っていないと判定した場合、他のマクロブロックに注目して、ステップＳ１以降の処理を繰り返す。

一方、１フレーム全体のマクロブロックについて処理を行ったとステップＳ１０において判定された場合、ステップＳ１１において、並べ替えバッファ１７は、制御回路３１による制御に従って、生成したフレームをD/A変換回路１８に出力する。

ステップＳ１２において、D/A変換回路１８は、並べ替えバッファ１７から供給されたフレームに対してD/A変換を施し、アナログの信号を外部に出力する。以上の処理が、各フレームを対象として行われる。

次に、図１０のフローチャートを参照して、図９のステップＳ９において行われる動き予測・補償処理について説明する。

ステップＳ２１において、動き予測・補償回路２１の予測モード決定回路４１は、可逆復号回路１２から供給された識別フラグがフィルタリング予測モードで処理を行うことを表しているか否かを判定する。

フィルタリング予測モードで処理を行うことを表していないとステップＳ２１において判定された場合、ステップＳ２２において、片方向予測、または双方向予測が行われ、予測画像が生成される。

すなわち、識別フラグが片方向予測モードで処理を行うことを表している場合、予測モード決定回路４１から片方向予測回路４２に対して動きベクトルが供給され、片方向予測回路４２において片方向予測が行われる。また、識別フラグが双方向予測モードで処理を行うことを表している場合、予測モード決定回路４１から双方向予測回路４３に対して動きベクトルが供給され、双方向予測回路４３において双方向予測が行われる。予測画像が加算回路１５に出力された後、図９のステップＳ９に戻り、それ以降の処理が行われる。

一方、フィルタリング予測モードで処理を行うことを表しているとステップＳ２１において判定された場合、ステップＳ２３において、予測回路４４は、複数の参照フレームのそれぞれから動き補償画像を抽出し、フィルタリング回路４５に出力する。予測モード決定回路４１から予測回路４４に対して動きベクトルが供給され、それが用いられて動き補償画像が抽出される。

ステップＳ２４において、フィルタリング回路４５の差分計算回路５１は、動き補償画像MC₀と動き補償画像MC₁の差分を計算し、差分画像をローパスフィルタ回路５２に出力する。

ステップＳ２５において、ローパスフィルタ回路５２は、差分計算回路５１から供給された差分画像に対してローパスフィルタをかけ、得られた画像をゲイン調整回路５３とハイパスフィルタ回路５４に出力する。

ステップＳ２６において、ゲイン調整回路５３は、ローパスフィルタ回路５２から供給された画像のゲインを調整し、ゲインを調整した画像を加算回路５６に出力する。

ステップＳ２７において、ハイパスフィルタ回路５４は、ローパスフィルタ回路５２から供給された差分画像に対してハイパスフィルタをかけ、得られた画像をゲイン調整回路５５に出力する。

ステップＳ２８において、ゲイン調整回路５５は、ハイパスフィルタ回路５４から供給された差分画像のゲインを調整し、ゲインを調整した画像を加算回路５６に出力する。

ステップＳ２９において、加算回路５６は、ゲイン調整回路５３から供給された画像とゲイン調整回路５５から供給された画像を加算して画像の高周波成分を求める。求められた高周波成分は加算回路５６から加算回路５７に供給される。

ステップＳ３０において、加算回路５７は、動き補償画像MC₀に対して、加算回路５６から供給された画像（高周波成分）を足し込み、得られた画像を予測画像として加算回路１５に出力する。その後、図９のステップＳ９に戻り、それ以降の処理が行われる。

以上のように、フィルタリング予測によって生成された予測画像を用いて復号が行われることにより、高精細な復号画像を得ることが可能になる。

次に、符号化側の装置の構成と動作について説明する。

図１１は、符号化装置１０１の構成例を示すブロック図である。符号化装置１０１により符号化されることによって得られた圧縮画像情報が、図３の復号装置１に入力される。

A/D変換回路１１１は、入力信号にA/D変換を施し、画像を並べ替えバッファ１１２に出力する。

並べ替えバッファ１１２は、圧縮画像情報のGOP(Group of Pictures)構造に応じてフレームの並べ替えを行い、マクロブロックなどの所定の単位の画像を出力する。並べ替えバッファ１１２から出力された画像は、加算回路１１３、モード決定回路１２３、動き予測・補償回路１２５、およびイントラ予測回路１２６に供給される。

加算回路１１３は、並べ替えバッファ１１２から供給された画像と、動き予測・補償回路１２５、またはイントラ予測回路１２６により生成され、スイッチ１２７を介して供給された予測画像の差を求め、残差を直交変換回路１１４に出力する。予測画像が原画像に近く、ここで求められる残差が少ないほど、残差に割り当てる符号量が少なくて済むことから符号化効率が高いといえる。

直交変換回路１１４は、加算回路１１３から供給された残差に対して、離散コサイン変換、カルーネン・レーベ変換等の直交変換を施し、直交変換を施すことによって得られた変換係数を量子化回路１１５に出力する。

量子化回路１１５は、直交変換回路１１４から供給された変換係数を、レート制御回路１１８による制御に従って量子化し、量子化した変換係数を出力する。量子化回路１１５により量子化された変換係数は可逆符号化回路１１６と逆量子化回路１１９に供給される。

可逆符号化回路１１６は、量子化回路１１５から供給された変換係数を、可変長符号化、算術符号化等の可逆符号化を施すことによって圧縮し、情報を蓄積バッファ１１７に出力する。

また、可逆符号化回路１１６は、モード決定回路１２３から供給された情報に従って識別フラグの値を設定し、識別フラグを画像のヘッダに記述する。可逆符号化回路１１６により記述された識別フラグに基づいて、上述したように、復号装置１において予測モードが決定される。

可逆符号化回路１１６は、動き予測・補償回路１２５またはイントラ予測回路１２６から供給された情報を画像のヘッダに記述することも行う。動き予測・補償回路１２５からは、インター予測を行う際に検出された動きベクトルなどが供給され、イントラ予測回路１２６からは、適用されたイントラ予測モードに関する情報が供給される。

蓄積バッファ１１７は、可逆符号化回路１１６から供給された情報を一時的に記憶し、所定のタイミングで圧縮画像情報として出力する。蓄積バッファ１１７は、発生符号量の情報をレート制御回路１１８に出力する。

レート制御回路１１８は、蓄積バッファ１１７から出力された符号量に基づいて量子化スケールを算出し、算出した量子化スケールで量子化が行われるように量子化回路１１５を制御する。

逆量子化回路１１９は、量子化回路１１５により量子化された変換係数に対して逆量子化を施し、変換係数を逆直交変換回路１２０に出力する。

逆直交変換回路１２０は、逆量子化回路１１９から供給された変換係数に対して逆直交変換を施し、得られた画像をデブロックフィルタ１２１に出力する。

デブロックフィルタ１２１は、局所的に復号された画像に現れるブロック歪みを除去し、ブロック歪みを除去した画像をフレームメモリ１２２に出力する。

フレームメモリ１２２は、デブロックフィルタ１２１から供給された画像を記憶する。フレームメモリ１２２に記憶された画像はモード決定回路１２３により適宜読み出される。

モード決定回路１２３は、フレームメモリ１２２に記憶されている画像と並べ替えバッファ１１２から供給された原画像に基づいて、イントラ符号化を行うか、インター符号化を行うかを決定する。また、モード決定回路１２３は、インター符号化を行うことを決定した場合、片方向予測モード、双方向予測モード、フィルタリング予測モードのうちのいずれかのモードを決定する。モード決定回路１２３は、決定結果を表す情報をモード情報として可逆符号化回路１１６に出力する。

モード決定回路１２３は、インター符号化を行うことを決定した場合、フレームメモリ１２２に記憶されている、局所的に復号して得られたフレームを、スイッチ１２４を介して動き予測・補償回路１２５に出力する。

また、モード決定回路１２３は、イントラ符号化を行うことを決定した場合、フレームメモリ１２２に記憶されている、局所的に復号して得られたフレームをイントラ予測回路１２６に出力する。

スイッチ１２４は、インター符号化を行う場合、端子ａ₁₁に接続し、イントラ符号化を行う場合、端子ｂ₁₁に接続する。スイッチ１２４の切り替えは例えば制御回路１３１により制御される。

動き予測・補償回路１２５は、並べ替えバッファ１１２から供給された原画像と、フレームメモリ１２２から読み出された参照フレームに基づいて動きベクトルを検出し、検出した動きベクトルを可逆符号化回路１１６に出力する。また、動き予測・補償回路１２５は、検出した動きベクトルと参照フレームを用いて動き補償を行うことによって予測画像を生成し、生成した予測画像を、スイッチ１２７を介して加算回路１１３に出力する。

イントラ予測回路１２６は、並べ替えバッファ１１２から供給された原画像と、ローカルデコードされてフレームメモリ１２２に記憶されている参照フレームに基づいてイントラ予測を行い、予測画像を生成する。イントラ予測回路１２６は、生成した予測画像を、スイッチ１２７を介して加算回路１１３に出力し、イントラ予測モード情報を可逆符号化回路１１６に出力する。

スイッチ１２７は、端子ａ₁₂または端子ｂ₁₂に接続し、動き予測・補償回路１２５、またはイントラ予測回路１２６により生成された予測画像を加算回路１１３に出力する。

制御回路１３１は、モード決定回路１２３により決定されたモードに応じてスイッチ１２４，１２７の接続を切り替えるなどして、符号化装置１０１の全体の動作を制御する。

図１２は、図１１のモード決定回路１２３の構成例を示すブロック図である。

図１２に示されるように、モード決定回路１２３は、イントラ予測回路１４１、インター予測回路１４２、予測誤差計算回路１４３、および決定回路１４４から構成される。モード決定回路１２３においては、それぞれ異なる大きさのブロックを対象としてイントラ予測、インター予測が行われ、その結果から、どの予測モードで予測を行うのかが決定される。インター予測については、片方向予測モード、双方向予測モード、フィルタリング予測モードのそれぞれの予測モードでの処理が行われる。並べ替えバッファ１１２から供給された原画像はイントラ予測回路１４１、インター予測回路１４２、および予測誤差計算回路１４３に入力される。

イントラ予測回路１４１は、原画像とフレームメモリ１２２から読み出された画像に基づいてそれぞれ異なるサイズのブロック単位でイントラ予測を行い、生成した予測画像を予測誤差計算回路１４３に出力する。４×４予測回路１５１−１においては、４×４画素のブロック単位でイントラ予測が行われ、８×８予測回路１５１−２においては、８×８画素のブロック単位でイントラ予測が行われる。１６×１６予測回路１５１−３においては、１６×１６画素のブロック単位でイントラ予測が行われる。

インター予測回路１４２の予測回路１６１は、原画像とフレームメモリ１２２から読み出された参照フレームに基づいてそれぞれ異なるサイズのブロック単位で動きベクトルを検出する。また、予測回路１６１は、検出した動きベクトルに基づいて動き補償を行い、予測画像の生成に用いる動き補償画像を出力する。

１６×１６予測回路１６１−１においては、１６×１６画素のブロック単位の画像を対象として処理が行われ、１６×８予測回路１６１−２においては、１６×８画素のブロック単位の画像を対象として処理が行われる。また、４×４予測回路１６１−（ｎ−１）においては、４×４画素のブロック単位の画像を対象として処理が行われる。スキップ／ダイレクト予測回路１６１−ｎにおいては、スキップ予測モード、ダイレクト予測モードで動きベクトルが検出され、検出された動きベクトルを用いて動き補償が行われる。

現在のフレームを基準として、片方向にある複数の参照フレームから抽出された動き補償画像が予測回路１６１の各回路から片方向予測回路１６２に供給される。また、現在のフレームを基準として、双方向にある複数の参照フレームから抽出された動き補償画像が予測回路１６１の各回路から双方向予測回路１６３に供給される。

フィルタリング予測が上述したように片方向にある複数の参照フレームから抽出された動き補償画像を用いて行われる場合、予測回路１６１の各回路からフィルタリング回路１６４に対して、片方向にある参照フレームから抽出された動き補償画像が供給される。フィルタリング予測が双方向にある複数の参照フレームから抽出された動き補償画像を用いて行われる場合、予測回路１６１の各回路からフィルタリング回路１６４に対して、双方向にある参照フレームから抽出された動き補償画像が供給される。

片方向予測回路１６２は、予測回路１６１の各回路から供給されたそれぞれ異なるサイズの動き補償画像を用いて片方向予測を行うことによって予測画像を生成し、生成した予測画像を予測誤差計算回路１４３に出力する。例えば、片方向予測回路１６２は、予測回路１６１−１から供給された、１６×１６画素の複数の動き補償画像のうちのいずれかの画像の画素値を予測画像の画素値とすることによって予測画像を生成する。

双方向予測回路１６３は、予測回路１６１の各回路から供給されたそれぞれ異なるサイズの動き補償画像を用いて双方向予測を行うことによって予測画像を生成し、生成した予測画像を予測誤差計算回路１４３に出力する。例えば、双方向予測回路１６３は、予測回路１６１−１から供給された、１６×１６画素の複数の動き補償画像の画素値の平均値を予測画像の画素値とすることによって予測画像を生成する。

フィルタリング回路１６４は、予測回路１６１の各回路から供給されたそれぞれ異なるサイズの動き補償画像を用いてフィルタリング予測を行うことによって予測画像を生成し、生成した予測画像を予測誤差計算回路１４３に出力する。フィルタリング回路１６４は、復号装置１のフィルタリング回路４５に対応して、図８に示される構成と同じ構成を有している。

例えば、フィルタリング回路１６４は、予測回路１６１−１から供給された１６×１６画素の動き補償画像MC₀，MC₁を対象として予測画像を生成する場合、動き補償画像MC₀，MC₁の差分を求め、求めた差分画像にローパスフィルタをかける。また、フィルタリング回路１６４は、ローパスフィルタの出力に対してハイパスフィルタをかけ、その出力のゲインを調整した画像と、ローパスフィルタの出力のゲインを調整した画像とを加算する。フィルタリング回路１６４は、高周波成分を表す加算結果の画像を動き補償画像MC₀に加算することによって予測画像を生成し、生成した予測画像を予測誤差計算回路１４３に出力する。

予測誤差計算回路１４３は、イントラ予測回路１４１の各回路から供給されたそれぞれの予測画像について、原画像との差を求め、求めた差を表す残差信号を決定回路１４４に出力する。また、予測誤差計算回路１４３は、インター予測回路１４２の片方向予測回路１６２、双方向予測回路１６３、フィルタリング回路１６４から供給されたそれぞれの予測画像について、原画像との差を求め、求めた差を表す残差信号を決定回路１４４に出力する。

決定回路１４４は、予測誤差計算回路１４３から供給された残差信号の強度を測定し、原画像との差の少ない予測画像の生成に用いられた予測方法を、符号化に用いる予測画像を生成するための予測方法として決定する。決定回路１４４は、決定結果を表す情報をモード情報として可逆符号化回路１１６に出力する。モード情報には、どのサイズのブロックを処理の単位とするのかを表す情報なども含まれる。

また、決定回路１４４は、インター予測によって予測画像を生成することを決定した場合（インター符号化を行うことを決定した場合）、フレームメモリ１２２から読み出した参照フレームを、モード情報とともに動き予測・補償回路１２５に出力する。決定回路１４４は、イントラ予測によって予測画像を生成することを決定した場合（イントラ符号化を行うことを決定した場合）、フレームメモリ１２２から読み出したイントラ予測に用いる画像を、モード情報とともにイントラ予測回路１２６に出力する。

図１３は、図１１の動き予測・補償回路１２５の構成例を示すブロック図である。

図１３に示されるように、動き予測・補償回路１２５は、動きベクトル検出回路１８１、片方向予測回路１８２、双方向予測回路１８３、予測回路１８４、およびフィルタリング回路１８５から構成される。予測モード決定回路４１に替えて動きベクトル検出回路１８１が設けられている点を除いて、動き予測・補償回路１２５は、図５に示される動き予測・補償回路２１と同様の構成を有する。

動きベクトル検出回路１８１は、並べ替えバッファ１１２から供給された原画像と、モード決定回路１２３から供給された参照フレームに基づいて、ブロックマッチングなどを行うことによって動きベクトルを検出する。動きベクトル検出回路１８１は、モード決定回路１２３から供給されたモード情報を参照し、参照フレームとともに動きベクトルを片方向予測回路１８２、双方向予測回路１８３、予測回路１８４のいずれかに出力する。

動きベクトル検出回路１８１は、片方向予測が選択されている場合、参照フレームとともに動きベクトルを片方向予測回路１８２に出力し、双方向予測を行うことが選択されている場合、それらの情報を双方向予測回路１８３に出力する。動きベクトル検出回路１８１は、フィルタリング予測を行うことが選択されている場合、参照フレームとともに動きベクトルを予測回路１８４に出力する。

片方向予測回路１８２は、図５の片方向予測回路４２と同様に、片方向予測を行うことによって予測画像を生成する。片方向予測回路１８２は、生成した予測画像を加算回路１１３に出力する。

双方向予測回路１８３は、図５の双方向予測回路４３と同様に、双方向予測を行うことによって予測画像を生成する。双方向予測回路１８３は、生成した予測画像を加算回路１１３に出力する。

予測回路１８４は、図５の予測回路４４と同様に、２枚などの複数の参照フレームからそれぞれ動き補償画像を抽出し、抽出した複数の動き補償画像をフィルタリング回路１８５に出力する。

フィルタリング回路１８５は、図５のフィルタリング回路４５と同様に、フィルタリング予測を行うことによって予測画像を生成する。フィルタリング回路１８５は、生成した予測画像を加算回路１１３に出力する。なお、フィルタリング回路１８５は図８に示されるフィルタリング回路４５の構成と同様の構成を有している。以下、適宜、図８に示されるフィルタリング回路４５の構成をフィルタリング回路１８５の構成として引用して説明する。

フィルタリング予測によって生成された予測画像は、片方向予測、双方向予測によって生成された予測画像と較べて高周波成分を多く含み、原画像との差が少ない画像になる。従って、残差に割り当てる符号量が少なくて済むため、符号化効率を上げることが可能になる。

また、参照フレームの数が少なくとも２枚あればフィルタリング予測を行うことができるため、そのように符号化効率を上げるといったことを、処理を複雑にすることなく実現することが可能になる。例えば、インター予測で用いる参照フレームの数を多くして精度の高い予測画像を生成し、それを用いることによっても原画像との残差を小さくし、符号化効率を上げることができるが、この場合、参照フレームの数が多くなることから、処理が複雑になる。

なお、予測方法を選択する際、予測に必要な動きベクトルや符号化モードといった情報の符号量を考慮し、符号量に応じた重みを残差信号の強度に加えて最適な予測方法が選択されるようにしてもよい。これにより、より一層、符号化効率を改善させることが可能になる。また、符号化処理の簡略化のために、入力された原画像の時間・空間方向の特徴量を利用して、適応的に予測方法が選択されるようにしてもよい。

次に、以上のような構成を有する符号化装置１０１の処理について説明する。

図１４のフローチャートを参照して、符号化装置１０１の符号化処理について説明する。この処理は、マクロブロックなどの所定の単位の画像が並べ替えバッファ１１２から出力されたときに開始される。

ステップＳ５１において、加算回路１１３は、並べ替えバッファ１１２から供給された画像と、動き予測・補償回路１２５、またはイントラ予測回路１２６により生成された予測画像の差を求め、残差を直交変換回路１１４に出力する。

ステップＳ５２において、直交変換回路１１４は、加算回路１１３から供給された残差に対して直交変換を施し、変換係数を量子化回路１１５に出力する。

ステップＳ５３において、量子化回路１１５は、直交変換回路１１４から供給された変換係数を量子化し、量子化した変換係数を出力する。

ステップＳ５４において、逆量子化回路１１９は、量子化回路１１５により量子化された変換係数に対して逆量子化を施し、変換係数を逆直交変換回路１２０に出力する。

ステップＳ５５において、逆直交変換回路１２０は、逆量子化回路１１９から供給された変換係数に対して逆直交変換を施し、得られた画像をデブロックフィルタ１２１に出力する。

ステップＳ５６において、デブロックフィルタ１２１は、フィルタリングを施すことによってブロック歪みを除去し、ブロック歪みを除去した画像をフレームメモリ１２２に出力する。

ステップＳ５７において、フレームメモリ１２２は、デブロックフィルタ１２１から供給された画像を記憶する。

ステップＳ５８において、モード決定回路１２３によりモード決定処理が行われる。モード決定処理により、どの予測モードで予測画像を生成するのかが決定される。モード決定処理については図１５のフローチャートを参照して後述する。

ステップＳ５９において、制御回路１３１は、モード決定回路１２３による決定に基づいて、イントラ予測を行うか否かを判定する。

イントラ予測を行うとステップＳ５９において判定された場合、ステップＳ６０において、イントラ予測回路１２６はイントラ予測を行い、予測画像を加算回路１１３に出力する。

一方、イントラ予測を行わない、すなわちインター予測を行うとステップＳ５９において判定された場合、ステップＳ６１において、動き予測・補償処理が動き予測・補償回路１２５により行われ、予測画像が加算回路１１３に出力される。動き予測・補償処理については図１６のフローチャートを参照して後述する。

ステップＳ６２において、可逆符号化回路１１６は、量子化回路１１５から供給された変換係数を圧縮し、蓄積バッファ１１７に出力する。また、可逆符号化回路１１６は、モード決定回路１２３から供給された情報に従って識別フラグを画像のヘッダに記述したり、動き予測・補償回路１２５から供給された動きベクトルを画像のヘッダに記述したりする。

ステップＳ６３において、蓄積バッファ１１７は、可逆符号化回路１１６から供給された情報を一時的に記憶する。

ステップＳ６４において、制御回路３１は、１フレーム全体のマクロブロックについて以上の処理を行ったか否かを判定し、処理を行っていないと判定した場合、他のマクロブロックに注目して、ステップＳ５１以降の処理を繰り返す。

一方、１フレーム全体のマクロブロックについて処理を行ったとステップＳ６４において判定された場合、ステップＳ６５において、蓄積バッファ１１７は制御回路１３１による制御に従って圧縮画像情報を出力する。以上の処理が、各フレームを対象として行われる。

次に、図１５のフローチャートを参照して、図１４のステップＳ５８において行われるモード決定処理について説明する。

ステップＳ８１において、イントラ予測回路１４１、インター予測回路１４２は、それぞれ、異なる大きさのブロックを対象としてイントラ予測、インター予測を行い、予測画像を生成する。生成された予測画像は予測誤差計算回路１４３に供給される。

ステップＳ８２において、予測誤差計算回路１４３は、イントラ予測回路１４１の各回路、インター予測回路１４２の片方向予測回路１６２、双方向予測回路１６３、フィルタリング回路１６４から供給されたそれぞれの予測画像について、原画像との差を求める。予測誤差計算回路１４３は残差信号を決定回路１４４に出力する。

ステップＳ８３において、決定回路１４４は、予測誤差計算回路１４３から供給された残差信号の強度に基づいて、加算回路１１３に供給する予測画像を生成するための予測方法を決定する。

ステップＳ８４において、決定回路１４４は、決定した予測方法に関する情報であるモード情報を可逆符号化回路１１６に出力する。その後、図１４のステップＳ５８に戻り、それ以降の処理が行われる。

次に、図１６のフローチャートを参照して、図１４のステップＳ６１において行われる動き予測・補償処理について説明する。

ステップＳ９１において、動きベクトル検出回路１８１は、原画像と参照フレームに基づいて動きベクトルを検出する。

ステップＳ９２において、動きベクトル検出回路１８１は、モード決定回路１２３によりフィルタリング予測モードで処理を行うことが決定されたか否かを判定する。

フィルタリング予測モードで処理を行うことが決定されていないとステップＳ９２において判定された場合、ステップＳ９３において、片方向予測、または双方向予測が行われ、予測画像が生成される。

すなわち、片方向予測モードで処理を行うことが決定された場合、動きベクトル検出回路１８１から片方向予測回路１８２に対して動きベクトルが供給され、片方向予測回路１８２において片方向予測が行われる。また、双方向予測モードで処理を行うことが決定された場合、動きベクトル検出回路１８１から双方向予測回路１８３に対して動きベクトルが供給され、双方向予測回路１８３において双方向予測が行われる。予測画像が加算回路１１３に出力された後、図１４のステップＳ６１に戻り、それ以降の処理が行われる。

一方、フィルタリング予測モードで処理を行うことが決定されたとステップＳ９２において判定された場合、ステップＳ９４において、予測回路１８４は、複数の参照フレームのそれぞれから動き補償画像を抽出し、フィルタリング回路１８５に出力する。動きベクトル検出回路１８１から予測回路１８４に対して動きベクトルが供給され、それが用いられて動き補償画像が抽出される。

ステップＳ９５において、フィルタリング回路１８５の差分計算回路５１（図８）は、動き補償画像MC₀と動き補償画像MC₁の差分を計算し、差分画像をローパスフィルタ回路５２に出力する。

ステップＳ９６において、フィルタリング回路１８５のローパスフィルタ回路５２は、差分計算回路５１から供給された差分画像に対してローパスフィルタをかけ、得られた画像をゲイン調整回路５３とハイパスフィルタ回路５４に出力する。

ステップＳ９７において、フィルタリング回路１８５のゲイン調整回路５３は、ローパスフィルタ回路５２から供給された差分画像のゲインを調整し、ゲインを調整した画像を加算回路５６に出力する。

ステップＳ９８において、フィルタリング回路１８５のハイパスフィルタ回路５４は、ローパスフィルタ回路５２から供給された差分画像に対してハイパスフィルタをかけ、得られた画像をゲイン調整回路５５に出力する。

ステップＳ９９において、フィルタリング回路１８５のゲイン調整回路５５は、ハイパスフィルタ回路５４から供給された画像のゲインを調整し、ゲインを調整した画像を加算回路５６に出力する。

ステップＳ１００において、フィルタリング回路１８５の加算回路５６は、ゲイン調整回路５３から供給された画像とゲイン調整回路５５から供給された画像を加算して高周波成分を求める。求められた高周波成分は加算回路５６から加算回路５７に対して供給される。

ステップＳ１０１において、フィルタリング回路１８５の加算回路５７は、動き補償画像MC₀に対して、加算回路５６から供給された画像（高周波成分）を足し込み、得られた画像を予測画像として加算回路１１３に出力する。その後、図１４のステップＳ６１に戻り、それ以降の処理が行われる。

以上のように、フィルタリング予測によって生成された予測画像を用いて符号化を行うことにより、符号化効率を上げることが可能になる。

以上においては、フィルタリング回路４５，１８５は図８に示されるような構成を有するものとしたが、この構成は適宜変更可能である。

図１７は、フィルタリング回路４５の他の構成例を示すブロック図である。図８に示される構成と対応する構成には同じ符号を付してある。重複する説明については適宜省略する。

図１７の差分計算回路５１は、動き補償画像MC₀と動き補償画像MC₁の差分を計算し、差分画像をローパスフィルタ回路５２に出力する。

ローパスフィルタ回路５２は、差分計算回路５１から供給された差分画像に対してローパスフィルタをかけ、得られた画像を加算回路５７に出力する。

加算回路５７は、動き補償画像MC₀に対して、ローパスフィルタ回路５２から供給された画像を足し込み、得られた画像を予測画像として出力する。

図１７に示されるような構成を用いることにより、図８の構成を用いた場合と較べて処理量を減らすことができ、高速な動作を実現する可能になる。

図１８は、フィルタリング回路４５のさらに他の構成例を示すブロック図である。図８に示される構成と対応する構成には同じ符号を付してある。重複する説明については適宜省略する。

図１８のフィルタリング回路４５においては、時間領域の信号ではなく周波数領域の信号を対象としてフィルタリングが施される。図８、図１７に示されるフィルタリング回路４５は、いずれも、時間領域の信号に対してフィルタリングを施すものである。

図１８の差分計算回路５１は、動き補償画像MC₀と動き補償画像MC₁の差分を計算し、差分画像を直交変換回路２０１に出力する。

直交変換回路２０１は、差分画像に対して、DCT(Discrete Cosine Transform)、Hadamard変換、KLT(Karhunen Loeve Transformation)に代表される直交変換を施し、直交変換後の信号をバンドパスフィルタ回路２０２に出力する。直交変換を行い、周波数領域の信号に対してフィルタリングを施すようにすることにより、時間領域の信号に対してフィルタリングを施す場合に較べて、より柔軟に精度の高いフィルタ処理が可能になる。

DCTを直交変換として用いた場合、直交変換後の出力DFは下式（１０）により表される。式（１０）のDCT（Ｘ）は、信号Ｘに対して２次元のDCT処理を行うことを表す。

バンドパスフィルタ回路２０２は、直交変換回路２０１の出力に対してフィルタリングを施し、所定の帯域の信号を出力する。

ゲイン調整回路２０３は、バンドパスフィルタ回路２０２の出力のゲインをα倍して調整するとともに、周波数成分の調整を行う。ゲイン調整回路２０３の出力XFは下式（１１）により表される。式（１１）のBPF（Ｘ）は、信号Ｘに対してバンドパスフィルタ処理を行うことを表す。

逆直交変換回路２０４は、直交変換回路２０１による直交変換に対応する方式で逆直交変換を行い、ゲイン調整回路２０３から供給された周波数領域の信号を時間領域の信号に変換する。例えば、直交変換回路２０１においてDCTが直交変換として用いられた場合、逆直交変換回路２０４においてはIDCTが行われる。逆直交変換回路２０４の出力Ｘは下式（１２）により表される。式（１２）のIDCT（Ｘ）は、信号Ｘに対して２次元のIDCT処理を行うことを表す。

加算回路５７は、動き補償画像MC₀に対して、逆直交変換回路２０４から供給され信号Ｘを時間領域で足し込み、得られた画像を予測画像として出力する。加算回路５７の最終出力である予測画像Ｓ(i,j)は下式（１３）により表される。

このように、周波数領域の信号に対してフィルタリングを行うことによっても、精度の高い予測画像を生成することができる。

また、以上においては、２枚の参照フレームが用いられてフィルタリング予測が行われるものとしたが、それ以上の枚数のフレームが参照フレームとして用いられるようにしてもよい。

図１９は、３枚の参照フレームを用いる場合の例を示す図である。

図１９の例においては、予測フレームの時刻を基準として、時間的に１時刻前とその１時刻前とさらにその１時刻前にある３枚のフレームが参照フレームとされている。予測フレームにより近い、１時刻前のフレームが参照フレームＲ₀とされ、参照フレームＲ₀の１時刻前のフレームが参照フレームＲ₁とされ、参照フレームＲ₁の１時刻前のフレームが参照フレームＲ₂とされている。

図２０は、３枚の参照フレームを用いる場合のフィルタリング回路の構成例を示すブロック図である。

図２０に示されるように、フィルタリング回路２１１は、フィルタリング回路２２１とフィルタリング回路２２２から構成される。フィルタリング回路２２１とフィルタリング回路２２２は、それぞれ、図８、図１７、図１８に示されるような構成を有している。すなわち、フィルタリング回路２１１は、２入力１出力のときに用いるフィルタリング回路４５をカスケード接続することによって、３入力１出力の回路として動作するようになされている。

ここでは、参照フレームＲ₀から抽出された動き補償画像を動き補償画像MC₀、参照フレームＲ₁から抽出された動き補償画像を動き補償画像MC₁、参照フレームＲ₂から抽出された動き補償画像を動き補償画像MC₂として説明する。動き補償画像MC₁，MC₂はフィルタリング回路２２１に入力され、動き補償画像MC₀はフィルタリング回路２２２に入力される。

フィルタリング回路２２１は、動き補償画像MC₁，MC₂をそれぞれ、図８等における動き補償画像MC₀，MC₁としてフィルタリングを行い、フィルタリングの結果である中間出力Ｘをフィルタリング回路２２２に出力する。

フィルタリング回路２２１は、中間出力Ｘと動き補償画像MC₀をそれぞれ、図８等における動き補償画像MC₀，MC₁としてフィルタリングを行い、フィルタリングの結果を予測画像として出力する。

このような３枚の参照フレームを扱うフィルタリング回路２１１が、フィルタリング回路４５に替えて図３の復号装置１や図１１の符号化装置１０１に設けられるようにすることも可能である。

なお、フィルタリング回路２２１とフィルタリング回路２２２が同じ構成を有している必要はなく、一方は図８に示される構成を有し、他方は図１７に示される構成を有するといったように、それぞれの構成が異なるようにしてもよい。また、フィルタリングの前後における入出力特性を考慮して、フィルタに用いるパラメータが異なるようにすることも可能である。

時間的に一方にある参照フレームから抽出された動き補償画像ではなく、前後にある３枚の参照フレームから抽出された動き補償画像を対象として、フィルタリング回路２１１においてフィルタリングが施されるようにしてもよい。

なお、図７を参照して説明した場合を含めて、予測フレームの時刻を基準として前後にあるフレームを参照フレームとして用いる場合、フィルタリング時のタップ係数などのパラメータを、参照フレームの時間方向や距離に応じて動的に変更するようにしてもよい。

符号化装置１０１から復号装置１に対する圧縮画像情報の伝送は、光ディスク、磁気ディスク、フラッシュメモリなどの記録メディア、衛星放送、ケーブルTV、インターネット、携帯電話機ネットワークなどの各種の媒体を介して行われる。

ここで、フィルタリング予測における動き補償について説明する。以下、フィルタリング回路４５に動き補償画像を出力する復号装置１の予測回路４４の構成と動作について説明するが、フィルタリング回路に動き補償画像を出力する図１２の予測回路１６１、図１３の予測回路１８４についても同様である。

H.264規格で符号化された画像を復号する際の動き補償は、１６×１６画素のマクロブロック単位ではなく、マクロブロックをさらに分割したブロック単位で行われる。すなわち、復号対象のマクロブロックを分割した各ブロックに注目し、動きベクトルに基づいて、参照フレームの対応するブロックの各画素の画素値を注目ブロックの各画素の画素値とすることによって動き補償が行われる。また、上述したフィルタリング予測においては、そのような動き補償が行われることによって得られた動き補償画像を入力画像として、FIRフィルタを用いたフィルタリング処理が行われる。

このとき、フィルタリング処理の単位のブロックのサイズが小さいため、その影響を無視することができなくなる。例えば、フィルタリング処理によって生成しようとする予測画像の端の方にある画素を生成するために、FIRフィルタのタップ数に応じて、入力画像である動き補償画像の画素を補間する必要がある。

図２１は、画素の補間の例を示す図である。

図２１の上段に示される１６×１６画素の入力画像は、動き補償によって得られた各ブロックを集めることによって構成される動き補償画像である。下段に示される１６×１６画素の出力画像は、上段の動き補償画像に対してFIRフィルタを用いたフィルタリング処理を施して得られた画素からなる予測画像である。ここで、FIRフィルタのタップ数は５であるものとする。予測画像のある１画素を生成するには、動き補償画像の５画素が必要になる。

例えば、予測画像の左下端にある画素Ｐ１を生成する場合、対応する動き補償画像の画素である左下端の画素ｐ１を中心として横方向に並ぶ５画素が必要になるが、画素ｐ１の左側には点線で示されるように画素がない。また、予測画像の右下端にある画素Ｐ１６を生成する場合、対応する動き補償画像の画素である右下端の画素ｐ１６を中心として横方向に並ぶ５画素が必要になるが、画素ｐ１６の右側には点線で示されるように画素がない。

従って、画素ｐ１，ｐ１６をコピーして不足する画素を補間したり、境界を中心として対称の位置にある画素で補間したりした後にフィルタリング処理を行うことが考えられるが、点線で示される画素の真の値とは異なるため、予測画像の画素値の精度が劣化する。このような劣化を避けるには真の画素値を用いる必要があるが、既存の動き補償ではブロックサイズと同じサイズの領域しか参照フレームから取得されないため、このような補間処理が必要になる。

そこで、予測回路４４においては、FIRフィルタのタップ数に応じた数の画素だけ余白を付けた形のマクロブロックを生成するように動き補償が行われる。

図２２は、余白領域が付加された動き補償画像を用いた処理の概念を示す図である。

図２２の矢印Ａ１に示されるように、参照フレームからは、１６×１６画素のマクロブロック単位の画像に余白領域を付けた画像が動き補償画像として抽出され、フィルタリング処理の入力画像とされる。

図２３は、動き補償画像の例を示す図である。

図２３に示されるように、１６×１６画素の画像の周りに、いわばａ画素の幅の帯を付けるようにして拡大させた（１６＋２ａ）×（１６＋２ａ）画素の画像が動き補償画像として参照フレームから抽出される。ａはFIRフィルタのタップ数に応じて決まる値である。

このような動き補償画像を入力画像としてフィルタリング処理が行われ、図２２の矢印Ａ２に示されるように、１６×１６画素の予測画像がフィルタリング処理の出力画像として出力される。予測画像は、図３の加算回路１５において逆直交変換回路１４の出力画像と加算され、加算結果の画像が復号フレームを構成するマクロブロックとして用いられる。

このように、予測回路４４における動き補償においては、参照フレームは対象のフレームに対して時間的に過去または未来の近傍にあるフレームであり、そのフレーム全体が動き補償に利用可能であるという事実が利用される。

FIRフィルタのタップ数に応じた余白領域を付けた動き補償画像をフィルタリング処理に用いることにより、予測画像の端にある画素を生成する場合であっても、実際の画素の値を用いて処理を行うことができ、予測画像の画素値の精度を上げることが可能になる。すなわち、フィルタリング処理を行うために画素の補間を行う必要がない。

予測画像の画素値の精度を上げることができることにより、最終的に、復号装置１においては復号フレームの精度を上げることができ、符号化装置１０１においては原画像との残差を減らし、符号化効率を上げることができる。

図２４は、予測回路４４の構成例を示すブロック図である。

図２４に示されるように、予測回路４４は、ブロック分割回路２３１、切り出し回路２３２、およびバッファ２３３から構成される。図５の予測モード決定回路４１から供給された動きベクトルは切り出し回路２３２に入力される。

ブロック分割回路２３１は、復号対象のマクロブロックを分割し、各ブロックの領域の情報を切り出し回路２３２に出力する。

切り出し回路２３２は、復号対象のマクロブロックを構成する各ブロックに注目し、予測モード決定回路４１から供給された動きベクトルに基づいて、注目ブロックに対応する参照フレームのブロックを特定する。参照フレームのブロックは注目ブロックと同じサイズのブロックである。以下、適宜、動きベクトルに基づいて決定される、注目ブロックに対応する参照フレームのブロックを参照ブロックという。

また、切り出し回路２３２は、特定した参照ブロックが、その参照ブロックを含むマクロブロックの外周と接するものであるかを判断する。切り出し回路２３２は、参照ブロックがマクロブロックの外周と接するものではないと判断した場合、参照ブロックの情報をフレームメモリ１９から読み出し、注目ブロックの画素の画素値としてバッファ２３３に出力する。

切り出し回路２３２は、参照ブロックがマクロブロックの外周と接するものであると判断した場合、参照ブロックの情報と、参照ブロックを含むマクロブロックの外側にある、参照ブロックと接する帯領域である余白領域の情報をフレームメモリ１９から読み出し、バッファ２３３に出力する。

バッファ２３３は、全てのブロックが注目されることにより、復号対象のマクロブロックに余白領域を付けた図２３に示されるような動き補償画像の情報が取得された場合、それをフィルタリング回路４５に出力する。フィルタリング予測においては複数の動き補償画像が用いられるが、それぞれの動き補償画像が同様にして予測回路４４により生成される。

ここで、図２５のフローチャートを参照して、予測回路４４の動き補償処理について説明する。図２５に示される処理がそれぞれの動き補償画像を生成するために行われる。

ステップＳ１において、ブロック分割回路２３１は、復号対象のマクロブロックを分割し、各ブロックの領域の情報を切り出し回路２３２に出力する。

図２６は、復号対象のマクロブロックの分割の例を示す図である。

図２６の例においては、１６×１６画素のマクロブロックがブロックＢ１１乃至Ｂ４４の１６のブロックに分割されている。

ステップＳ２において、切り出し回路２３２は、１つのブロックに注目する。

ステップＳ３において、切り出し回路２３２は参照フレームを決定する。

ステップＳ４において、切り出し回路２３２は、予測モード決定回路４１から供給された動きベクトルの精度が小数精度であるか否かを判定する。

小数精度ではないとステップＳ４において判定した場合、ステップＳ５において、切り出し回路２３２は、整数精度の動きベクトルに基づいて、注目ブロックに対応する参照ブロックの位置を特定する。

一方、小数精度であるとステップＳ４において判定した場合、ステップＳ６において、切り出し回路２３２は、規格で定められた補間フィルタを用いて画素の補間を行い、小数精度の動きベクトルで指定される位置にある参照ブロックを特定する。

参照ブロックを特定した後、ステップＳ７において、切り出し回路２３２は、参照ブロックの一辺が、その参照ブロックを含むマクロブロックの外周に接するか否かを判定する。

ここでの判定は、下式（１４）乃至（１７）の条件に基づいて行われる。少なくともいずれかの条件を満たす場合、参照ブロックの一辺がマクロブロックの外周に接すると判定され、いずれの条件も満たさない場合、参照ブロックの一辺がマクロブロックの外周に接していないと判定される。（bk_pos_x，bk_pos_y）は参照ブロックの左上頂点の位置を表し、（bk_width，bk_height）は参照ブロックの幅と高さを表す。（MB_pos_x，MB_pos_y）は参照ブロックを含むマクロブロックの左上頂点の位置を表す。

図２７は、参照フレームの例を示す図である。

図２７の例においては、マクロブロックMB１１乃至MB３３の９つのマクロブロックが示されている。ここでは、復号対象のマクロブロックを分割した各ブロックに対応する参照ブロックが、太線Ｌで囲んで示すマクロブロックMB２２を構成する各ブロックである場合について説明する。

図２８は、図２７のマクロブロックMB２２を構成するブロックの例を示す図である。図２８のブロックｂ１１乃至ｂ４４が、それぞれ、復号対象のマクロブロックを構成する図２６のブロックＢ１１乃至Ｂ４４の参照ブロックとなる。

例えば、図２６のブロックＢ１１が注目されている場合、ブロックＢ１１の参照ブロックである図２８のブロックｂ１１は、式（１４）、（１５）の条件を満たし、マクロブロックMB２２の外周に接していると判定される。

図２６のブロックＢ１２，Ｂ１３が注目されている場合、これらの参照ブロックである図２８のブロックｂ１２，ｂ１３は、いずれも式（１５）の条件を満たし、マクロブロックMB２２の外周に接していると判定される。

図２６のブロックＢ１４が注目されている場合、ブロックＢ１４の参照ブロックである図２８のブロックｂ１４は、式（１５）、（１６）の条件を満たし、マクロブロックMB２２の外周に接していると判定される。

図２６のブロックＢ２１，Ｂ３１が注目されている場合、これらの参照ブロックである図２８のブロックｂ２１，ｂ３１は、いずれも式（１４）の条件を満たし、マクロブロックMB２２の外周に接していると判定される。

図２６のブロックＢ２４，Ｂ３４が注目されている場合、これらの参照ブロックである図２８のブロックｂ２４，ｂ３４は、いずれも式（１６）の条件を満たし、マクロブロックMB２２の外周に接していると判定される。

図２６のブロックＢ４１が注目されている場合、ブロックＢ４１の参照ブロックである図２８のブロックｂ４１は、式（１４）、（１７）の条件を満たし、マクロブロックMB２２の外周に接していると判定される。

図２６のブロックＢ４２，Ｂ４３が注目されている場合、これらの参照ブロックである図２８のブロックｂ４２，ｂ４３は、いずれも式（１７）の条件を満たし、マクロブロックMB２２の外周に接していると判定される。

図２６のブロックＢ４４が注目されている場合、ブロックＢ４４の参照ブロックである図２８のブロックｂ４４は、式（１６）、（１７）の条件を満たし、マクロブロックMB２２の外周に接していると判定される。

図２６のブロックＢ２２，Ｂ２３，Ｂ３２，Ｂ３３が注目されている場合、これらの参照ブロックである図２８のブロックｂ２２，ｂ２３，ｂ３２，ｂ３３は、いずれの条件も満たさず、マクロブロックMB２２の外周に接していないと判定される。

図２５の説明に戻り、参照ブロックの一辺がマクロブロックの外周に接するとステップＳ７において判定した場合、ステップＳ８において、切り出し回路２３２は、参照ブロックの頂点が、その参照ブロックを含むマクロブロックの頂点と一致するか否かを判定する。参照ブロックが満たす条件から、その参照ブロックの頂点がマクロブロックの頂点と一致するか否かを判断することが可能である。

参照ブロックの頂点がマクロブロックの頂点と一致する場合の条件は下式（１８）乃至（１９）により表され、いずれかの条件を満たす場合、参照ブロックの頂点がマクロブロックの頂点と一致すると判定される。

例えば、図２６のブロックＢ１１が注目されている場合の参照ブロックである図２８のブロックｂ１１は、上式（１８）（式（１４）かつ（１５））の条件を満たし、参照ブロックの頂点がマクロブロックの頂点と一致すると判定される。

図２６のブロックＢ１４が注目されている場合の参照ブロックである図２８のブロックｂ１４は、上式（２０）（式（１５）かつ（１６））の条件を満たし、参照ブロックの頂点がマクロブロックの頂点と一致すると判定される。

図２６のブロックＢ４１が注目されている場合の参照ブロックである図２８のブロックｂ４１は、上式（１９）（式（１４）かつ（１７））の条件を満たし、参照ブロックの頂点がマクロブロックの頂点と一致すると判定される。

図２６のブロックＢ４４が注目されている場合の参照ブロックである図２８のブロックｂ４４は、上式（２１）（式（１６）かつ（１７））の条件を満たし、参照ブロックの頂点がマクロブロックの頂点と一致すると判定される。

図２６の他のブロックが注目されている場合の参照ブロックは式（１８）乃至（２１）のいずれの条件も満たさず、参照ブロックの頂点がマクロブロックの頂点と一致しないと判定される。

参照ブロックの頂点がマクロブロックの頂点と一致するとステップＳ８において判定した場合、ステップＳ９において、切り出し回路２３２は、その一致するマクロブロックの頂点と１点で接し、マクロブロックの外側にあるａ×ａ画素の領域を余白領域とする。

一方、参照ブロックの頂点がマクロブロックの頂点と一致しないとステップＳ８において判定された場合、または、ステップＳ９において余白領域が設定された場合、ステップＳ１０に進む。

ステップＳ１０において、切り出し回路２３２は、参照ブロックと接する、その参照ブロックを含むマクロブロックの外側にあるａ×ｗ画素の領域を余白領域として設定する。ｗは、マクロブロックの外周と接する参照ブロックの辺の長さである。参照ブロックが図２８に示されるようにして設定されている場合、ｗ＝４になる。

ステップＳ１１において、切り出し回路２３２は、余白領域を付けた参照ブロックの情報をフレームメモリ１９から読み出し、バッファ２３３に出力する。

一方、参照ブロックの一辺がマクロブロックの外周に接していないとステップＳ７において判定した場合、ステップＳ１２において、切り出し回路２３２は、参照ブロックの情報をフレームメモリ１９から読み出し、バッファ２３３に出力する。

ステップＳ１３において、切り出し回路２３２は、全てのブロックに注目したか否かを判定し、注目していないと判定した場合、ステップＳ２に戻り、他のブロックに注目して同様の処理を繰り返す。

全てのブロックに注目されたとステップＳ１３において判定された場合、ステップＳ１４において、バッファ２３３は、余白領域を付けたマクロブロックを動き補償画像としてフィルタリング回路４５に出力し、処理を終了させる。

余白領域の具体例について説明する。

例えば、図２６のブロックＢ１１が注目されている場合、参照ブロックであるブロックｂ１１の頂点はマクロブロックMB２２の頂点と一致するから、その一致する頂点と１点で接するａ×ａ画素の領域である図２９の領域ａ１が余白領域として設定される。また、ブロックｂ１１と接する、マクロブロックMB２２の外側にあるａ×ｗ画素の領域である図２９の領域ａ２，ａ３が余白領域として設定される。参照ブロックであるブロックｂ１１と、このようにして設定された余白領域ａ１，ａ２，ａ３が参照フレームから切り出され、注目ブロックであるブロックＢ１１の情報としてバッファ２３３に記憶される。

領域ａ１は、マクロブロックMB２２の外側にあるマクロブロックMB１１（図２７）の画素からなる領域である。領域ａ２はマクロブロックMB２１の画素からなる領域であり、領域ａ３はマクロブロックMB１２の画素からなる領域である。

図２６のブロックＢ１２が注目されている場合、参照ブロックであるブロックｂ１２と接する、マクロブロックMB２２の外側にあるａ×ｗ画素の領域である図３０の領域ａ１１が余白領域として設定される。参照ブロックであるブロックｂ１２と、このようにして設定された余白領域ａ１１が参照フレームから切り出され、注目ブロックであるブロックＢ１２の情報としてバッファ２３３に記憶される。領域ａ１１は、マクロブロックMB２２の外側にあるマクロブロックMB１２の画素からなる領域である。

図２６のブロックＢ１３が注目されている場合も同様に、参照ブロックであるブロックｂ１３と接する、マクロブロックMB２２の外側にあるａ×ｗ画素の領域である図３１の領域ａ２１が余白領域として設定される。参照ブロックであるブロックｂ１３と、このようにして設定された余白領域ａ２１が参照フレームから切り出され、注目ブロックであるブロックＢ１３の情報としてバッファ２３３に記憶される。領域ａ２１は、マクロブロックMB２２の外側にあるマクロブロックMB１２の画素からなる領域である。

図２６のブロックＢ１４が注目されている場合、参照ブロックであるブロックｂ１４の頂点はマクロブロックMB２２の頂点と一致するから、その一致する頂点と１点で接するａ×ａ画素の領域である図３２の領域ａ３１が余白領域として設定される。また、この場合、ブロックｂ１４と接する、マクロブロックMB２２の外側にあるａ×ｗ画素の領域である図３２の領域ａ３２，ａ３３が余白領域として設定される。参照ブロックであるブロックｂ１４と、このようにして設定された余白領域ａ３２，ａ３３が参照フレームから切り出され、注目ブロックであるブロックＢ１４の情報としてバッファ２３３に記憶される。

領域ａ３１は、マクロブロックMB２２の外側にあるマクロブロックMB１３の画素からなる領域である。領域ａ３２はマクロブロックMB２３の画素からなる領域であり、領域ａ３３はマクロブロックMB１２の画素からなる領域である。

図２６のブロックＢ２１が注目されている場合、参照ブロックであるブロックｂ２１と接する、マクロブロックMB２２の外側にあるａ×ｗ画素の領域である図３３の領域ａ４１が余白領域として設定される。参照ブロックであるブロックｂ２１と、このようにして設定された余白領域ａ４１が参照フレームから切り出され、注目ブロックであるブロックＢ２１の情報としてバッファ２３３に記憶される。領域ａ４１は、マクロブロックMB２２の外側にあるマクロブロックMB２１の画素からなる領域である。

図２６のブロックＢ２２が注目されている場合、参照ブロックであるブロックｂ２２は、その辺がマクロブロックMB２２の外周と接していないブロックであるから、図３４に示されるように余白領域は設定されない。ブロックｂ２２が参照フレームから切り出され、注目ブロックであるブロックＢ２２の情報としてバッファ２３３に記憶される。

図２６のブロックＢ２３が注目されている場合も同様に、参照ブロックであるブロックｂ２３は、その辺がマクロブロックMB２２の外周と接していないブロックであるから、図３５に示されるように余白領域は設定されない。ブロックｂ２３が参照フレームから切り出され、注目ブロックであるブロックＢ２３の情報としてバッファ２３３に記憶される。

図２６のブロックＢ２４が注目されている場合、参照ブロックであるブロックｂ２４と接する、マクロブロックMB２２の外側にあるａ×ｗ画素の領域である図３６の領域ａ５１が余白領域として設定される。参照ブロックであるブロックｂ２４と、このようにして設定された余白領域ａ５１が参照フレームから切り出され、注目ブロックであるブロックＢ２４の情報としてバッファ２３３に記憶される。領域ａ５１は、マクロブロックMB２２の外側にあるマクロブロックMB２３の画素からなる領域である。

図２６のブロックＢ３１乃至４４が注目されている場合も同様にして余白領域が適宜設定され、参照ブロックの情報とともにバッファ２３３に記憶される。

図３７は、予測回路４４から出力される動き補償画像の例を示す図である。

以上のようにしてフレームメモリ１９から読み出された参照ブロックの情報と余白領域の情報から、図３７に示されるような動き補償画像が生成される。図３７の動き補償画像は（１６＋２ａ）×（１６＋２ａ）画素の画像である。

フィルタリング回路４５においては、このようにして生成された複数の動き補償画像を対象として、差分の計算、FIRフィルタを用いたフィルタリング、ゲインの調整、加算等が行われ、予測画像が生成される。

図３８は、フィルタリング回路４５のローパスフィルタ回路５２、ハイパスフィルタ回路５４に設けられるFIRフィルタの例を示す図である。

例えば、図３８に示されるようなタップ数が５のFIRフィルタが設けられる場合、ａの値として２が設定され、フィルタリング回路４５に入力される動き補償画像は、１６×１６画素のマクロブロックの４辺を２画素分ずつ拡大させた２０×２０画素の画像になる。

帯の幅ａ（画素）は、FIRフィルタのタップ数をＴとすると下式（２２）により決定される。floor（ｘ）は、ｘ以下の、最大の整数値を計算する関数である。

このように、タップ数Ｔが小さい場合には幅ａも狭く、タップ数Ｔが大きい場合には幅ａも広くなる。なお、２次元のフィルタリング処理が行われる場合、ローパスフィルタ回路５２等には、横方向に並ぶ５画素を入力として１画素を出力する５タップのFIRフィルタと縦方向に並ぶ５画素を入力として１画素を出力する５タップのFIRフィルタが設けられる。

図３９は、余白領域が付けられた動き補償画像を対象としたフィルタリング処理の例を示す図である。

図３９の上段に示される（１６＋２ａ）×（１６＋２ａ）画素の入力画像は、以上のような動き補償が予測回路４４により行われることによって生成された動き補償画像である。下段に示される１６×１６画素の出力画像は、上段の動き補償画像に対してFIRフィルタを用いたフィルタリング処理を施して得られた画素からなる予測画像である。

例えば、予測画像の左下端にある画素Ｐ１を生成する場合、対応する動き補償画像の画素である画素ｐ１を中心として横方向に並ぶ５画素である、画素ｐ２１，ｐ２２，ｐ１，ｐ２，ｐ３をFIRフィルタに入力して、画素Ｐ１の画素値を求めることが可能になる。画素ｐ２１，ｐ２２は余白領域の画素である。

また、予測画像の右下端にある画素Ｐ１６を生成する場合、対応する動き補償画像の画素である画素ｐ１６を中心として横方向に並ぶ５画素である、画素ｐ１４，ｐ１５，ｐ１６，ｐ３１，ｐ３２をFIRフィルタに入力して、画素Ｐ１６の画素値を求めることが可能になる。画素ｐ３１，ｐ３２は余白領域の画素である。

これにより、実際の画素値を用いてフィルタリング処理を行うことができることから、予測画像の画素値の精度を上げることが可能になる。２次元画像は空間方向に高い相関を持っているため、マクロブロック内の画素値とマクロブロック外の画素値もまた、同様に高い相関があると考えられる。そのため、マクロブロック内の画素で補間するなどしてフィルタリング処理を行う場合と較べて、予測画像の画素値は信頼性の高いものになるといえる。

一般に、FIRフィルタはタップ数が大きい方が特性的に有利であるが、タップ数が大きい場合には、ブロック外の画素値を用いることになる可能性が高くなり、出力画像の画素値に影響を及ぼす範囲が広くなる。

具体的には、マクロブロック単位でフィルタリング処理を行う場合に、式（４）のLPFとして３タップのFIRフィルタを用いたときには１フレーム全体の約２５％の画素が、入力画像の画素が不足することによる影響を受けることになる。また、５タップのFIRフィルタを用いたときには１フレーム全体の約５０％の画素が影響を受け、７タップのFIRフィルタを用いたときには１フレーム全体の約７３％の画素が影響を受けることになる。

以上のような動き補償画像をフィルタリング処理の入力画像として用いることにより、タップ数の大きいFIRフィルタを用いてフィルタリング処理が行われるようにすることも可能になる。

以上においては、予測画像のある１画素を生成する場合、対応する動き補償画像の画素を中心として横方向に並ぶ画素がFIRフィルタに入力されるものとしたが、入力される画素は横方向に並ぶ画素や縦方向に並ぶ画素に限られない。例えば、対応する動き補償画像の画素と、その画素の上下左右にある画素が入力されるようにしたり、対応する動き補償画像の画素と、その画素の右上、左上、右下、左下にある画素が入力されるようにしたりすることも可能である。

図４０、図４１は、図８のフィルタリング回路４５により生成された予測画像を用いて符号化を行った結果を示す図である。

図４０のグラフは、符号化データの発生量を示す。

横軸はフレーム番号を表す。例えば、横軸上の１は処理対象の動画像の最初のピクチャを表し、２は２番目のピクチャを表す。縦軸は各ピクチャの符号量を表し、単位はビットである。値が小さいほど、高圧縮率でフレームを圧縮できたことを表す。

ラインＬ₁は、従来のAVCを用いて符号化を行った場合の符号量を表し、ラインＬ₂は、フィルタリング予測を用いて符号化を行った場合の符号量を表す。この例においては、１５フレーム毎に１フレームのイントラピクチャが挿入され、イントラピクチャ以外の１４フレームはＰピクチャとされている。

図４０に示されるように、イントラピクチャについてはAVCを採用した場合もフィルタリング予測を使った符号化方式を採用した場合も変わりがないため、発生符号量は同一の値になる。また、フィルタリング予測を使った符号化方式においては２枚の参照フレームが必要になるため、最初のイントラピクチャ１枚しか参照フレームとして用いることができない２枚目のＰピクチャの符号量も、AVCを採用した場合の符号量と同一の値になる。それ以外のＰピクチャの符号量は、ラインＬ₂がとる、フィルタリング予測を使った符号化方式の値の方が、ラインＬ₁がとる値より小さい値になっている。

フィルタリング予測を使った符号化方式を採用した方が発生符号量を抑えることができるのは、予測画像の精度が高く、残差の符号化データを、AVCを採用した場合と較べて減らすことができることによるものである。

図４１のグラフは、符号化データの画質を示す。

図４１の横軸は図４０の横軸と同様にフレーム番号を表す。縦軸はPSNR値を表す。PSNR値は、その値が大きいほど原画に近いこと（高画質であること）を表す客観指標であり、単位は[dB]となる。

ラインＬ₁₁は、従来のAVCを用いて符号化を行った場合のPSNR値を表し、ラインＬ₁₂は、フィルタリング予測を用いて符号化を行った場合のPSNR値を表す。図４０の場合と同じ理由から、イントラピクチャと２枚目のＰピクチャのPSNR値については、AVCを採用した場合もフィルタリング予測を用いて符号化を行った場合も同じ値になる。

一方、それ以外のＰピクチャについては、ラインＬ₁₂がとる、フィルタリング予測を使った符号化方式を採用した場合のPSNR値の方が、ラインＬ₁₁がとるAVCを採用した場合のPSNR値より大きい値になっている。

フィルタリング予測を使った符号化方式を採用した方がPSNR値、すなわち画質を向上させることができるのは、予測画像の精度を上げることができることによるものである。

上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

図４２は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

CPU(Central Processing Unit)２５１、ROM(Read Only Memory)２５２、RAM(Random Access Memory)２５３は、バス２５４により相互に接続されている。

バス２５４には、さらに、入出力インタフェース２５５が接続されている。入出力インタフェース２５５には、キーボード、マウス、マイクロホンなどよりなる入力部２５６、ディスプレイ、スピーカなどよりなる出力部２５７、ハードディスクや不揮発性のメモリなどよりなる記憶部２５８、ネットワークインタフェースなどよりなる通信部２５９、光ディスクや半導体メモリなどのリムーバブルメディア２６１を駆動するドライブ２６０が接続されている。

以上のように構成されるコンピュータでは、CPU２５１が、例えば、記憶部２５８に記憶されているプログラムを入出力インタフェース２５５及びバス２５４を介してRAM２５３にロードして実行することにより、上述した一連の処理が行われる。

CPU２５１が実行するプログラムは、例えばリムーバブルメディア２６１に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供され、記憶部２５８にインストールされる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、上述した復号装置１や符号化装置１０１は、任意の電子機器に適用することができる。以下にその例について説明する。

図４３は、本発明を適用した復号装置を用いるテレビジョン受像機の主な構成例を示すブロック図である。

図４３に示されるテレビジョン受像機３００は、地上波チューナ３１３、ビデオデコーダ３１５、映像信号処理回路３１８、グラフィック生成回路３１９、パネル駆動回路３２０、および表示パネル３２１を有する。

地上波チューナ３１３は、地上アナログ放送の放送波信号を、アンテナを介して受信し、復調し、映像信号を取得し、それをビデオデコーダ３１５に供給する。ビデオデコーダ３１５は、地上波チューナ３１３から供給された映像信号に対してデコード処理を施し、得られたデジタルのコンポーネント信号を映像信号処理回路３１８に供給する。

映像信号処理回路３１８は、ビデオデコーダ３１５から供給された映像データに対してノイズ除去などの所定の処理を施し、得られた映像データをグラフィック生成回路３１９に供給する。

グラフィック生成回路３１９は、表示パネル３２１に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成し、生成した映像データや画像データをパネル駆動回路３２０に供給する。また、グラフィック生成回路３１９は、項目の選択などにユーザにより利用される画面を表示するための映像データ（グラフィック）を生成し、それを番組の映像データに重畳したりすることによって得られた映像データをパネル駆動回路３２０に供給するといった処理も適宜行う。

パネル駆動回路３２０は、グラフィック生成回路３１９から供給されたデータに基づいて表示パネル３２１を駆動し、番組の映像や上述した各種の画面を表示パネル３２１に表示させる。

表示パネル３２１はLCD（Liquid Crystal Display）などよりなり、パネル駆動回路３２０による制御に従って番組の映像などを表示させる。

また、テレビジョン受像機３００は、音声A/D（Analog/Digital)変換回路３１４、音声信号処理回路３２２、エコーキャンセル／音声合成回路３２３、音声増幅回路３２４、およびスピーカ３２５も有する。

地上波チューナ３１３は、受信した放送波信号を復調することにより、映像信号だけでなく音声信号も取得する。地上波チューナ３１３は、取得した音声信号を音声A/D変換回路３１４に供給する。

音声A/D変換回路３１４は、地上波チューナ３１３から供給された音声信号に対してA/D変換処理を施し、得られたデジタルの音声信号を音声信号処理回路３２２に供給する。

音声信号処理回路３２２は、音声A/D変換回路３１４から供給された音声データに対してノイズ除去などの所定の処理を施し、得られた音声データをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、音声信号処理回路３２２から供給された音声データを音声増幅回路３２４に供給する。

音声増幅回路３２４は、エコーキャンセル／音声合成回路３２３から供給された音声データに対してD/A変換処理、増幅処理を施し、所定の音量に調整した後、音声をスピーカ３２５から出力させる。

さらに、テレビジョン受像機３００は、デジタルチューナ３１６およびMPEGデコーダ３１７も有する。

デジタルチューナ３１６は、デジタル放送（地上デジタル放送、BS（Broadcasting Satellite）／CS（Communications Satellite）デジタル放送）の放送波信号を、アンテナを介して受信し、復調し、MPEG-TS（Moving Picture Experts Group-Transport Stream）を取得し、それをMPEGデコーダ３１７に供給する。

MPEGデコーダ３１７は、デジタルチューナ３１６から供給されたMPEG-TSに施されているスクランブルを解除し、再生対象（視聴対象）になっている番組のデータを含むストリームを抽出する。MPEGデコーダ３１７は、抽出したストリームを構成する音声パケットをデコードし、得られた音声データを音声信号処理回路３２２に供給するとともに、ストリームを構成する映像パケットをデコードし、得られた映像データを映像信号処理回路３１８に供給する。また、MPEGデコーダ３１７は、MPEG-TSから抽出したEPG（Electronic Program Guide)データを図示せぬ経路を介してCPU３３２に供給する。

テレビジョン受像機３００は、このように映像パケットをデコードするMPEGデコーダ３１７として、上述した復号装置１を用いる。したがって、MPEGデコーダ３１７は、復号装置１の場合と同様に、フィルタリング予測によって生成した予測画像を用いて復号を行うので、画像の時間相関をより効率的に利用して、高精細な復号画像を得ることができる。

MPEGデコーダ３１７から供給された映像データは、ビデオデコーダ３１５から供給された映像データの場合と同様に、映像信号処理回路３１８において所定の処理が施され、グラフィック生成回路３１９において、生成された映像データ等が適宜重畳され、パネル駆動回路３２０を介して表示パネル３２１に供給され、その画像が表示される。

MPEGデコーダ３１７から供給された音声データは、音声A/D変換回路３１４から供給された音声データの場合と同様に、音声信号処理回路３２２において所定の処理が施され、エコーキャンセル／音声合成回路３２３を介して音声増幅回路３２４に供給され、D/A変換処理や増幅処理が施される。その結果、所定の音量に調整された音声がスピーカ３２５から出力される。

また、テレビジョン受像機３００は、マイクロホン３２６、およびA/D変換回路３２７も有する。

A/D変換回路３２７は、音声会話用のものとしてテレビジョン受像機３００に設けられるマイクロホン３２６により取り込まれたユーザの音声の信号を受信し、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、テレビジョン受像機３００のユーザ（ユーザＡ）の音声のデータがA/D変換回路３２７から供給されている場合、ユーザＡの音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路３２４を介してスピーカ３２５より出力させる。

さらに、テレビジョン受像機３００は、音声コーデック３２８、内部バス３２９、SDRAM（Synchronous Dynamic Random Access Memory)３３０、フラッシュメモリ３３１、CPU３３２、USB（Universal Serial Bus) I/F３３３、およびネットワークI/F３３４も有する。

A/D変換回路３２７は、音声会話用のものとしてテレビジョン受像機３００に設けられるマイクロホン３２６により取り込まれたユーザの音声の信号を受信し、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データを音声コーデック３２８に供給する。

音声コーデック３２８は、A/D変換回路３２７から供給された音声データを、ネットワーク経由で送信するための所定のフォーマットのデータに変換し、内部バス３２９を介してネットワークI/F３３４に供給する。

ネットワークI/F３３４は、ネットワーク端子３３５に装着されたケーブルを介してネットワークに接続される。ネットワークI/F３３４は、例えば、そのネットワークに接続される他の装置に対して、音声コーデック３２８から供給された音声データを送信する。また、ネットワークI/F３３４は、例えば、ネットワークを介して接続される他の装置から送信される音声データを、ネットワーク端子３３５を介して受信し、それを、内部バス３２９を介して音声コーデック３２８に供給する。

音声コーデック３２８は、ネットワークI/F３３４から供給された音声データを所定のフォーマットのデータに変換し、それをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、音声コーデック３２８から供給される音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路３２４を介してスピーカ３２５より出力させる。

SDRAM３３０は、CPU３３２が処理を行う上で必要な各種のデータを記憶する。

フラッシュメモリ３３１は、CPU３３２により実行されるプログラムを記憶する。フラッシュメモリ３３１に記憶されているプログラムは、テレビジョン受像機３００の起動時などの所定のタイミングでCPU３３２により読み出される。フラッシュメモリ３３１には、デジタル放送を介して取得されたEPGデータ、ネットワークを介して所定のサーバから取得されたデータなども記憶される。

例えば、フラッシュメモリ３３１には、CPU３３２の制御によりネットワークを介して所定のサーバから取得されたコンテンツデータを含むMPEG-TSが記憶される。フラッシュメモリ３３１は、例えばCPU３３２の制御により、そのMPEG-TSを、内部バス３２９を介してMPEGデコーダ３１７に供給する。

MPEGデコーダ３１７は、デジタルチューナ３１６から供給されたMPEG-TSの場合と同様に、そのMPEG-TSを処理する。このようにテレビジョン受像機３００は、映像や音声等よりなるコンテンツデータを、ネットワークを介して受信し、MPEGデコーダ３１７を用いてデコードし、その映像を表示させたり、音声を出力させたりすることができる。

また、テレビジョン受像機３００は、リモートコントローラ３５１から送信される赤外線信号を受光する受光部３３７も有する。

受光部３３７は、リモートコントローラ３５１からの赤外線を受光し、復調して得られたユーザ操作の内容を表す制御コードをCPU３３２に出力する。

CPU３３２は、フラッシュメモリ３３１に記憶されているプログラムを実行し、受光部３３７から供給される制御コードなどに応じてテレビジョン受像機３００の全体の動作を制御する。CPU３３２とテレビジョン受像機３００の各部は、図示せぬ経路を介して接続されている。

USB I/F３３３は、USB端子３３６に装着されたUSBケーブルを介して接続される、テレビジョン受像機３００の外部の機器との間でデータの送受信を行う。ネットワークI/F３３４は、ネットワーク端子３３５に装着されたケーブルを介してネットワークに接続し、ネットワークに接続される各種の装置と音声データ以外のデータの送受信も行う。

テレビジョン受像機３００は、MPEGデコーダ３１７として復号装置１を用いることにより、処理負担を大きくすることなく、精度の高い予測画像を生成することができる。その結果として、テレビジョン受像機３００は、アンテナを介して受信した放送波信号や、ネットワークを介して取得したコンテンツデータから、より高精細な復号画像を得て、表示することができる。

図４４は、本発明を適用した復号装置および符号化装置を用いる携帯電話機の主な構成例を示すブロック図である。

図４４に示される携帯電話機４００は、各部を統括的に制御するようになされた主制御部４５０、電源回路部４５１、操作入力制御部４５２、画像エンコーダ４５３、カメラI/F部４５４、LCD制御部４５５、画像デコーダ４５６、多重分離部４５７、記録再生部４６２、変復調回路部４５８、および音声コーデック４５９を有する。これらは、バス４６０を介して互いに接続されている。

また、携帯電話機４００は、操作キー４１９、CCD（Charge Coupled Devices）カメラ４１６、液晶ディスプレイ４１８、記憶部４２３、送受信回路部４６３、アンテナ４１４、マイクロホン（マイク）４２１、およびスピーカ４１７を有する。

電源回路部４５１は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話機４００を動作可能な状態に起動する。

携帯電話機４００は、CPU、ROMおよびRAM等でなる主制御部４５０の制御に基づいて、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

例えば、音声通話モードにおいて、携帯電話機４００は、マイクロホン（マイク）４２１で集音した音声信号を、音声コーデック４５９によってデジタル音声データに変換し、これを変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（音声信号）は、公衆電話回線網を介して通話相手の携帯電話機に供給される。

また、例えば、音声通話モードにおいて、携帯電話機４００は、アンテナ４１４で受信した受信信号を送受信回路部４６３で増幅し、さらに周波数変換処理およびアナログデジタル変換処理し、変復調回路部４５８でスペクトラム逆拡散処理し、音声コーデック４５９によってアナログ音声信号に変換する。携帯電話機４００は、その変換して得られたアナログ音声信号をスピーカ４１７から出力する。

更に、例えば、データ通信モードにおいて電子メールを送信する場合、携帯電話機４００は、操作キー４１９の操作によって入力された電子メールのテキストデータを、操作入力制御部４５２において受け付ける。携帯電話機４００は、そのテキストデータを主制御部４５０において処理し、LCD制御部４５５を介して、画像として液晶ディスプレイ４１８に表示させる。

また、携帯電話機４００は、主制御部４５０において、操作入力制御部４５２が受け付けたテキストデータやユーザ指示等に基づいて電子メールデータを生成する。携帯電話機４００は、その電子メールデータを、変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（電子メール）は、ネットワークおよびメールサーバ等を介して、所定のあて先に供給される。

また、例えば、データ通信モードにおいて電子メールを受信する場合、携帯電話機４００は、基地局から送信された信号を、アンテナ４１４を介して送受信回路部４６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機４００は、その受信信号を変復調回路部４５８でスペクトラム逆拡散処理して元の電子メールデータを復元する。携帯電話機４００は、復元された電子メールデータを、LCD制御部４５５を介して液晶ディスプレイ４１８に表示する。

なお、携帯電話機４００は、受信した電子メールデータを、記録再生部４６２を介して、記憶部４２３に記録する（記憶させる）ことも可能である。

この記憶部４２３は、書き換え可能な任意の記憶媒体である。記憶部４２３は、例えば、RAMや内蔵型フラッシュメモリ等の半導体メモリであってもよいし、ハードディスクであってもよいし、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアであってもよい。もちろん、これら以外のものであってもよい。

さらに、例えば、データ通信モードにおいて画像データを送信する場合、携帯電話機４００は、撮像によりCCDカメラ４１６で画像データを生成する。CCDカメラ４１６は、レンズや絞り等の光学デバイスと光電変換素子としてのCCDを有し、被写体を撮像し、受光した光の強度を電気信号に変換し、被写体の画像の画像データを生成する。その画像データを、カメラI/F部４５４を介して、画像エンコーダ４５３で、例えばMPEG２やMPEG４等の所定の符号化方式によって圧縮符号化することにより符号化画像データに変換する。

携帯電話機４００は、このような処理を行う画像エンコーダ４５３として、上述した符号化装置１０１を用いる。したがって、画像エンコーダ４５３は、符号化装置１０１の場合と同様に、フィルタリング予測によって生成された、高周波成分を多く含み、原画像との差が少ない予測画像を用いて符号化を行うので、残差に割り当てる符号量を低減させることができ、符号化効率を上げることができる。

なお、携帯電話機４００は、このとき同時に、CCDカメラ４１６で撮像中にマイクロホン（マイク）４２１で集音した音声を、音声コーデック４５９においてアナログデジタル変換し、さらに符号化する。

携帯電話機４００は、多重分離部４５７において、画像エンコーダ４５３から供給された符号化画像データと、音声コーデック４５９から供給されたデジタル音声データとを、所定の方式で多重化する。携帯電話機４００は、その結果得られる多重化データを、変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（画像データ）は、ネットワーク等を介して、通信相手に供給される。

なお、画像データを送信しない場合、携帯電話機４００は、CCDカメラ４１６で生成した画像データを、画像エンコーダ４５３を介さずに、LCD制御部４５５を介して液晶ディスプレイ４１８に表示させることもできる。

また、例えば、データ通信モードにおいて、簡易ホームページ等にリンクされた動画像ファイルのデータを受信する場合、携帯電話機４００は、基地局から送信された信号を、アンテナ４１４を介して送受信回路部４６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機４００は、その受信信号を変復調回路部４５８でスペクトラム逆拡散処理して元の多重化データを復元する。携帯電話機４００は、多重分離部４５７において、その多重化データを分離して、符号化画像データと音声データとに分ける。

携帯電話機４００は、画像デコーダ４５６において、符号化画像データを、MPEG２やMPEG４等の所定の符号化方式に対応した復号方式でデコードすることにより、再生動画像データを生成し、これを、LCD制御部４５５を介して液晶ディスプレイ４１８に表示させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる動画データが液晶ディスプレイ４１８に表示される。

携帯電話機４００は、このような処理を行う画像デコーダ４５６として、上述した復号装置１を用いる。したがって、画像デコーダ４５６は、復号装置１の場合と同様に、フィルタリング予測によって生成した予測画像を用いて復号を行うので、画像の時間相関をより効率的に利用して、高精細な復号画像を得ることができる。

このとき、携帯電話機４００は、同時に、音声コーデック４５９において、デジタルの音声データをアナログ音声信号に変換し、これをスピーカ４１７より出力させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる音声データが再生される。

なお、電子メールの場合と同様に、携帯電話機４００は、受信した簡易ホームページ等にリンクされたデータを、記録再生部４６２を介して、記憶部４２３に記録する（記憶させる）ことも可能である。

また、携帯電話機４００は、主制御部４５０において、撮像されてCCDカメラ４１６で得られた２次元コードを解析し、２次元コードに記録された情報を取得することができる。

さらに、携帯電話機４００は、赤外線通信部４８１で赤外線により外部の機器と通信することができる。

携帯電話機４００は、画像エンコーダ４５３として符号化装置１０１を用いることにより、例えばCCDカメラ４１６において生成された画像データを符号化して生成する符号化データの符号化効率を、処理を複雑にすることなく向上させることができる。結果として、携帯電話機４００は、符号化効率のよい符号化データ（画像データ）を、他の装置に提供することができる。

また、携帯電話機４００は、画像デコーダ４５６として復号装置１を用いることにより、処理負担を大きくすることなく、精度の高い予測画像を生成することができる。その結果として、携帯電話機４００は、例えば、簡易ホームページにリンクされた動画像ファイルから、より高精細な復号画像を得て、表示することができる。

なお、以上において、携帯電話機４００が、CCDカメラ４１６を用いるように説明したが、このCCDカメラ４１６の代わりに、CMOS（Complementary Metal Oxide Semiconductor）を用いたイメージセンサ（CMOSイメージセンサ）を用いるようにしてもよい。この場合も、携帯電話機４００は、CCDカメラ４１６を用いる場合と同様に、被写体を撮像し、被写体の画像の画像データを生成することができる。

また、以上においては携帯電話機４００として説明したが、例えば、PDA（Personal Digital Assistants）、スマートフォン、UMPC（Ultra Mobile Personal Computer）、ネットブック、ノート型パーソナルコンピュータ等、この携帯電話機４００と同様の撮像機能や通信機能を有する装置であれば、どのような装置であっても携帯電話機４００の場合と同様に、復号装置１および符号化装置１０１を適用することができる。

図４５は、本発明を適用した復号装置および符号化装置を用いるハードディスクレコーダの主な構成例を示すブロック図である。

図４５に示されるハードディスクレコーダ（HDDレコーダ）５００は、チューナにより受信された、衛星や地上のアンテナ等より送信される放送波信号（テレビジョン信号）に含まれる放送番組のオーディオデータとビデオデータを、内蔵するハードディスクに保存し、その保存したデータをユーザの指示に応じたタイミングでユーザに提供する装置である。

ハードディスクレコーダ５００は、例えば、放送波信号よりオーディオデータとビデオデータを抽出し、それらを適宜復号し、内蔵するハードディスクに記憶させることができる。また、ハードディスクレコーダ５００は、例えば、ネットワークを介して他の装置からオーディオデータやビデオデータを取得し、それらを適宜復号し、内蔵するハードディスクに記憶させることもできる。

さらに、ハードディスクレコーダ５００は、例えば、内蔵するハードディスクに記録されているオーディオデータやビデオデータを復号してモニタ５６０に供給し、モニタ５６０の画面にその画像を表示させ、モニタ５６０のスピーカよりその音声を出力させることができる。また、ハードディスクレコーダ５００は、例えば、チューナを介して取得された放送波信号より抽出されたオーディオデータとビデオデータ、または、ネットワークを介して他の装置から取得したオーディオデータやビデオデータを復号してモニタ５６０に供給し、モニタ５６０の画面にその画像を表示させ、モニタ５６０のスピーカよりその音声を出力させることもできる。

もちろん、この他の動作も可能である。

図４５に示されるように、ハードディスクレコーダ５００は、受信部５２１、復調部５２２、デマルチプレクサ５２３、オーディオデコーダ５２４、ビデオデコーダ５２５、およびレコーダ制御部５２６を有する。ハードディスクレコーダ５００は、さらに、EPGデータメモリ５２７、プログラムメモリ５２８、ワークメモリ５２９、ディスプレイコンバータ５３０、OSD（On Screen Display）制御部５３１、ディスプレイ制御部５３２、記録再生部５３３、D/Aコンバータ５３４、および通信部５３５を有する。

また、ディスプレイコンバータ５３０は、ビデオエンコーダ５４１を有する。記録再生部５３３は、エンコーダ５５１およびデコーダ５５２を有する。

受信部５２１は、リモートコントローラ（図示せず）からの赤外線信号を受信し、電気信号に変換してレコーダ制御部５２６に出力する。レコーダ制御部５２６は、例えば、マイクロプロセッサなどにより構成され、プログラムメモリ５２８に記憶されているプログラムに従って、各種の処理を実行する。レコーダ制御部５２６は、このとき、ワークメモリ５２９を必要に応じて使用する。

通信部５３５は、ネットワークに接続され、ネットワークを介して他の装置との通信処理を行う。例えば、通信部５３５は、レコーダ制御部５２６により制御され、チューナ（図示せず）と通信し、主にチューナに対して選局制御信号を出力する。

復調部５２２は、チューナより供給された信号を、復調し、デマルチプレクサ５２３に出力する。デマルチプレクサ５２３は、復調部５２２より供給されたデータを、オーディオデータ、ビデオデータ、およびEPGデータに分離し、それぞれ、オーディオデコーダ５２４、ビデオデコーダ５２５、またはレコーダ制御部５２６に出力する。

オーディオデコーダ５２４は、入力されたオーディオデータを、例えばMPEG方式でデコードし、記録再生部５３３に出力する。ビデオデコーダ５２５は、入力されたビデオデータを、例えばMPEG方式でデコードし、ディスプレイコンバータ５３０に出力する。レコーダ制御部５２６は、入力されたEPGデータをEPGデータメモリ５２７に供給し、記憶させる。

ディスプレイコンバータ５３０は、ビデオデコーダ５２５またはレコーダ制御部５２６より供給されたビデオデータを、ビデオエンコーダ５４１により、例えばNTSC（National Television Standards Committee）方式のビデオデータにエンコードし、記録再生部５３３に出力する。また、ディスプレイコンバータ５３０は、ビデオデコーダ５２５またはレコーダ制御部５２６より供給されるビデオデータの画面のサイズを、モニタ５６０のサイズに対応するサイズに変換し、ビデオエンコーダ５４１によってNTSC方式のビデオデータに変換し、アナログ信号に変換し、ディスプレイ制御部５３２に出力する。

ディスプレイ制御部５３２は、レコーダ制御部５２６の制御のもと、OSD（On Screen Display）制御部５３１が出力したOSD信号を、ディスプレイコンバータ５３０より入力されたビデオ信号に重畳し、モニタ５６０のディスプレイに出力し、表示させる。

モニタ５６０にはまた、オーディオデコーダ５２４が出力したオーディオデータが、D/Aコンバータ５３４によりアナログ信号に変換されて供給されている。モニタ５６０は、このオーディオ信号を内蔵するスピーカから出力する。

記録再生部５３３は、ビデオデータやオーディオデータ等を記録する記憶媒体としてハードディスクを有する。

記録再生部５３３は、例えば、オーディオデコーダ５２４より供給されるオーディオデータを、エンコーダ５５１によりMPEG方式でエンコードする。また、記録再生部５３３は、ディスプレイコンバータ５３０のビデオエンコーダ５４１より供給されるビデオデータを、エンコーダ５５１によりMPEG方式でエンコードする。記録再生部５３３は、そのオーディオデータの符号化データとビデオデータの符号化データとをマルチプレクサにより合成する。記録再生部５３３は、その合成データをチャネルコーディングして増幅し、そのデータを、記録ヘッドを介してハードディスクに書き込む。

記録再生部５３３は、再生ヘッドを介してハードディスクに記録されているデータを再生し、増幅し、デマルチプレクサによりオーディオデータとビデオデータに分離する。記録再生部５３３は、デコーダ５５２によりオーディオデータおよびビデオデータをMPEG方式でデコードする。記録再生部５３３は、復号したオーディオデータをD/A変換し、モニタ５６０のスピーカに出力する。また、記録再生部５３３は、復号したビデオデータをD/A変換し、モニタ５６０のディスプレイに出力する。

レコーダ制御部５２６は、受信部５２１を介して受信されるリモートコントローラからの赤外線信号により示されるユーザ指示に基づいて、EPGデータメモリ５２７から最新のEPGデータを読み出し、それをOSD制御部５３１に供給する。OSD制御部５３１は、入力されたEPGデータに対応する画像データを発生し、ディスプレイ制御部５３２に出力する。ディスプレイ制御部５３２は、OSD制御部５３１より入力されたビデオデータをモニタ５６０のディスプレイに出力し、表示させる。これにより、モニタ５６０のディスプレイには、EPG（電子番組ガイド）が表示される。

また、ハードディスクレコーダ５００は、インターネット等のネットワークを介して他の装置から供給されるビデオデータ、オーディオデータ、またはEPGデータ等の各種データを取得することができる。

通信部５３５は、レコーダ制御部５２６に制御され、ネットワークを介して他の装置から送信されるビデオデータ、オーディオデータ、およびEPGデータ等の符号化データを取得し、それをレコーダ制御部５２６に供給する。レコーダ制御部５２６は、例えば、取得したビデオデータやオーディオデータの符号化データを記録再生部５３３に供給し、ハードディスクに記憶させる。このとき、レコーダ制御部５２６および記録再生部５３３が、必要に応じて再エンコード等の処理を行うようにしてもよい。

また、レコーダ制御部５２６は、取得したビデオデータやオーディオデータの符号化データを復号し、得られるビデオデータをディスプレイコンバータ５３０に供給する。ディスプレイコンバータ５３０は、ビデオデコーダ５２５から供給されるビデオデータと同様に、レコーダ制御部５２６から供給されるビデオデータを処理し、ディスプレイ制御部５３２を介してモニタ５６０に供給し、その画像を表示させる。

また、この画像表示に合わせて、レコーダ制御部５２６が、復号したオーディオデータを、D/Aコンバータ５３４を介してモニタ５６０に供給し、その音声をスピーカから出力させるようにしてもよい。

さらに、レコーダ制御部５２６は、取得したEPGデータの符号化データを復号し、復号したEPGデータをEPGデータメモリ５２７に供給する。

以上のようなハードディスクレコーダ５００は、ビデオデコーダ５２５、デコーダ５５２、およびレコーダ制御部５２６に内蔵されるデコーダとして復号装置１を用いる。したがって、ビデオデコーダ５２５、デコーダ５５２、およびレコーダ制御部５２６に内蔵されるデコーダは、復号装置１の場合と同様に、フィルタリング予測によって生成した予測画像を用いて復号を行うので、画像の時間相関をより効率的に利用して、高精細な復号画像を得ることができる。

したがって、ハードディスクレコーダ５００は、処理負担を大きくすることなく、精度の高い予測画像を生成することができる。その結果として、ハードディスクレコーダ５００は、例えば、チューナを介して受信されたビデオデータの符号化データや、記録再生部５３３のハードディスクから読み出されたビデオデータの符号化データや、ネットワークを介して取得したビデオデータの符号化データから、より高精細な復号画像を得て、モニタ５６０に表示させることができる。

また、ハードディスクレコーダ５００は、エンコーダ５５１として符号化装置１０１を用いる。したがって、エンコーダ５５１は、符号化装置１０１の場合と同様に、フィルタリング予測によって生成された、高周波成分を多く含み、原画像との差が少ない予測画像を用いて符号化を行うので、残差に割り当てる符号量を低減させることができ、符号化効率を上げることができる。

したがって、ハードディスクレコーダ５００は、例えば、ハードディスクに記録する符号化データの符号化効率を、処理を複雑にすることなく向上させることができる。その結果として、ハードディスクレコーダ５００は、ハードディスクの記憶領域をより効率よく使用することができる。

なお、以上においては、ビデオデータやオーディオデータをハードディスクに記録するハードディスクレコーダ５００について説明したが、もちろん、記録媒体はどのようなものであってもよい。例えばフラッシュメモリ、光ディスク、またはビデオテープ等、ハードディスク以外の記録媒体を適用するレコーダであっても、上述したハードディスクレコーダ５００の場合と同様に、復号装置１および符号化装置１０１を適用することができる。

図４６は、本発明を適用した復号装置および符号化装置を用いるカメラの主な構成例を示すブロック図である。

図４６に示されるカメラ６００は、被写体を撮像し、被写体の画像をLCD６１６に表示させたり、それを画像データとして、記録メディア６３３に記録したりする。

レンズブロック６１１は、光（すなわち、被写体の映像）を、CCD/CMOS６１２に入射させる。CCD/CMOS６１２は、CCDまたはCMOSを用いたイメージセンサであり、受光した光の強度を電気信号に変換し、カメラ信号処理部６１３に供給する。

カメラ信号処理部６１３は、CCD/CMOS６１２から供給された電気信号を、Ｙ，Ｃｒ，Ｃｂの色差信号に変換し、画像信号処理部６１４に供給する。画像信号処理部６１４は、コントローラ６２１の制御の下、カメラ信号処理部６１３から供給された画像信号に対して所定の画像処理を施したり、その画像信号をエンコーダ６４１で例えばMPEG方式により符号化したりする。画像信号処理部６１４は、画像信号を符号化して生成した符号化データを、デコーダ６１５に供給する。さらに、画像信号処理部６１４は、オンスクリーンディスプレイ（OSD）６２０において生成された表示用データを取得し、それをデコーダ６１５に供給する。

以上の処理において、カメラ信号処理部６１３は、バス６１７を介して接続されるDRAM（Dynamic Random Access Memory）６１８を適宜利用し、必要に応じて画像データや、その画像データが符号化された符号化データ等をそのDRAM６１８に保持させる。

デコーダ６１５は、画像信号処理部６１４から供給された符号化データを復号し、得られた画像データ（復号画像データ）をLCD６１６に供給する。また、デコーダ６１５は、画像信号処理部６１４から供給された表示用データをLCD６１６に供給する。LCD６１６は、デコーダ６１５から供給された復号画像データの画像と表示用データの画像を適宜合成し、その合成画像を表示する。

オンスクリーンディスプレイ６２０は、コントローラ６２１の制御の下、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを、バス６１７を介して画像信号処理部６１４に出力する。

コントローラ６２１は、ユーザが操作部６２２を用いて指令した内容を示す信号に基づいて、各種処理を実行するとともに、バス６１７を介して、画像信号処理部６１４、DRAM６１８、外部インタフェース６１９、オンスクリーンディスプレイ６２０、およびメディアドライブ６２３等を制御する。FLASH ROM６２４には、コントローラ６２１が各種処理を実行する上で必要なプログラムやデータ等が格納される。

例えば、コントローラ６２１は、画像信号処理部６１４やデコーダ６１５に代わって、DRAM６１８に記憶されている画像データを符号化したり、DRAM６１８に記憶されている符号化データを復号したりすることができる。このとき、コントローラ６２１は、画像信号処理部６１４やデコーダ６１５の符号化・復号方式と同様の方式によって符号化・復号処理を行うようにしてもよいし、画像信号処理部６１４やデコーダ６１５が対応していない方式により符号化・復号処理を行うようにしてもよい。

また、例えば、操作部６２２から画像印刷の開始が指示された場合、コントローラ６２１は、DRAM６１８から画像データを読み出し、それを、バス６１７を介して外部インタフェース６１９に接続されるプリンタ６３４に供給して印刷させる。

さらに、例えば、操作部６２２から画像記録が指示された場合、コントローラ６２１は、DRAM６１８から符号化データを読み出し、それを、バス６１７を介してメディアドライブ６２３に装着される記録メディア６３３に供給して記憶させる。

記録メディア６３３は、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアである。記録メディア６３３は、もちろん、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であっても良い。

また、メディアドライブ６２３と記録メディア６３３を一体化し、例えば、内蔵型ハードディスクドライブやSSD（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

外部インタフェース６１９は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタ６３４と接続される。また、外部インタフェース６１９には、必要に応じてドライブ６３１が接続され、磁気ディスク、光ディスク、あるいは光磁気ディスクなどのリムーバブルメディア６３２が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、FLASH ROM６２４にインストールされる。

さらに、外部インタフェース６１９は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。コントローラ６２１は、例えば、操作部６２２からの指示に従って、DRAM６１８から符号化データを読み出し、それを外部インタフェース６１９から、ネットワークを介して接続される他の装置に供給させることができる。また、コントローラ６２１は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース６１９を介して取得し、それをDRAM６１８に保持させたり、画像信号処理部６１４に供給したりすることができる。

以上のようなカメラ６００は、デコーダ６１５として復号装置１を用いる。したがって、デコーダ６１５は、復号装置１の場合と同様に、フィルタリング予測によって生成した予測画像を用いて復号を行うので、画像の時間相関をより効率的に利用して、高精細な復号画像を得ることができる。

したがって、カメラ６００は、処理負担を大きくすることなく、精度の高い予測画像を生成することができる。その結果として、カメラ６００は、例えば、CCD/CMOS６１２において生成された画像データや、DRAM６１８または記録メディア６３３から読み出されたビデオデータの符号化データや、ネットワークを介して取得したビデオデータの符号化データから、より高精細な復号画像を得て、LCD６１６に表示させることができる。

また、カメラ６００は、エンコーダ６４１として符号化装置１０１を用いる。したがって、エンコーダ６４１は、符号化装置１０１の場合と同様に、フィルタリング予測によって生成された、高周波成分を多く含み、原画像との差が少ない予測画像を用いて符号化を行うので、残差に割り当てる符号量を低減させることができ、符号化効率を上げることができる。

したがって、カメラ６００は、例えば、ハードディスクに記録する符号化データの符号化効率を、処理を複雑にすることなく向上させることができる。その結果として、カメラ６００は、DRAM６１８や記録メディア６３３の記憶領域をより効率よく使用することができる。

なお、コントローラ６２１が行う復号処理に復号装置１の復号方法を適用するようにしてもよい。同様に、コントローラ６２１が行う符号化処理に符号化装置１０１の符号化方法を適用するようにしてもよい。

また、カメラ６００が撮像する画像データは動画像であってもよいし、静止画像であってもよい。

もちろん、復号装置１および符号化装置１０１は、上述した装置以外の装置やシステムにも適用可能である。

１復号装置，２１動き予測・補償回路，４１予測モード決定回路，４２片方向予測回路，４３双方向予測回路，４４予測回路，４５フィルタリング回路４５，５１差分計算回路，５２ローパスフィルタ回路，５３ゲイン調整回路，５４ハイパスフィルタ回路５４，５５ゲイン調整回路，５６加算回路，５７加算回路，２３１ブロック分割回路，２３２切り出し回路，２３３バッファ

可逆復号回路１２は、復号の対象になっている画像がインター符号化された画像であると判断した場合、その画像のヘッダに格納された動きベクトルと識別フラグを動き予測・補償回路２１に出力する。識別フラグにより、インター予測によって予測画像を生成する際の予測のモードが識別される。識別フラグは、例えば、マクロブロック単位、フレーム単位で設定される。

ステップＳ６４において、制御回路１３１は、１フレーム全体のマクロブロックについて以上の処理を行ったか否かを判定し、処理を行っていないと判定した場合、他のマクロブロックに注目して、ステップＳ５１以降の処理を繰り返す。

フィルタリング回路２２２は、中間出力Ｘと動き補償画像MC₀をそれぞれ、図８等における動き補償画像MC₀，MC₁としてフィルタリングを行い、フィルタリングの結果を予測画像として出力する。

１復号装置，２１動き予測・補償回路，４１予測モード決定回路，４２片方向予測回路，４３双方向予測回路，４４予測回路，４５フィルタリング回路，５１差分計算回路，５２ローパスフィルタ回路，５３ゲイン調整回路，５４ハイパスフィルタ回路，５５ゲイン調整回路，５６加算回路，５７加算回路，２３１ブロック分割回路，２３２切り出し回路，２３３バッファ

Claims

フィルタリング処理に用いるフィルタのタップ数に応じて、復号済みの参照フレームのブロックである参照ブロックを含むマクロブロックの外側に位置し前記参照ブロックと接する帯領域の幅方向の画素数を決定する決定手段と、
フィルタリング処理の対象とする画像を構成するブロックに対応する前記参照フレームのブロックである参照ブロックが、前記参照ブロックを含むマクロブロックの外周と接する場合、前記参照ブロックと前記決定手段により決定された画素数に対応する帯領域とを、前記参照フレームから取得する取得手段と、
前記取得手段により取得された参照ブロックと前記帯領域の画像を対象として、フィルタリング処理を行うフィルタリング手段と
を有する画像処理装置。
前記取得手段は、前記参照ブロックが前記参照ブロックを含むマクロブロックの外周と接することがない場合、前記参照ブロックを前記参照フレームから取得する
請求項１に記載の画像処理装置。
前記決定手段は、前記フィルタリング処理に用いられるフィルタのタップ数を２で除算して得られた値以下の最大の整数と同じ数の画素数を、前記帯領域の幅方向の画素数として決定する
請求項２に記載の画像処理装置。
前記フィルタリング手段は、
複数の画像の差分画像にローパスフィルタをかける第１のフィルタ手段と、
前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像にハイパスフィルタをかける第２のフィルタ手段と、
前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像と前記第２のフィルタ手段によりハイパスフィルタがかけられることによって得られた画像とを、複数の画像のうちのいずれかに加算して、マクロブロック単位の予測画像を生成する加算手段と
を有する請求項３に記載の画像処理装置。
フレームを構成するマクロブロック単位で復号処理が行われることによって得られた復号済みのフレームを前記参照フレームとして記憶する記憶手段を更に有し、
前記取得手段は、前記参照ブロックと前記帯領域とを、前記記憶手段により記憶された参照フレームから取得する
請求項４に記載の画像処理装置。
前記参照ブロックを動きベクトルに基づいて特定する特定手段を更に有する
請求項５に記載の画像処理装置。
前記フィルタはFIRフィルタである
請求項６に記載の画像処理装置。
フィルタリング処理に用いるフィルタのタップ数に応じて、復号済みの参照フレームのブロックである参照ブロックを含むマクロブロックの外側に位置し前記参照ブロックと接する帯領域の幅方向の画素数を決定する決定ステップと、
フィルタリング処理の対象とする画像を構成するブロックに対応する前記参照フレームのブロックである参照ブロックが、前記参照ブロックを含むマクロブロックの外周と接する場合、前記参照ブロックと前記決定ステップにおいて決定された画素数に対応する帯領域とを、前記参照フレームから取得する取得ステップと、
前記取得ステップにおいて取得された参照ブロックと前記帯領域の画像を対象として、フィルタリング処理を行うフィルタリングステップと
を有する画像処理方法。