JPWO2010095556A1

JPWO2010095556A1 - 画像処理装置および方法

Info

Publication number: JPWO2010095556A1
Application number: JP2011500572A
Authority: JP
Inventors: 央二中神; 矢ケ崎　陽一; 陽一矢ケ崎
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2009-02-19
Filing date: 2010-02-12
Publication date: 2012-08-23
Anticipated expiration: 2030-02-12
Also published as: TWI468020B; JP5831587B2; US9277235B2; US20160142731A1; US20140334549A1; US10075732B2; CN102396228B; EP2400760A4; US20180324455A1; KR20110126615A; JP2014171240A; EP2400760A1; US8824542B2; JP5532345B2; BRPI1008281A2; US10491919B2; WO2010095556A1; US20110286526A1; CN105915900A; CN105915900B

Abstract

本発明は、負荷の増大を抑制しながら符号化効率を向上させることができる画像処理装置および方法に関する。フィルタリング予測回路６４の抽出回路７１は、高解像度のエンハンスメントレイヤの予測画像生成用の動き補償画像を、低解像度のベースレイヤの参照フレームから抽出する。フィルタリング予測回路６４のフィルタリング回路７２は、抽出回路７１により抽出された複数のベースレイヤの動き補償画像に対して、アップコンバートを伴う、時間方向の解析を用いるフィルタリングを行い、エンハンスメントレイヤの予測画像を生成する。本発明は、例えば、符号化装置および復号装置に適用することができる。

Description

本発明は、画像処理装置および方法に関し、特に、負荷の増大を抑制しながら符号化効率を向上させることができるようにした画像処理装置および方法に関する。

従来、MPEG(Moving Picture Experts Group)、H.26xなどの、動き補償と、離散コサイン変換、カルーネン・レーベ変換、またはウェーブレット変換等の直交変換とを用いた符号化方式が、動画像を扱う場合の符号化方式として一般に利用されている。これらの動画像符号化方式においては、符号化の対象になる入力の画像信号がもつ特性のうち、空間方向および時間方向の相関を利用することで符号量の削減が図られている。

例えば、H.264においては、時間方向の相関を利用して、フレーム間予測（インター予測）の対象になるフレームであるインターフレームを生成する際に、片方向予測若しくは双方向予測が用いられる。フレーム間予測は、異なる時刻のフレームに基づいて予測画像を生成するものである。

さらに、H.264の拡張規格であるSVC（Scalable Video Coding）においては、空間的なスケーラビリティを考慮した符号化方式が策定されている。SVC（H.264/AVC Annex G）は、2007年11月にITU-T（International Telecommunication Union Telecommunication Standardization Sector）とISO/IEC（International Organization for Standardization/International Electrotechnical Commission）によって標準化された最新の映像符号化標準規格である。

図１に、SVCにおける空間的スケーラビリティを考慮した圧縮のための、予測画像作成のための参照関係について示す。SVCでは、例えば図１に示されるベースレイヤとエンハンスメントレイヤのように複数の解像度で符号化される。図１の例の場合、ベースレイヤとして、ｎ×ｍ［画素（pix）］の解像度をもつ画像（ｎ，ｍは整数）が、空間スケーラビリティを用いて符号化される。それとともに、エンハンスメントレイヤとしてＮ×Ｍ［画素（pix）］の解像度をもつ画像(Ｎ，Ｍは整数で、Ｎ＞ｎかつＭ＞ｍ)が、空間スケーラビリティを用いて符号化される。

ベースレイヤの場合、カレントフレームの符号化は、H.264規格の場合と同様に、イントラ予測またはインター予測を利用して行われる。図１の例の場合、ベースレイヤの符号化に際し、２枚の参照面（Ref0、Ref1）が用いられ、各参照面からの動き補償画像（MC0、MC1）が抽出されてインター予測が行われる。

エンハンスメントレイヤの場合も、カレントフレームの符号化は、基本レイヤの場合と同様に、イントラ予測またはインター予測を利用して行うことができる。

イントラ予測の場合、カレントフレームのエンハンスメントレイヤ内において、空間的な相関を利用して予測が行われる。イントラ予測は、符号化対象の動画像において、被写体の動きが少ないなど時間方向の相関が少ないときには有効であるが、一般的な動画像においては、通常、空間方向の予測よりも時間方向の相関の方が高い場合が多く、符号化効率の観点からは最適とは言えない。

インター予測の場合、時間的に前または後のフレームのエンハンスメントレイヤにおける復号画像が参照面に用いられる。インター予測は、時間方向の相関を用いるため、高い符号化効率の実現を可能にする。しかしながら、事前に参照面となる高解像度のエンハンスメントレイヤのフレーム画像を復号する必要があることが必要である。また、参照に利用するため、その高解像度画像をメモリに保存しておくことも必要である。さらに、そのデータ量の大きな高解像度画像をメモリから読み出すことが必要である。したがって、インター予測は、処理量や実装コストの観点からは、負荷の大きな方式といえる。

ただし、エンハンスメントレイヤの場合、カレントフレームの符号化に、これらの２方式以外に、ベースレイヤの空間的なアップサンプリング（アップコンバート）による予測方法（以下、アップコンバート予測と称する）を用いることができる。

ベースレイヤの画像は、エンハンスメントレイヤの画像の解像度を低下させたものであるので、エンハンスメントレイヤの画像の低周波数成分に相当する信号が含まれていると考える事ができる。つまり、ベースレイヤの画像に高周波数成分を補うことで、エンハンスメントレイヤの画像を得ることができる。アップコンバート予測は、このようなレイヤ間の相関を利用してに予測を行う方法である。特にイントラまたはインター予測が当たらない場合において、符号化効率改善に役立つ予測方法である。また、この予測方法では、カレントフレームのエンハンスメントレイヤの画像の復号に、同一時刻のベースレイヤの画像を復号するだけで済むため、処理量の観点からも優れた（負荷の小さい）予測方式といえる。

ところで高解像度化処理には、時間方向の相関を、動き補償と画素値のFIRフィルタリングにより、空間解像度に変換して利用する手法がある。（例えば、非特許文献１参照）。

非特許文献１に記載の方法では、入力画像列に対する高解像度化処理のために、時間方向の相関を利用している。具体的には、現画像と過去の画像の間で、動き予測・補償した画像の差分情報を計算し、対象の現画像にフィードバックすることで、入力画像に含まれる高周波成分を復元させている。

"Improving Resolution by Image Registration", MICHAL IRANI AND SHMUEL PELEG, Department of Computer Science, The Hebrew University of Jerusalem, 91904 Jerusalem, Israel, Communicated by Rama Chellapa, Received June 16, 1989; accepted May 25, 1990

しかしながら、低解像度の画像をアップコンバートすると、線形補間フィルタの影響で高周波数成分の少ない画像が生成されるので、アップコンバート予測では、高周波数成分の少ない予測画像しか得られない恐れがあった。つまり、アップコンバート予測では、伝送済みのベースレイヤにおける画素情報を十分に利用して予測を行っているとは言えなかった。したがって、エンハンスメントレイヤにおいて、残差信号の符号化に多くの符号量が必要になる恐れがあった。

以上のように、従来の符号化・復号方法においては、符号化効率の向上と負荷の増大の抑制を両立させることは困難であった。

そこで、非特許文献１に記載されているような、動画像の時間相関を空間解像度に変換する画像処理の手法を適用し、符号化効率の改善を実現する方法が考えられる。しかしながら、非特許文献１に記載の方法を、単純にSVCに適用することができなかった。

例えば、インター予測においては、参照面より得られる動き補償画像と生成される予測画像の解像度が同じであり、非特許文献１に記載の方法をアップコンバート予測に適用することはできなかった。また、アップコンバート予測においては、ベースレイヤのカレントフレームの画像のみから予測画像が生成されるため、３つの画像を用いて高解像度化を行う非特許文献１に記載の方法をアップコンバート予測に適用することはできなかった。

本発明は、このような状況に鑑みて提案されたものであり、空間スケーラビリティを考慮した符号化を行うにあたり、動画像信号列に含まれる時間相関をより効率的に利用することで、例えば符号化や復号等の処理の負荷の増大を抑制しながら符号化効率を向上させることができるようにするものである。

本発明の一側面は、符号化された画像を復号する復号手段と、前記復号手段により復号された画像と予測画像とを加算し、復号済みの画像を生成する生成手段と、前記生成手段により生成された復号済みの画像からなるフレームを参照フレームとして、符号化された前記画像の動きベクトルを用いて動き補償を行い、前記予測画像よりも低解像度の動き補償画像を、前記予測画像に対応する前記参照フレームから抽出する抽出手段と、前記抽出手段により抽出された前記動き補償画像に対して、前記動き補償画像に含まれる時間方向の相関を利用して高周波成分を補うフィルタリング処理を行うことにより、前記動き補償画像よりも高解像度の前記予測画像を生成する予測画像生成手段とを備える画像処理装置である。

前記符号化された画像は、互いに解像度の異なる複数のレイヤに階層化されて符号化されており、前記復号手段は、各レイヤにおいて前記符号化された画像を復号し、前記生成手段は、各レイヤにおいて前記復号済みの画像を生成し、前記抽出手段は、高解像度のレイヤの復号の際に、前記レイヤよりも低解像度のレイヤの前記フレームを前記参照フレームとし、前記低解像度のレイヤの前記参照フレームから前記動き補償画像を抽出し、前記予測画像生成手段は、前記低解像度のレイヤの前記参照フレームから抽出された前記動き補償画像に対して前記フィルタリング処理を行うことにより、前記高解像度のレイヤの前記予測画像を生成することができる。

前記予測画像生成手段は、前記抽出手段により抽出された複数の前記動き補償画像の差分画像の解像度を変換し、高解像度化する解像度変換手段と、前記解像度変換手段により高解像度化された前記差分画像にローパスフィルタをかける第１のフィルタ手段と、前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像にハイパスフィルタをかける第２のフィルタ手段と、前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像と、前記第２のフィルタ手段によりハイパスフィルタがかけられることによって得られた画像とを、前記抽出手段により抽出された複数の前記動き補償画像のうちのいずれかに加算し、前記予測画像を生成する加算手段とを備えることができる。

前記加算手段は、前記予測画像の時刻を基準として１時刻前のフレームから抽出された前記動き補償画像に対して、前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像と、前記第２のフィルタ手段によりハイパスフィルタがかけられることによって得られた画像とを加算することができる。

複数の前記動き補償画像を用いて片方向予測を行い、前記予測画像を生成する片方向予測手段と、複数の前記動き補償画像を用いて双方向予測を行い、前記予測画像を生成する双方向予測手段と、符号化された前記画像のヘッダに含まれる識別フラグにより、前記予測画像を、前記片方向予測手段による片方向予測によって生成するのか、前記双方向予測手段による双方向予測によって生成するのか、または、前記予測画像生成手段による前記フィルタリング処理によって生成するのかを判定する判定手段とをさらに備えることができる。

本発明の一側面はまた、符号化された画像を復号し、復号された画像と予測画像とを加算し、復号済みの画像を生成し、生成された復号済みの画像からなるフレームを参照フレームとして、符号化された前記画像の動きベクトルを用いて動き補償を行い、前記予測画像よりも低解像度の動き補償画像を、前記予測画像に対応する前記参照フレームから抽出し、抽出された前記動き補償画像に対して、前記動き補償画像に含まれる時間方向の相関を利用して高周波成分を補うフィルタリング処理を行うことにより、前記動き補償画像よりも高解像度の前記予測画像を生成する画像処理方法である。

本発明の他の側面は、符号化対象の画像である原画像を符号化し、符号化された画像を生成する符号化手段と、前記原画像と予測画像との差を示す残差信号に基づいて局所的に復号して得られた画像と前記原画像とに基づいて動きベクトルを検出する検出手段と、局所的に復号して得られた前記画像からなるフレームを参照フレームとして、前記検出手段により検出された動きベクトルを用いて動き補償を行い、前記予測画像よりも低解像度の動き補償画像を、前記予測画像に対応する前記参照フレームから抽出する抽出手段と、前記抽出手段により抽出された前記動き補償画像に対して、前記動き補償画像に含まれる時間方向の相関を利用して高周波成分を補うフィルタリング処理を行うことにより、前記動き補償画像よりも高解像度の前記予測画像を生成する生成手段とを備える画像処理装置である。

前記符号化手段は、互いに解像度の異なる複数のレイヤにおいて符号化された画像を生成し、前記抽出手段は、高解像度のレイヤの復号の際に、前記レイヤよりも低解像度のレイヤの前記フレームを前記参照フレームとし、前記検出手段により前記低解像度のレイヤにおいて検出された前記動きベクトルを用いて、前記低解像度のレイヤの前記参照フレームから前記動き補償画像を抽出し、前記生成手段は、前記低解像度のレイヤの前記参照フレームから抽出された前記動き補償画像に対して前記フィルタリング処理を行うことにより、前記高解像度のレイヤの前記予測画像を生成することができる。

前記生成手段は、前記抽出手段により抽出された複数の前記動き補償画像の差分画像の解像度を変換し、高解像度化する解像度変換手段と、前記解像度変換手段により高解像度化された前記差分画像にローパスフィルタをかける第１のフィルタ手段と、前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像にハイパスフィルタをかける第２のフィルタ手段と、前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像と、前記第２のフィルタ手段によりハイパスフィルタがかけられることによって得られた画像とを、前記抽出手段により抽出された複数の前記動き補償画像のうちのいずれかに加算し、前記予測画像を生成する加算手段とを備えることができる。

前記符号化手段は、復号装置において復号した画像に加算する予測画像を、片方向予測によって生成するのか、双方向予測によって生成するのか、または、前記フィルタリング処理によって生成するのかを識別する識別フラグをヘッダに含めることができる。

本発明の他の側面はまた、符号化対象の画像である原画像を符号化し、符号化された画像を生成し、前記原画像と予測画像との差を示す残差信号に基づいて局所的に復号して得られた画像と前記原画像とに基づいて動きベクトルを検出し、局所的に復号して得られた前記画像からなるフレームを参照フレームとして、検出された動きベクトルを用いて動き補償を行い、前記予測画像よりも低解像度の動き補償画像を、前記予測画像に対応する前記参照フレームから抽出し、抽出された前記動き補償画像に対して、前記動き補償画像に含まれる時間方向の相関を利用して高周波成分を補うフィルタリング処理を行うことにより、前記動き補償画像よりも高解像度の前記予測画像を生成する画像処理方法である。

本発明の一側面においては、符号化された画像が復号され、復号された画像と予測画像とが加算され、復号済みの画像が生成され、生成された復号済みの画像からなるフレームを参照フレームとして、符号化された画像の動きベクトルが用いられて動き補償が行われ、予測画像よりも低解像度の動き補償画像が予測画像に対応する参照フレームから抽出され、抽出された動き補償画像に対して、動き補償画像に含まれる時間方向の相関を利用して高周波成分を補うフィルタリング処理を行うことにより、動き補償画像よりも高解像度の予測画像が生成される。

本発明の他の側面においては、符号化対象の画像である原画像が符号化され、符号化された画像が生成され、原画像と予測画像との差を示す残差信号に基づいて局所的に復号して得られた画像と原画像とに基づいて動きベクトルが検出され、局所的に復号して得られた画像からなるフレームを参照フレームとして、検出された動きベクトルを用いて動き補償が行われ、予測画像よりも低解像度の動き補償画像が予測画像に対応する参照フレームから抽出され、抽出された動き補償画像に対して、動き補償画像に含まれる時間方向の相関を利用して高周波成分を補うフィルタリング処理が行われることにより、動き補償画像よりも高解像度の予測画像が生成される。

本発明によれば、情報を処理することができる。特に、負荷を不要に増大させることなく、精度の高い予測画像を生成し、符号化効率を向上させることができる。

従来の空間的なスケーラビリティを考慮した符号化方式の復号の様子を説明する図である。本発明を適用した予測画像生成の概要を説明する図である。本発明を適用した復号装置の主な構成例を示すブロック図である。図３の可逆復号回路の主な構成例を示すブロック図である。図３の動き予測・補償回路の主な構成例を示すブロック図である。図５のフィルタリング予測回路の主な構成例を示すブロック図である。復号処理の流れの例を説明するフローチャートである。可逆復号処理の流れの例を説明するフローチャートである。復号の際のフィルタリング予測処理の流れの例を説明するフローチャートである。本発明を適用した符号化装置の主な構成例を示すブロック図である。図１０のモード決定回路の主な構成例を示すブロック図である。動き予測・補償回路の主な構成例を示すブロック図である。符号化処理の流れの例を説明するフローチャートである。モード決定処理の流れの例を説明するフローチャートである。符号化の際のフィルタリング予測処理の流れの例を説明するフローチャートである。本発明を適用した復号処理の概要の、他の例を説明する図である。図６のフィルタリング回路の、他の構成例を示すブロック図である。本発明を適用した復号処理の概要の、さらに他の例を説明する図である。復号の際のフィルタリング予測処理の流れの、他の例を説明するフローチャートである。符号化の際のフィルタリング予測処理の流れの、他の例を説明するフローチャートである。本発明を適用したパーソナルコンピュータの主な構成例を示すブロック図である。本発明を適用したテレビジョン受像機の主な構成例を示すブロック図である。本発明を適用した携帯電話機の主な構成例を示すブロック図である。本発明を適用したハードディスクレコーダの主な構成例を示すブロック図である。本発明を適用したカメラの主な構成例を示すブロック図である。マクロブロックサイズの例を示す図である。

以下、発明を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
１．第１の実施の形態（復号処理）
２．第２の実施の形態（符号化処理）
３．第３の実施の形態（動き補償画像が３つ以上の復号処理）
４．第４の実施の形態（同一レイヤの動き補償画像を用いる復号処理・符号化処理）

＜１．第１の実施の形態＞
［予測の概要］
図２は、本発明を適用した予測画像生成方法の概要を説明する図である。図２に示されるように、この場合、ベースレイヤにおける複数の参照面の画像に対してフィルタリングを行うことで、エンハンスメントレイヤにおけるカレントブロック（現在時刻の処理対象ブロック）の予測画像を生成する。

このように時間方向の解析を用いることで、空間的なアップサンプリングフィルタに比べ、画像列中の信号成分をより有効に利用することが可能になる。この結果、本発明の手法（以下、フィルタリング予測と称する）により生成した予測画像は、ベースレイヤのカレントフレーム（現在時刻の処理対象フレーム）の画像を利用する従来のアップコンバート予測により生成した予測画像よりも空間的に高い周波数成分を有しつつ予測残差を低減させることができる。つまり、エンハンスメントレイヤにおける符号化ピクチャの符号量を低減させることができ、符号化効率の改善に貢献することが可能になる。

さらに、このフィルタリング予測では、時間的に異なるフレームにおけるエンハンスメントレイヤの復号画像を参照しないため、符号化に必要な処理量、一時記憶容量、メモリからの読み出し情報量等を低減させることができ、実装にかかるコストを低減させることができる。また、消費電力も低減させることができる。

［復号装置の構成］
図３は、本発明の一実施形態に係る復号装置１の構成例を示すブロック図である。

復号装置１に対しては、後述する符号化装置により符号化された画像情報がケーブル、ネットワーク、またはリムーバブルメディアを介して入力される。圧縮画像情報は、例えば、H.264/SVC規格に従って符号化された画像情報である。

SVCにおいて、圧縮画像情報は、複数の解像度のレイヤにより構成される。最も低解像度のレイヤがベースレイヤであり、ベースレイヤより高解像度のレイヤがエンハンスメントレイヤである。なお、このレイヤ数は任意であるが、以下においては、圧縮画像情報が２層により構成されるものとする。すなわち、復号装置１に入力される圧縮画像情報は、ベースレイヤと１層のエンハンスメントレイヤよりなる。

復号装置１には、各フレームの圧縮画像情報が順に入力されるが、各フレームにおいて、各レイヤのビットストリームが低解像度側から高解像度側に向けて順に入力される。つまりベースレイヤのビットストリームが先に復号装置１に入力される。

ベースレイヤのビットストリームは、H.264/AVC規格の圧縮画像情報の場合と同様に復号されるので、ここでは説明を省略する。ベースレイヤのビットストリームが復号された後、復号装置１には、エンハンスメントレイヤのビットストリームが入力される。以下においては、基本的に、エンハンスメントレイヤのビットストリームに対する処理について説明する。

蓄積バッファ１１は、圧縮画像情報として入力されたビットストリームを順に記憶する。蓄積バッファ１１に記憶された情報は、適宜、フレームを構成するマクロブロックなどの所定の単位の画像毎に可逆復号回路１２により読み出される。H.264規格においては、１６×１６画素のマクロブロック単位ではなく、それをさらに分割した８×８画素、４×４画素などのブロック単位で処理を行うことも可能とされている。

可逆復号回路１２は、蓄積バッファ１１から読み出した画像に対して、可変長復号処理、算術復号処理等の、符号化方式に対応する復号処理を施す。可逆復号回路１２は、復号処理を施すことによって得られた、量子化された変換係数を逆量子化回路１３に出力する。

また、可逆復号回路１２は、復号の対象になっている画像のヘッダに含まれる識別フラグに基づいて、予測方法を識別する。可逆復号回路１２は、復号の対象になっている画像がイントラ符号化された画像であると判断した場合、その画像のヘッダに格納されたイントラ予測モード情報をイントラ予測回路２２に出力する。イントラ予測モード情報には、処理の単位となるブロックのサイズなどのイントラ予測に関する情報が含まれる。

可逆復号回路１２は、復号の対象になっている画像がインター符号化された情報であると判断した場合、その画像のヘッダに格納された動きベクトルと識別フラグを動き予測・補償回路２１に出力する。識別フラグにより、インター予測によって予測画像を生成する際の予測のモードが識別される。識別フラグは、例えば、マクロブロック単位、フレーム単位で設定される。

予測のモードとして、片方向予測のモード、双方向予測のモード、アップコンバート予測のモードの他に、ベースレイヤの時間的に一方向または双方向にある複数の参照フレームから抽出した動き補償画像にフィルタリングを施して予測画像を生成するフィルタリング予測のモードが用意されている。

以下、一方向にある複数の参照フレームから抽出した動き補償画像のうちのいずれかの動き補償画像の画素値を予測画像の画素値とする予測のモードを単に片方向予測モードという。また、双方向にある複数の参照フレームからそれぞれ抽出した動き補償画像の画素値の平均値を予測画像の画素値とする予測のモードを単に双方向予測モードという。さらに、ベースレイヤのカレントフレームから抽出した動き補償画像をアップコンバートして予測画像の画素値を求める予測のモードを単にアップコンバート予測モードという。

ベースレイヤの一方向または双方向にある複数の参照フレームから抽出したそれぞれの動き補償画像に対してアップコンバートを含むフィルタリングを施して予測画像の画素値を求める図２に示されるような第４の予測のモードをフィルタリング予測モードという。

逆量子化回路１３は、可逆復号回路１２から供給された量子化された状態の変換係数に対して、符号化側における量子化方式に対応する方式で逆量子化を行う。逆量子化回路１３は、逆量子化を行うことによって得られた変換係数を逆直交変換回路１４に出力する。

逆直交変換回路１４は、離散コサイン変換、カルーネン・レーベ変換等の、符号化側における直交変換方式に対応する方式で例えば４次の逆直交変換を逆量子化回路１３から供給された変換係数に対して施し、得られた画像を加算回路１５に出力する。

加算回路１５は、逆直交変換回路１４から供給された復号画像と、動き予測・補償回路２１から、またはイントラ予測回路２２からスイッチ２３を介して供給された予測画像を合成し、合成画像をデブロックフィルタ１６に出力する。

デブロックフィルタ１６は、加算回路１５から供給された画像に含まれるブロック歪を除去し、ブロック歪を除去した画像を出力する。デブロックフィルタ１６から出力された画像は並べ替えバッファ１７とフレームメモリ１９に供給される。

並べ替えバッファ１７は、デブロックフィルタ１６から供給された画像を一時的に記憶する。並べ替えバッファ１７は、記憶している例えばマクロブロック単位の画像から各フレームを生成し、生成したフレームを表示順などの所定の順番に並べ替えてD/A(Digital/Analog)変換回路１８に出力する。

D/A変換回路１８は、並べ替えバッファ１７から供給された各フレームに対してD/A変換を施し、各フレームの信号を外部に出力する。

フレームメモリ１９は、デブロックフィルタ１６から供給された画像を一時的に記憶する。フレームメモリ１９に記憶された情報は、スイッチ２０を介して、動き予測・補償回路２１またはイントラ予測回路２２に供給される。なお、フレームメモリ１９には、エンハンスメントレイヤより先に復号されたベースレイヤの画像も記憶されており、後述するようにエンハンスメントレイヤの復号に利用される。

スイッチ２０は、予測画像をインター予測により生成する場合、端子ａ1に接続し、イントラ予測により生成する場合、端子ｂ1に接続する。スイッチ２０の切り替えは例えば制御回路３１により制御される。

動き予測・補償回路２１は、可逆復号回路１２から供給された識別フラグに従って予測モードを決定し、フレームメモリ１９に記憶されている復号済みのフレームの中から、参照フレームとして用いるフレームを予測モードに応じて選択する。動き予測・補償回路２１は、参照フレームを構成するマクロブロックの中から、対象とする予測画像に対応するマクロブロックを可逆復号回路１２から供給された動きベクトルに基づいて決定し、決定したマクロブロックを動き補償画像として抽出する。動き予測・補償回路２１は、動き補償画像の画素値から予測画像の画素値を予測モードに応じて求め、画素値を求めた予測画像を、スイッチ２３を介して加算回路１５に出力する。

イントラ予測回路２２は、可逆復号回路１２から供給されたイントラ予測モード情報に従ってイントラ予測を行い、予測画像を生成する。イントラ予測回路２２は、生成した予測画像を、スイッチ２３を介して加算回路１５に出力する。

スイッチ２３は、動き予測・補償回路２１により予測画像が生成された場合、端子ａ2に接続し、イントラ予測回路２２により予測画像が生成された場合、端子ｂ2に接続する。スイッチ２３の切り替えも例えば制御回路３１により制御される。

制御回路３１は、スイッチ２０，２３の接続を切り替えるなどして、復号装置１の全体の動作を制御する。処理対象の画像の予測方法の識別が制御回路３１により行われるようにしてもよい。

図４は、図３の可逆復号回路１２の主な構成例を示すブロック図である。

図４に示されるように、可逆復号回路１２は、予測判定回路４１および復号処理回路４２を有する。予測判定回路４１は、蓄積バッファ１１より供給される画像の予測方法を判定する。予測判定回路４１は、例えば、復号の対象になっている画像のヘッダに含まれる識別フラグに基づいて、予測方法を識別する。なお、予測判定回路４１が、ビットストリームを解析することにより、この予測方法の識別を行うようにしてももちろんよい。この場合、識別フラグは省略することができるので、圧縮画像情報の情報量を低減させることができる。

予測判定回路４１は、復号の対象になっている画像がイントラ符号化された画像であると判断した場合、画像のヘッダに格納されたイントラ予測モード情報をイントラ予測回路２２に出力する。また、予測判定回路４１は、復号の対象になっている画像がインター符号化された情報であると判断した場合、その画像のヘッダに格納された動きベクトルと識別フラグを動き予測・補償回路２１に出力する。

予測判定回路４１は、さらに、予測方法を判定した画像のビットストリームを復号処理回路４２に供給する。復号処理回路４２は、その画像に対して、可変長復号処理、算術復号処理等の、符号化方式に対応する復号処理を施す。予測判定回路４１は、復号処理を施すことによって得られた、量子化された変換係数を逆量子化回路１３に出力する。

図５は、図３の動き予測・補償回路の主な構成例を示すブロック図である。

図５に示されるように、動き予測・補償回路２１は、予測選択回路５１、片方向予測回路６１、双方向予測回路６２、アップコンバート予測回路６３、およびフィルタリング予測回路６４を有する。可逆復号回路１２（予測判定回路４１）から供給された動きベクトルと識別フラグは予測選択回路５１に入力される。

予測選択回路５１は、予測判定回路４１から供給された識別フラグに従って予測モードを選択する。予測選択回路５１は、片方向予測によって予測画像の生成を行うことを決定した場合、動きベクトルを片方向予測回路６１に出力する。また、予測選択回路５１は、双方向予測によって予測画像の生成を行うことを決定した場合、動きベクトルを双方向予測回路６２に出力する。さらに、予測選択回路５１は、アップコンバート予測によって予測画像の生成を行うことを決定した場合、その指示をアップコンバート予測回路６３に出力する。

また、予測選択回路５１は、フィルタリング予測によって予測画像の生成を行うことを決定した場合、動きベクトルをフィルタリング予測回路６４に出力する。

このように、フィルタリング予測を識別することができるようにするため、従来の規格で定められている、片方向予測を表す値、双方向予測を表す値、およびアップコンバート予測を表す値とは異なる値を、識別フラグの値として設定することが可能とされている。

片方向予測回路６１は、エンハンスメントレイヤの時間的に一方向にある複数のフレームを参照フレームとし、予測画像に対応する参照フレームのマクロブロックを動きベクトルに基づいて決定する。また、片方向予測回路６１は、決定したそれぞれの参照フレームのマクロブロックを動き補償画像としてフレームメモリ１９から読み出し、いずれかの動き補償画像の画素値を予測画像の画素値とすることによって予測画像を生成する。片方向予測回路６１は、生成した予測画像を加算回路１５に出力する。片方向予測回路６１による片方向予測としては、例えばH.264/SVC規格（またはH.264規格）で規定された片方向予測が用いられる。

双方向予測回路６２は、エンハンスメントレイヤの時間的に双方向にある複数のフレームを参照フレームとし、予測画像に対応する参照フレームのマクロブロックを動きベクトルに基づいて決定する。また、双方向予測回路６２は、決定したそれぞれの参照フレームのマクロブロックを動き補償画像としてフレームメモリ１９から読み出し、読み出した動き補償画像の画素値の平均を予測画像の画素値とすることによって予測画像を生成する。双方向予測回路６２は、生成した予測画像を加算回路１５に出力する。双方向予測回路６２による双方向予測としては、例えばH.264/SVC規格（またはH.264規格）で規定された双方向予測が用いられる。

アップコンバート予測回路６３は、図１に示されるように、ベースレイヤのカレントフレームを参照フレームとする。アップコンバート予測回路６３は、そのベースレイヤの参照フレームから、エンハンスメントレイヤのカレントフレームの処理対象マクロブロックと同じ位置のマクロブロックを抽出する。つまり、アップコンバート予測回路６３は、ベースレイヤの参照フレームの、処理対象マクロブロックに対応するマクロブロックを、フレームメモリ１９から読み出す。この抽出されたマクロブロックは、ベースレイヤのマクロブロックであるため、処理対象マクロブロックに対して低解像度である。アップコンバート予測回路６３は、この抽出されたベースレイヤのマクロブロックをアップコンバートすることにより、処理対象マクロブロックの予測画像を生成する。

アップコンバート予測回路６３は、生成した予測画像を加算回路１５に出力する。アップコンバート予測回路６３による双方向予測としては、例えばH.264/SVC規格で規定されたアップコンバート予測が用いられる。

フィルタリング予測回路６４は、図２に示されるように、ベースレイヤの、時間的に一方向、または双方向にある複数のフレームを参照フレームとして決定する。どのフレームを参照フレームとするのかは、予め決定されているようにしてもよいし、識別フラグとともに符号化側から伝送されてきた情報により指定されるようにしてもよい。例えば、カレントフレームより時間的に１時刻前とその１時刻前にある２枚のフレームが参照フレームとされるようにしてもよい。また、例えば、カレントフレームより時間的に１時刻前と１時刻後にある２枚のフレームが参照フレームとされるようにしてもよい。もちろん、この他のフレームを参照フレームとしてもよい。

フィルタリング予測回路６４は、以上のように決定したベースレイヤの参照フレームの、予測画像に対応するマクロブロックを予測選択回路５１から供給された動きベクトルに基づいて決定する。フィルタリング予測回路６４は、決定したそれぞれの参照フレームのマクロブロックを動き補償画像としてフレームメモリ１９から読み出す。なお、動きベクトルが、１６×１６画素などのマクロブロック単位で行われるのではなく、マクロブロックをさらに分割したブロック単位で行われるようにしてもよい。

この動き補償画像は、ベースレイヤの画像であるので、エンハンスメントレイヤの処理対象マクロブロックより低解像度である。フィルタリング予測回路６４は、この動き補償画像を入力として、アップコンバートを伴うフィルタリングを行い、フィルタリングを行うことによって得られた予測画像を加算回路１５に出力する。この予測画像は、エンハンスメントレイヤのマクロブロックの解像度にアップコンバートされている。

フィルタリング予測回路６４は、生成した予測画像を加算回路１５に出力する。

図６は、図５のフィルタリング予測回路６４の主な構成例を示すブロック図である。図６の構成を有するフィルタリング予測回路６４においては、時間領域の信号に対してフィルタリングが施される。

図６に示されるように、フィルタリング予測回路６４は、抽出回路７１およびフィルタリング回路７２を有する。抽出回路７１は、予測選択回路５１より供給される情報に基づいて、ベースレイヤの参照フレームを特定し、そのベースレイヤの参照フレームより動き補償画像（例えば動き補償画像MC0および動き補償画像MC1）を抽出する。

本発明のために用いる複数の低解像度画像の識別のための１つの手段として、新たな信号を付加せずに、ベースレイヤのストリーム中の信号を利用することが考えられる。

すなわち、１番目の入力として、現在時刻における低解像度画像において、空間的に同一位置における復号画像を用い、２番目の入力として、その画像が時間予測に用いた時間的に過去または未来における低解像度画像の２つを、続くフィルタリング処理のための入力とする方法である。

つまり、この場合、抽出回路７１は、ベースレイヤのカレントフレームの、エンハンスメントレイヤの処理対象マクロブロックと同じ位置のマクロブロックを１つの動き補償画像とし、さらに、そのベースレイヤのマクロブロックの復号時に用いられた動きベクトルを用いて他の動き補償画像を抽出する。この手法の利点は、ストリーム中に新たな信号が追加されないために、符号化効率の観点から有利であることである。

このとき、低解像度画像において、複数の参照フレームの情報を復号に用いている場合、具体的には、双方向予測などを行っている場合には、２番目、３番目の入力として、それら予測画像のすべてを使ってもよい。

一般に、相関の高い時間情報をたくさん利用するほど、続くフィルタリング処理における高解像度生成結果があがるため、この方法は有効である。

さらに、より高い精度で高解像度画像のフィルタリング処理により生成するために、新たに１つまたは複数の動きベクトルを符号化する方法も挙げられる。

つまり、この場合、ベースレイヤの復号時に利用される動きベクトルとは別に、エンハンスメントレイヤの復号用に新たな動きベクトルが符号化される。この方法は、ストリーム中に新たな信号が追加されることになるが、エンハンスメントレイヤに対する予測精度があがることで、エンハンスメントレイヤにおける残差信号の低減が可能になるため、符号化効率の観点から有効になる場合がある。

抽出回路７１は、以上のようにして、動き補償画像MC0および動き補償画像MC1を特定し、その情報をフレームメモリ１９より取得する。抽出回路７１は、抽出した動き補償画像MC0および動き補償画像MC1をフィルタリング回路７２に供給する。

フィルタリング回路７２は、供給された動き補償画像MC0および動き補償画像MC1に対してアップコンバートを伴うフィルタリングを行い、予測画像を生成する。つまり、フィルタリング回路７２は、抽出回路７１により抽出された複数の動き補償画像に対して、その動き補償画像に含まれる時間方向の相関を利用して高周波成分を補うフィルタリング処理を行うことにより、動き補償画像よりも高解像度の予測画像を生成する。このようにして生成された予測画像は、高周波成分が補われているので、その予測精度が向上する。結果として、符号化効率が向上する。

フィルタリング回路７２は、図６に示されるように、差分計算回路８１、アップコンバート回路８２、ローパスフィルタ回路８３、ゲイン調整回路８４、ハイパスフィルタ回路８５、ゲイン調整回路８６、加算回路８７、アップコンバート回路８８、および加算回路８９を有する。

抽出回路７１から供給された動き補償画像MC0は差分計算回路８１とアップコンバート回路８８に入力され、動き補償画像MC1は差分計算回路８１に入力される。

片方向予測によって予測画像を生成する場合、例えば、予測画像との相関がより高いと考えられる、カレントフレームに近い参照フレームＲ0から抽出された画像が動き補償画像MC0とされ、カレントフレームに遠い参照フレームＲ1から抽出された画像が動き補償画像MC1とされる。参照フレームＲ0から抽出された画像が動き補償画像MC1とされ、参照フレームＲ1から抽出された画像が動き補償画像MC0とされるようにしてもよい。

また、双方向予測によって予測画像を生成する場合、例えば、１時刻前の参照フレームＬ0から抽出された画像が動き補償画像MC0とされ、１時刻後の参照フレームＬ1から抽出された画像が動き補償画像MC1とされる。参照フレームＬ0から抽出された画像が動き補償画像MC1とされ、参照フレームＬ1から抽出された画像が動き補償画像MC0とされるようにしてもよい。

差分計算回路８１は、動き補償画像MC0と動き補償画像MC1の差分を、例えば以下の式（１）のように計算し、差分画像Ｄをアップコンバート回路８２に出力する。

Ｄ（ｉ，ｊ）＝Ａ（ｉ，ｊ）−Ｂ（ｉ，ｊ）・・・（１）

式（１）において、（ｉ，ｊ）は動き補償画像内における画素の相対位置を表す。例えば、１６×１６画素のマクロブロック単位で処理が行われるようになされている場合、０≦ｉ≦１６、０≦ｊ≦１６となる。以下、同様とする。

アップコンバート回路８２は、差分計算回路８１により算出された差分画像Ｄに対して、解像度の変換を行う。この解像度変換比率は、ベースレイヤとエンハンスメントレイヤの空間解像度の比率による。例えば、ベースレイヤの解像度がｎ×ｍ［画素］（ｎ,ｍは整数）、エンハンスメントレイヤがＮ×Ｍ［画素］（Ｎ,Ｍは整数でＮ＞ｎ,Ｍ＞ｍ）の場合、水平方向の倍率H_Scaleと垂直方向の倍率V_Scaleは、式（２）および式（３）で示される。

H_Scale＝Ｎ／ｎ・・・（２）
V_Scale＝Ｍ／ｍ・・・（３）

アップコンバート回路８２は、このように解像度変換（アップコンバート）された差分画像Ｄ’をローパスフィルタ回路８３に出力する。

ローパスフィルタ回路８３はFIRフィルタ回路を有する。ローパスフィルタ回路８３は、アップコンバート回路８２から供給された差分画像Ｄ’に対してローパスフィルタをかけ、得られた画像をゲイン調整回路８４とハイパスフィルタ回路８５に出力する。ローパスフィルタをかけることによって得られた画像である差分画像Ｄ’’は、以下の式（４）により表される。

Ｄ’’＝LPF（Ｄ’）・・・（４）

式（４）のLPF（Ｘ）は、入力画像Ｘに対して２次元のFIRフィルタを用いてローパスフィルタをかけることを表す。

ゲイン調整回路８４は、ローパスフィルタ回路８３から供給された差分画像Ｄ’’のゲインを調整し、ゲインを調整した画像を加算回路８７に出力する。０≦Ｉ≦１６×H_Scaleとし、０≦Ｊ≦１６×V_Scaleとすると、ゲイン調整回路８４の出力画像Ｘ（Ｉ，Ｊ）は以下の式（５）のように表される。

Ｘ（Ｉ，Ｊ）＝αＤ’’（Ｉ，Ｊ）・・・（５）

ハイパスフィルタ回路８５はFIRフィルタ回路を有する。ハイパスフィルタ回路８５は、ローパスフィルタ回路８３から供給された差分画像Ｄ’’に対してハイパスフィルタをかけ、得られた画像をゲイン調整回路８６に出力する。ハイパスフィルタをかけることによって得られた画像である差分画像Ｄ’’’は以下の式（６）のように表される。

Ｄ’’’＝HPF（Ｄ’’）・・・（６）

式（６）のHPF（Ｘ）は、入力画像Ｘに対して２次元のFIRフィルタによるハイパスフィルタリング処理を施すことを示す。

ゲイン調整回路８６は、ハイパスフィルタ回路８５から供給された差分画像Ｄ’’’のゲインを調整し、ゲインを調整した画像を加算回路８７に出力する。ゲイン調整回路８６の出力画像Ｙ（Ｉ，Ｊ）は、以下の式（７）のように表される。

Ｙ（Ｉ，Ｊ）＝βＤ’’’（Ｉ，Ｊ）・・・（７）

式（５）のα、および、式（７）のβの値としては、例えばα＝０．８、β＝０．２といった値が選ばれるが、予測画素の精度を上げるためにこれ以外の値とされるようにしてもよい。また、入力シーケンスの性質などに応じて適応的に変えるようにしてもよい。

加算回路８７は、ゲイン調整された画像Ｘ（Ｉ，Ｊ）と画像Ｙ（Ｉ，Ｊ）を加算し、加算して得られた画像を出力する。加算回路８７の出力画像Ｚ（Ｉ，Ｊ）は以下の式（８）のように表される。

Ｚ（Ｉ，Ｊ）＝Ｘ（Ｉ，Ｊ）＋Ｙ（Ｉ，Ｊ）・・・（８）

出力画像Ｚ（Ｉ，Ｊ）は、動き補償画像MC0と動き補償画像MC1の差分、すなわち相関から求められる、画像の高周波成分を表すものになる。

アップコンバート回路８８は、動き補償画像MC0に対して、解像度の変換を行う。この解像度変換比率は、アップコンバート回路８２の場合と同様に、ベースレイヤとエンハンスメントレイヤの空間解像度の比率による。つまり、水平方向の倍率H_Scaleと垂直方向の倍率V_Scaleは、上述した式（２）および式（３）で示される。アップコンバート回路８８は、このように解像度変換（アップコンバート）された動き補償画像MC0である画像Ａ’を加算回路８９に出力する。

加算回路８９は、アップコンバート回路８８より供給された画像Ａ’に対して、加算回路８７から供給された出力画像Ｚ（Ｉ，Ｊ）を足し込み、得られた画像を予測画像として加算回路１５に出力する。加算回路８９の最終出力である予測画像Ｓ（Ｉ，Ｊ）は、以下の式（９）のように表される。

Ｓ（Ｉ，Ｊ）＝Ａ’（Ｉ，Ｊ）＋Ｚ（Ｉ，Ｊ）・・・（９）

このように、フィルタリング予測モードによれば、ベースレイヤの画像をアップコンバートして生成された高周波成分を表す画像を、動き補償画像MC0がアップコンバートされた画像に足し込むことによって、予測画像が生成される。

以上のようなフィルタリング予測モードで予測画像を生成することにより、復号装置１は、ベースレイヤのカレントフレームの画像をアップコンバートして得られるアップコンバート予測の予測画像よりも高周波数成分をより多く含む予測画像を得ることができる。また、複数の動き補償画像から予測画像を生成する際に、上述したようにフィルタリングを行うので、復号装置１は、単純に複数の動き補償画像の各画素の平均値を、各画素値とする予測画像よりも高周波数成分をより多く含む予測画像を得ることができる。

さらに、エンハンスメントレイヤのフレームを参照して予測画像を生成するインター予測の場合よりも、参照する画像の解像度が小さい。したがって、エンハンスメントレイヤの高解像度画像をフレームメモリ１９に保存したり、読み出したりする必要がない。また、例えば動きベクトルのように、エンハンスメントレイヤの復号時に、ベースレイヤの復号時の情報を利用することができるので、圧縮画像情報の符号量を低減させることができる。つまり、復号装置１は、圧縮効率を向上させることができる。

このように、復号装置１は、負荷の増大を抑制しながら符号化効率を向上させることができる。

［復号処理の流れの説明］
次に、以上の構成を有する復号装置１の処理について説明する。まず、図７のフローチャートを参照して、エンハンスメントレイヤの復号処理の流れの例を説明する。エンハンスメントレイヤの復号も、基本的に、ベースレイヤの復号処理の場合と同様に、H.264の規格に準ずる方法で行われる。

ただし、エンハンスメントレイヤの復号処理の場合、同一時刻におけるベースレイヤの画像を予測画像の生成に用いるモードがある点がベースレイヤの復号処理やH.264の規格と大きく異なる。さらに、本発明を適用したエンハンスメントレイヤの復号処理の場合、カレントフレームと時間的に同一または異なる時刻におけるベースレイヤの複数の画像を、エンハンスメントレイヤの復号に用いる機能が追加される。

図９の処理は、例えば蓄積バッファ１１に記憶された情報から、１６×１６画素のマクロブロックなどの所定のサイズの画像が可逆復号回路１２により読み出されたときに開始される。図９の各ステップの処理は、適宜、他のステップの処理と並行して、または他のステップと順番を変えて行われる。後述する各フローチャートにおける各ステップの処理も同様である。

ステップＳ１において、可逆復号回路１２は、蓄積バッファ１１から読み出した画像に対して可逆復号処理を開始する。可逆復号処理の詳細については後述する。可逆復号回路１２は、可逆復号処理により生成される、量子化された変換係数を逆量子化回路１３に出力する。また、可逆復号回路１２は、可逆復号処理において、復号対象の画像がイントラ符号化された画像である場合、イントラ予測モード情報をイントラ予測回路２２に出力し、インター符号化された画像である場合、動きベクトルと識別フラグを動き予測・補償回路２１に出力する。

ステップＳ２において、逆量子化回路１３は、符号化側における量子化方式に対応する方式で逆量子化を行い、変換係数を逆直交変換回路１４に出力する。ステップＳ３において、逆直交変換回路１４は、逆量子化回路１３から供給された変換係数に対して逆直交変換を施し、得られた画像を加算回路１５に出力する。

ステップＳ４において、加算回路１５は、逆直交変換回路１４から供給された復号画像と、動き予測・補償回路２１から、またはイントラ予測回路２２から供給された予測画像を合成し、合成画像をデブロックフィルタ１６に出力する。ステップＳ５において、デブロックフィルタ１６は、フィルタリングを施すことによって、合成画像に含まれるブロック歪を除去し、ブロック歪を除去した画像を出力する。ステップＳ６において、フレームメモリ１９は、デブロックフィルタ１６から供給された画像を一時的に記憶する。また、このとき、画像は、並べ替えバッファ１７にも保持される。

ステップＳ７において、制御回路３１は、１フレーム全体のマクロブロックについて以上の処理を行ったか否かを判定し、処理を行っていないと判定した場合、他のマクロブロックに注目して、ステップＳ１以降の処理を繰り返す。

また、ステップＳ７において、１フレーム全体のマクロブロックについて処理を行ったと判定された場合、処理はステップＳ８に進む。ステップＳ８において、並べ替えバッファ１７は、制御回路３１による制御に従って、生成したフレームをD/A変換回路１８に出力する。

ステップＳ９において、D/A変換回路１８は、並べ替えバッファ１７から供給されたフレームに対してD/A変換を施し、アナログの信号を外部に出力する。以上の処理が、各フレームを対象として行われる。

次に、図８のフローチャートを参照して、可逆復号処理の流れの例を説明する。

可逆復号処理が開始されると、予測判定回路４１は、ステップＳ２１において、蓄積バッファ１１より供給される圧縮画像情報のヘッダを参照する。予測判定回路４１は、ステップＳ２２において、そのヘッダに含まれる、符号化装置により指定される予測モードを示す情報に基づいて、イントラ予測を行うか否かを判定する。符号化装置によりイントラ予測モードが指定されている場合、処理は、ステップＳ２３に進む。

ステップＳ２３において、イントラ予測回路２２は、イントラ予測を行って予測画像を生成し、その予測画像を加算回路１５に供給する。この予測画像は、図７のステップＳ４において、逆直交変換回路１４から供給された復号画像と合成される。

ステップＳ２３の処理が終了すると、処理はステップＳ２９に進む。また、ステップＳ２２において、イントラ予測を行わないと判定された場合、処理はステップＳ２４に進む。

ステップＳ２４において、予測判定回路４１は、ヘッダに含まれる、符号化装置により指定される予測モードを示す情報に基づいて、アップコンバート予測を行うか否かを判定する。符号化装置によりアップコンバート予測モードが指定されている場合、処理は、ステップＳ２５に進む。

ステップＳ２５において、動き予測・補償回路２１のアップコンバート予測回路６３は、アップコンバート予測を行って予測画像を生成し、その予測画像を加算回路１５に供給する。この予測画像は、図７のステップＳ４において、逆直交変換回路１４から供給された復号画像と合成される。

ステップＳ２５の処理が終了すると、処理はステップＳ２９に進む。また、ステップＳ２４において、アップコンバート予測を行わないと判定された場合、処理はステップＳ２６に進む。

ステップＳ２６において、予測判定回路４１は、ヘッダに含まれる、符号化装置により指定される予測モードを示す情報に基づいて、インター予測を行うか否かを判定する。符号化装置によりインター予測モードが指定されている場合、処理は、ステップＳ２７に進む。

ステップＳ２７において、動き予測・補償回路２１の片方向予測回路６１または双方向予測回路６２は、インター予測（片方向予測または双方向予測）を行って予測画像を生成し、その予測画像を加算回路１５に供給する。この予測画像は、図７のステップＳ４において、逆直交変換回路１４から供給された復号画像と合成される。

ステップＳ２７の処理が終了すると、処理はステップＳ２９に進む。また、ステップＳ２６において、符号化装置によりフィルタリング予測モードが指定されており、インター予測を行わないと判定された場合、処理はステップＳ２８に進む。

ステップＳ２８において、動き予測・補償回路２１のフィルタリング予測回路６４は、ヘッダに含まれる、フィルタリング予測モードを示す情報に基づいて、フィルタリング予測を行って予測画像を生成し、その予測画像を加算回路１５に供給する。この予測画像は、図７のステップＳ４において、逆直交変換回路１４から供給された復号画像と合成される。ステップＳ２８の処理が終了すると、処理はステップＳ２９に進む。

ステップＳ２９において、復号処理回路４２は、圧縮画像情報の残差信号を復号し、量子化された変換係数を逆量子化回路１３に出力する。ステップＳ２９の処理が終了すると、可逆復号処理が終了され、処理は、図７のステップＳ１に戻り、ステップＳ２以降の処理が実行される。

なお、以上においては、ステップＳ２１において参照する圧縮画像情報のヘッダに含まれる情報に基づいて予測モードが選択されるように説明した。しかしながら、これに限らず、予測判定回路４１は、例えば、圧縮画像情報のビットストリームを解析することにより、適切な予測モードを選択することができるようにしてもよい。その場合、予測判定回路４１は、ステップＳ２１において、ヘッダを参照する代わりに圧縮画像情報の解析を行い、ステップＳ２２以下の処理により、その解析結果に基づいて予測モードの選択を行う。

次に、図９のフローチャートを参照して、図８のステップＳ２８の処理により実行されるフィルタリング予測処理の流れの例を説明する。

フィルタリング予測処理が開始されると、抽出回路７１は、ステップＳ４１において、ベースレイヤからのカレントフレームまたは参照フレームから動き補償画像を抽出する。差分計算回路８１は、ステップＳ４２において、動き補償画像の差分を計算する。ステップＳ４３において、アップコンバート回路８２は、ステップＳ４２において算出された動き補償画像の差分をアップコンバートする。ステップＳ４４において、ローパスフィルタ回路８３は、ステップＳ４３においてアップコンバートされた差分にローパスフィルタをかける。

ステップＳ４５において、ゲイン調整回路８４は、ステップＳ４４の処理のローパスフィルタの出力に対して係数αを乗算し、ゲイン調整を行う。ステップＳ４６において、ハイパスフィルタ回路８５は、ステップＳ４４の処理のローパスフィルタの出力にハイパスフィルタをかける。ステップＳ４７において、ゲイン調整回路８６は、ステップＳ４６の処理のハイパスフィルタの出力に対して係数βを乗算し、ゲイン調整を行う。

ステップＳ４８において、加算回路８７は、ステップＳ４５の処理によりゲイン調整されたローパスフィルタの出力と、ステップＳ４７の処理によりゲイン調整されたハイパスフィルタの出力を加算して高周波数成分を求める。

ステップＳ４９において、アップコンバート回路８８は、ベースレイヤから抽出された動き補償画像MC0をアップコンバートする。ステップＳ５０において、加算回路８９は、ステップＳ４９においてアップコンバートされた動き補償画像に、ステップＳ４８において求められた高周波数成分を付加して予測画像を生成する。加算回路８９は、生成した予測画像を加算回路１５に供給する。

ステップＳ５０の処理が終了すると、フィルタリング予測処理が終了され、処理は、図８のステップＳ２８に戻り、ステップＳ２９以降の処理が実行される。

以上のように、フィルタリング予測によって生成された予測画像を用いて復号が行われることにより、処理の負荷を増大させずに、高精細な復号画像を得ることが可能になる。つまり、復号装置１は、負荷の増大を抑制しながら符号化効率を向上させることができる。

なお、以上においては、ベースレイヤの復号とエンハンスメントレイヤの復号を同一の復号装置１において行うように説明したが、これに限らず、両者の復号が互いに異なる復号装置１において行われるようにしてもよい。ただし、その場合も、フレームメモリ１９は、全復号装置において共通であり、エンハンスメントレイヤの復号時に、ベースレイヤのフレームが読み出し可能とされる。

＜２．第２の実施の形態＞
［符号化装置の構成］
図１０は、本発明を適用した符号化装置の主な構成例を示すブロック図である。この符号化装置１０１は、図３の復号装置１に対応する符号化装置である。つまり、符号化装置１０１により符号化されることによって得られた圧縮画像情報が、図３の復号装置１に入力される。

符号化装置１０１は、A/D変換回路１１１、並べ替えバッファ１１２、加算回路１１３、直交変換回路１１４、量子化回路１１５、可逆符号化回路１１６、蓄積バッファ１１７を有する。また、符号化装置１０１は、レート制御回路１１８、逆量子化回路１１９、逆直交変換回路１２０、デブロックフィルタ１２１、フレームメモリ１２２、およびモード決定回路１２３を有する。さらに、符号化装置１０１は、スイッチ１２４、動き予測・補償回路１２５、イントラ予測回路１２６、スイッチ１２７、および制御回路１３１を有する。

画像情報は、低解像度のベースレイヤと高解像度のエンハンスメントレイヤに２層化（または、３層以上に多層化）され、各フレームの画像情報は、低解像度のベースレイヤから先に符号化装置１０１に供給されて符号化される。このベースレイヤの符号化は、H.264の規格の場合と同様に行われる。ベースレイヤの符号化が終わると、エンハンスメントレイヤの画像情報が符号化装置１０１により符号化される。以下、そのエンハンスメントレイヤの符号化について説明する。

A/D変換回路１１１は、入力信号にA/D変換を施し、画像を並べ替えバッファ１１２に出力する。並べ替えバッファ１１２は、圧縮画像情報のGOP(Group of Pictures)構造に応じてフレームの並べ替えを行い、マクロブロックなどの所定の単位の画像を出力する。並べ替えバッファ１１２から出力された画像は、加算回路１１３、モード決定回路１２３、動き予測・補償回路１２５、およびイントラ予測回路１２６に供給される。

加算回路１１３は、並べ替えバッファ１１２から供給された画像と、動き予測・補償回路１２５、またはイントラ予測回路１２６により生成され、スイッチ１２７を介して供給された予測画像の差を求め、残差を直交変換回路１１４に出力する。予測画像が原画像に近く、ここで求められる残差が少ないほど、残差に割り当てる符号量が少なくて済むことから符号化効率が高いといえる。

直交変換回路１１４は、加算回路１１３から供給された残差に対して、離散コサイン変換、カルーネン・レーベ変換等の直交変換を施し、直交変換を施すことによって得られた変換係数を量子化回路１１５に出力する。

量子化回路１１５は、直交変換回路１１４から供給された変換係数を、レート制御回路１１８による制御に従って量子化し、量子化した変換係数を出力する。量子化回路１１５により量子化された変換係数は可逆符号化回路１１６と逆量子化回路１１９に供給される。

可逆符号化回路１１６は、量子化回路１１５から供給された変換係数を、可変長符号化、算術符号化等の可逆符号化を施すことによって圧縮し、情報を蓄積バッファ１１７に出力する。

また、可逆符号化回路１１６は、モード決定回路１２３から供給された情報に従って識別フラグの値を設定し、識別フラグを画像のヘッダに記述する。可逆符号化回路１１６により記述された識別フラグに基づいて、上述したように、復号装置１において予測モードが決定される。

可逆符号化回路１１６は、動き予測・補償回路１２５またはイントラ予測回路１２６から供給された情報を画像のヘッダに記述することも行う。動き予測・補償回路１２５からは、インター予測を行う際に検出された動きベクトルなどが供給され、イントラ予測回路１２６からは、適用されたイントラ予測モードに関する情報が供給される。

蓄積バッファ１１７は、可逆符号化回路１１６から供給された情報を一時的に記憶し、所定のタイミングで圧縮画像情報として出力する。蓄積バッファ１１７は、発生符号量の情報をレート制御回路１１８に出力する。

レート制御回路１１８は、蓄積バッファ１１７から出力された符号量に基づいて量子化スケールを算出し、算出した量子化スケールで量子化が行われるように量子化回路１１５を制御する。

逆量子化回路１１９は、量子化回路１１５により量子化された変換係数に対して逆量子化を施し、変換係数を逆直交変換回路１２０に出力する。

逆直交変換回路１２０は、逆量子化回路１１９から供給された変換係数に対して逆直交変換を施し、得られた画像をデブロックフィルタ１２１に出力する。

デブロックフィルタ１２１は、局所的に復号された画像に現れるブロック歪みを除去し、ブロック歪みを除去した画像をフレームメモリ１２２に出力する。

フレームメモリ１２２は、デブロックフィルタ１２１から供給された画像を記憶する。フレームメモリ１２２に記憶された画像はモード決定回路１２３により適宜読み出される。

モード決定回路１２３は、フレームメモリ１２２に記憶されている画像と並べ替えバッファ１１２から供給された原画像に基づいて、イントラ符号化を行うか、インター符号化を行うかを決定する。また、モード決定回路１２３は、インター符号化を行うことを決定した場合、片方向予測モード、双方向予測モード、アップコンバート予測モード、フィルタリング予測モードのうちのいずれかのモードを決定する。モード決定回路１２３は、決定結果を表す情報をモード情報として可逆符号化回路１１６に出力する。

モード決定回路１２３は、インター符号化を行うことを決定した場合、フレームメモリ１２２に記憶されている、局所的に復号して得られたフレームを、スイッチ１２４を介して動き予測・補償回路１２５に出力する。

また、モード決定回路１２３は、イントラ符号化を行うことを決定した場合、フレームメモリ１２２に記憶されている、局所的に復号して得られたフレームをイントラ予測回路１２６に出力する。

スイッチ１２４は、インター符号化を行う場合、端子ａ11に接続し、イントラ符号化を行う場合、端子ｂ11に接続する。スイッチ１２４の切り替えは例えば制御回路１３１により制御される。

動き予測・補償回路１２５は、並べ替えバッファ１１２から供給された原画像と、フレームメモリ１２２から読み出された参照フレームに基づいて動きベクトルを検出し、検出した動きベクトルを可逆符号化回路１１６に出力する。また、動き予測・補償回路１２５は、検出した動きベクトルと参照フレームを用いて動き補償を行うことによって予測画像を生成し、生成した予測画像を、スイッチ１２７を介して加算回路１１３に出力する。

イントラ予測回路１２６は、並べ替えバッファ１１２から供給された原画像と、ローカルデコードされてフレームメモリ１２２に記憶されている参照フレームに基づいてイントラ予測を行い、予測画像を生成する。イントラ予測回路１２６は、生成した予測画像を、スイッチ１２７を介して加算回路１１３に出力し、イントラ予測モード情報を可逆符号化回路１１６に出力する。

スイッチ１２７は、端子ａ12または端子ｂ12に接続し、動き予測・補償回路１２５、またはイントラ予測回路１２６により生成された予測画像を加算回路１１３に出力する。

制御回路１３１は、モード決定回路１２３により決定されたモードに応じてスイッチ１２４，１２７の接続を切り替えるなどして、符号化装置１０１の全体の動作を制御する。

図１１は、図１０のモード決定回路１２３の主な構成例を示すブロック図である。

図１１に示されるように、モード決定回路１２３は、イントラ予測回路１４１、片方向予測回路１４２、双方向予測回路１４３、アップコンバート予測回路１４４、フィルタリング予測回路１４５、予測誤差計算回路１４６、および決定回路１４７を有する。

モード決定回路１２３においては、それぞれ異なる大きさのブロックを対象としてイントラ予測、インター予測が行われ、その結果から、どの予測モードで予測を行うのかが決定される。インター予測については、片方向予測モード、双方向予測モード、アップコンバート予測モード、およびフィルタリング予測モードのそれぞれの予測モードでの処理が行われる。

イントラ予測回路１４１、片方向予測回路１４２、双方向予測回路１４３、アップコンバート予測回路１４４、およびフィルタリング予測回路１４５は、原画像とフレームメモリ１２２から読み出された画像に基づいて、それぞれの方法で、予測を行って予測画像を生成し、生成した予測画像を予測誤差計算回路１４６に出力する。

イントラ予測回路１４１は、復号装置１のイントラ予測回路２２と同様の方法でイントラ予測を行う。片方向予測回路１４２は、動きベクトルを検出し、検出した動きベクトルに基づいて、参照フレームから動き補償画像を抽出し、その動き補償画像を用いて片方向予測を行うことによって予測画像を生成する。つまり、片方向予測回路１４２は、検出した動きベクトルに基づいて、復号装置１の片方向予測回路６１と同様の方法で予測画像を生成する。

双方向予測回路１４３は、動きベクトルを検出し、検出した動きベクトルに基づいて、参照フレームから動き補償画像を抽出し、その動き補償画像を用いて双方向予測を行うことによって予測画像を生成する。つまり、双方向予測回路１４３は、検出した動きベクトルに基づいて、復号装置１の双方向予測回路６２と同様の方法で予測画像を生成する。

アップコンバート予測回路１４４は、ベースレイヤのカレントフレームの、エンハンスメントレイヤのカレントフレームの処理対象マクロブロックと同じ位置のマクロブロックを動き補償画像とし、それをアップコンバートすることにより、エンハンスメントレイヤの予測画像を生成する。つまり、アップコンバート予測回路１４４は、復号装置１のアップコンバート予測回路６３と同様の方法で予測画像を生成する。

フィルタリング予測回路１４５は、ベースレイヤにおいて動きベクトルを検出し、検出した動きベクトルに基づいて、参照フレームからベースレイヤの動き補償画像を抽出し、そのベースレイヤの動き補償画像を用いてフィルタリング予測を行うことによって予測画像を生成する。つまり、フィルタリング予測回路１４５は、検出した動きベクトルに基づいて、復号装置１のフィルタリング予測回路１４５と同様の方法で予測画像を生成する。

なお、イントラ予測回路１４１乃至フィルタリング予測回路１４５は、例えば、４×４画素のブロック、８×８画素のブロック、１６×１６画素のブロックのそれぞれの単位で動きベクトルを検出したり、予測を行ったりする。この処理単位となるブロックの大きさは任意である。また、予測を行うブロックの種類の数も任意である。イントラ予測回路１４１乃至フィルタリング予測回路１４５は、各ブロックについて予測画像を生成し、生成した各予測画像を予測誤差計算回路１４６に出力する。

並べ替えバッファ１１２から供給された原画像はイントラ予測回路１４１乃至フィルタリング予測回路１４５、並びに予測誤差計算回路１４６に入力される。

予測誤差計算回路１４６は、イントラ予測回路１４１の各回路から供給されたそれぞれの予測画像について、原画像との差を求め、求めた差を表す残差信号を決定回路１４７に出力する。同様に、予測誤差計算回路１４６は、片方向予測回路１４２、双方向予測回路１４３、アップコンバート予測回路１４４、またはフィルタリング予測回路１４５から供給されたそれぞれの予測画像について、原画像との差を求め、求めた差を表す残差信号を決定回路１４７に出力する。

決定回路１４７は、予測誤差計算回路１４６から供給された残差信号の強度を測定し、原画像との差の少ない予測画像の生成に用いられた予測方法を、符号化に用いる予測画像を生成するための予測方法として決定する。決定回路１４７は、決定結果を表す情報をモード情報として可逆符号化回路１１６に出力する。モード情報には、どのサイズのブロックを処理の単位とするのかを表す情報なども含まれる。

また、決定回路１４７は、インター予測によって予測画像を生成することを決定した場合（インター符号化を行うことを決定した場合）、フレームメモリ１２２から読み出した参照フレームを、モード情報とともに動き予測・補償回路１２５に出力する。決定回路１４７は、イントラ予測によって予測画像を生成することを決定した場合（イントラ符号化を行うことを決定した場合）、フレームメモリ１２２から読み出したイントラ予測に用いる画像を、モード情報とともにイントラ予測回路１２６に出力する。

図１２は、図１０の動き予測・補償回路１２５の主な構成例を示すブロック図である。

図１２に示されるように、動き予測・補償回路１２５は、動きベクトル検出回路１５１、片方向予測回路１５２、双方向予測回路１５３、アップコンバート予測回路１５４、およびフィルタリング回路１５５を有する。予測選択回路５１に替えて動きベクトル検出回路１５１が設けられている点を除いて、動き予測・補償回路１２５は、図５に示される動き予測・補償回路２１と同様の構成を有する。

動きベクトル検出回路１５１は、並べ替えバッファ１１２から供給された原画像と、モード決定回路１２３から供給された参照フレームに基づいて、ブロックマッチングなどを行うことによって動きベクトルを検出する。動きベクトル検出回路１５１は、モード決定回路１２３から供給されたモード情報を参照し、参照フレームを片方向予測回路１５２乃至フィルタリング予測回路１５５のいずれかに出力する。また、動きベクトル検出回路１５１は、動きベクトルも必要に応じて参照フレームの出力先に出力する。

動きベクトル検出回路１５１は、片方向予測が選択されている場合、参照フレームとともに動きベクトルを片方向予測回路１５２に出力し、双方向予測を行うことが選択されている場合、それらの情報を双方向予測回路１５３に出力する。また、動きベクトル検出回路１５１は、アップコンバート予測が選択されている場合、参照フレームであるベースレイヤのカレントフレームの画像をアップコンバート予測回路１５４に出力する。さらに、動きベクトル検出回路１５１は、フィルタリング予測が選択されている場合、ベースレイヤの参照フレームとともに動きベクトルをフィルタリング予測回路１５５に出力する。

片方向予測回路１５２は、図５の片方向予測回路６１と同様に、片方向予測を行うことによって予測画像を生成する。片方向予測回路１５２は、生成した予測画像を加算回路１１３に出力する。双方向予測回路１５３は、図５の双方向予測回路６２と同様に、双方向予測を行うことによって予測画像を生成する。双方向予測回路１５３は、生成した予測画像を加算回路１１３に出力する。アップコンバート予測回路１５４は、図５のアップコンバート予測回路６３と同様に、アップコンバート予測を行うことによって予測画像を生成する。アップコンバート予測回路１５４は、生成した予測画像を加算回路１１３に出力する。

フィルタリング予測回路１５５は、図５のフィルタリング予測回路６４と同様に、ベースレイヤの複数の参照フレームからそれぞれ動き補償画像を抽出し、抽出した複数の動き補償画像に対して、アップコンバートを伴うフィルタリング予測を行うことによって予測画像を生成する。フィルタリング予測回路１５５は、生成した予測画像を加算回路１１３に出力する。なお、フィルタリング予測回路１５５は図６に示されるフィルタリング予測回路６４の構成と同様の構成を有している。以下、適宜、図６に示されるフィルタリング予測回路６４の構成をフィルタリング予測回路１５５の構成として引用して説明する。

フィルタリング予測によって生成された予測画像は、片方向予測、双方向予測、またはアップコンバート予測によって生成された予測画像と較べて高周波成分を多く含み、原画像との差が少ない画像になる。従って、フィルタリング予測は、残差に割り当てる符号量が少なくて済むため、符号化効率を上げることが可能になる。また、フィルタリング予測は、エンハンスメントレイヤのフレームを参照する片方向予測や双方向予測の場合と較べて、参照フレームの解像度が小さいので、例えば参照フレームのフレームメモリ１２２への保存やフレームメモリ１２２からの読み出し等、処理の負荷が小さい。つまり、符号化装置１０１は、フィルタリング予測を用いることにより、符号化や復号の負荷の増大を抑制しながら符号化効率を向上させることができる。

さらに、参照フレームの数が少なくとも２枚あればフィルタリング予測を行うことができるため、そのように符号化効率を上げるといったことを、処理を複雑にすることなく実現することが可能になる。例えば、インター予測で用いる参照フレームの数を多くして精度の高い予測画像を生成し、それを用いることによっても原画像との残差を小さくし、符号化効率を上げることができるが、この場合、参照フレームの数が多くなることから、処理が複雑になる。

なお、予測方法を選択する際、予測に必要な動きベクトルや符号化モードといった情報の符号量を考慮し、符号量に応じた重みを残差信号の強度に加えて最適な予測方法が選択されるようにしてもよい。これにより、より一層、符号化効率を改善させることが可能になる。また、符号化処理の簡略化のために、入力された原画像の時間・空間方向の特徴量を利用して、適応的に予測方法が選択されるようにしてもよい。

［符号化処理の流れの説明］
次に、以上のような構成を有する符号化装置１０１の処理について説明する。

図１３のフローチャートを参照して、符号化装置１０１のエンハンスメントレイヤに対する符号化処理について説明する。この処理は、マクロブロックなどの所定の単位の画像が並べ替えバッファ１１２から出力されたときに開始される。なお、ベースレイヤに対する符号化処理は、上述したようにH.264の規定に基づく方法と同様であるのでその説明を省略する。

ステップＳ１０１において、加算回路１１３は、並べ替えバッファ１１２から供給された画像と、動き予測・補償回路１２５、またはイントラ予測回路１２６により生成された予測画像の差を求め、残差を直交変換回路１１４に出力する。

ステップＳ１０２において、直交変換回路１１４は、加算回路１１３から供給された残差に対して直交変換を施し、変換係数を量子化回路１１５に出力する。

ステップＳ１０３において、量子化回路１１５は、直交変換回路１１４から供給された変換係数を量子化し、量子化した変換係数を出力する。

ステップＳ１０４において、逆量子化回路１１９は、量子化回路１１５により量子化された変換係数に対して逆量子化を施し、変換係数を逆直交変換回路１２０に出力する。

ステップＳ１０５において、逆直交変換回路１２０は、逆量子化回路１１９から供給された変換係数に対して逆直交変換を施し、得られた画像をデブロックフィルタ１２１に出力する。

ステップＳ１０６において、デブロックフィルタ１２１は、フィルタリングを施すことによってブロック歪みを除去し、ブロック歪みを除去した画像をフレームメモリ１２２に出力する。

ステップＳ１０７において、フレームメモリ１２２は、デブロックフィルタ１２１から供給された画像を記憶する。

ステップＳ１０８において、モード決定回路１２３によりモード決定処理が行われる。モード決定処理により、どの予測モードで予測画像を生成するのかが決定される。モード決定処理の詳細については後述する。

ステップＳ１０９において、動き予測・補償回路１２５またはイントラ予測回路１２６は、ステップＳ１０８において決定されたモードで予測画像を生成する。この予測画像は、ステップＳ１０１の処理に利用される。

ステップＳ１１０において、可逆符号化回路１１６は、量子化回路１１５から供給された変換係数を圧縮し、蓄積バッファ１１７に出力する。また、可逆符号化回路１１６は、モード決定回路１２３から供給された情報に従って識別フラグを画像のヘッダに記述したり、動き予測・補償回路１２５から供給された動きベクトルを画像のヘッダに記述したりする。

ステップＳ１１１において、蓄積バッファ１１７は、可逆符号化回路１１６から供給された情報を一時的に記憶する。

ステップＳ１１２において、制御回路３１は、１フレーム全体のマクロブロックについて以上の処理を行ったか否かを判定し、処理を行っていないと判定された場合、他のマクロブロックに注目して、ステップＳ１０１以降の処理を繰り返す。

一方、１フレーム全体のマクロブロックについて処理を行ったとステップＳ１１２において判定された場合、ステップＳ１１３において、蓄積バッファ１１７は制御回路１３１による制御に従って圧縮画像情報を出力する。以上の処理が、各フレームを対象として行われる。

次に、図１４のフローチャートを参照して、図１３のステップＳ１０８において行われるモード決定処理について説明する。

ステップＳ１３１において、イントラ予測回路１４１乃至フィルタリング予測回路１４５は、それぞれ、異なる大きさのブロックを対象としてイントラ予測やインター予測を行い、予測画像を生成する。生成された予測画像は予測誤差計算回路１４６に供給される。

ステップＳ１３２において、予測誤差計算回路１４６は、イントラ予測回路１４１乃至フィルタリング予測回路１４５から供給されたそれぞれの予測画像について、原画像との差を求める。予測誤差計算回路１４６は残差信号を決定回路１４７に出力する。

ステップＳ１３３において、決定回路１４７は、予測誤差計算回路１４６から供給された残差信号の強度に基づいて、加算回路１１３に供給する予測画像を生成するための予測方法を決定する。

ステップＳ１３４において、決定回路１４７は、決定した予測方法に関する情報であるモード情報を可逆符号化回路１１６に出力する。その後、図１３のステップＳ１０８に戻り、それ以降の処理が行われる。

次に、図１５のフローチャートを参照して、図１３のステップＳ１０９において行われる予測画像を生成する処理の例として、フィルタリング予測により予測画像を生成するフィルタリング予測処理の流れの例を説明する。

上述したように、図１３のステップＳ１０９においては、ステップＳ１０８のモード決定処理により決定されたモードで予測画像の生成が行われる。したがってステップＳ１０８において、フィルタリング予測モードが決定された場合、ステップＳ１０９において図１５に示されるようなフィルタリング予測処理が実行される。

フィルタリング予測処理が開始されると、ステップＳ１５１において、動きベクトル検出回路１５１は、原画像と参照フレームに基づいて動きベクトルを検出する。

動きベクトルが検出されると、その検出された動きベクトルが用いられて、ステップＳ１５２乃至ステップＳ１６１の各処理が、図９のステップＳ４１乃至ステップＳ５０の各処理と同様に実行される。つまり、動きベクトルに基づいてベースレイヤの参照フレームにおいて動き補償画像が生成され、その動き補償画像に対してアップコンバートを伴うフィルタリング処理が行われ、エンハンスメントレイヤの予測画像が生成される。

ステップＳ１６１の処理が終了すると、フィルタリング予測処理が終了され、処理は図１３のステップＳ１０９に戻り、ステップＳ１１０以降の処理が実行される。

なお、ステップＳ１０８の処理において他のモードが選択された場合、動き予測・補償回路１２５またはイントラ予測回路１２６は、選択された他のモードで予測画像を生成する。これらの処理は、H.264/SVC規格に従って行われるのでその説明は省略する。

以上のように、空間スケーラビリティを考慮した符号化を行うにあたり、動画像信号列に含まれる時間相関をより効率的に利用することで、例えば符号化や復号等の処理の負荷の増大を抑制しながら符号化効率を向上させることができる。

＜３．第３の実施の形態＞
［復号処理の概要］
図１６は、本発明を適用した復号処理の概要の、他の例を説明する図である。図１６に示されるように、参照フレームの数は３つ以上であってもよい。

図１６の例においては、カレントフレームから時間的に１時刻前とその１時刻前とさらにその１時刻前にある３枚のフレーム（Ref0，Ref1，Ref2）が参照フレームとされている。カレントフレームの１時刻前のフレームが参照フレームRef0とされ、参照フレームRef0の１時刻前のフレームが参照フレームRef1とされ、参照フレームRef1の１時刻前のフレームが参照フレームRef2とされている。

［フィルタリング回路の構成］
図１７は、このように３枚のフレームを参照する場合の、図６のフィルタリング回路の構成例を示すブロック図である。

図１７に示されるように、フィルタリング回路２１１は、フィルタリング回路２２１とフィルタリング回路２２２を有する。フィルタリング回路２２１とフィルタリング回路２２２は、それぞれ、図６に示されるような構成を有している。すなわち、フィルタリング回路２１１は、２入力１出力のときに用いるフィルタリング回路７２をカスケード接続することによって、３入力１出力の回路として動作するようになされている。

なお、このとき、抽出回路７１は、３枚の参照フレーム（Ref0，Ref1，Ref2）のそれぞれから、動き補償画像を抽出する。つまり、抽出回路７１は、例えば、参照フレームRef0から動き補償画像MC0を抽出する。また、例えば、抽出回路７１は、参照フレームRef1から動き補償画像MC1を抽出する。さらに、例えば、抽出回路７１は、参照フレームRef2から動き補償画像MC2を抽出する。

動き補償画像MC1，MC2はフィルタリング回路２２１に入力され、動き補償画像MC0はフィルタリング回路２２２に入力される。

フィルタリング回路２２１は、動き補償画像MC1，MC2をそれぞれ、図６等における動き補償画像MC0，MC1としてフィルタリングを行い、フィルタリングの結果である中間出力Ｘをフィルタリング回路２２２に出力する。

フィルタリング回路２２１は、中間出力Ｘと動き補償画像MC0をそれぞれ、図６等における動き補償画像MC0，MC1としてフィルタリングを行い、フィルタリングの結果を予測画像として出力する。

このような３枚の参照フレームを扱うフィルタリング回路２１１が、フィルタリング回路７２に替えて図３の復号装置１や図１０の符号化装置１０１に設けられるようにすることも可能である。

なお、フィルタリング回路２２１とフィルタリング回路２２２が同じ構成を有している必要はなく、それぞれの構成が異なるようにしてもよい。また、フィルタリングの前後における入出力特性を考慮して、フィルタに用いるパラメータ（例えばα，β）が異なるようにすることも可能である。

時間的に一方にある参照フレームから抽出された動き補償画像ではなく、前後にある３枚の参照フレームから抽出された動き補償画像を対象として、フィルタリング回路２１１においてフィルタリングが施されるようにしてもよい。

なお、カレントフレームの時刻を基準として前後にあるフレームを参照フレームとして用いる場合、フィルタリング時のタップ係数などのパラメータを、参照フレームの時間方向や距離に応じて動的に変更するようにしてもよい。

符号化装置１０１から復号装置１に対する圧縮画像情報の伝送は、光ディスク、磁気ディスク、フラッシュメモリなどの記録メディア、衛星放送、ケーブルTV、インターネット、携帯電話機ネットワークなどの各種の媒体を介して行われる。

なお、以上においては、エンハンスメントレイヤの符号化・復号の場合、動き補償画像は、ベースレイヤの参照フレームから抽出されるように説明したが、動き補償画像は、ベースレイヤ以外の任意のレイヤから抽出されるようにしてもよい。

例えば、圧縮画像情報が第１レイヤ乃至第３レイヤからなる３層構造を形成し、第１レイヤがベースレイヤで最も低解像度のレイヤであり、第２レイヤがその次に低解像度なレイヤであり、第３レイヤが最も高解像度なレイヤであるとする。このような場合において、第３レイヤのフィルタリング予測において、動き補償画像が、ベースレイヤでない第２レイヤの参照フレームから抽出されるようにしてもよい。もちろん、ベースレイヤである第１レイヤの参照フレームから動き補償画像が抽出されるようにしても良い。

＜４．第４の実施の形態＞
［復号処理の概要］
また、生成する予測画像と同じレイヤの参照フレームから動き補償画像が抽出されるようにしてもよい。例えば、上述した３層構造の場合、第３レイヤのフィルタリング予測において第３レイヤの参照フレームから低解像度の動き補償画像を抽出するようにしてもよい。

図１８は、この場合の、復号処理の概要を説明する図である。

図１８に示される例の場合、参照フレームRef0および参照フレームRef1は、予測画像と同じエンハンスメントレイヤのフレームである。ただし、各参照フレームより抽出される動き補償画像の解像度は、予測画像より低解像度である。

例えば、従来のH.264規格に従う方法と同様に、エンハンスメントレイヤの各参照フレームにおいて、処理対象マクロブロックに対応する位置（範囲）が動きベクトルによって特定され、その範囲内の画素値が所定数間引かれて動き補償画像として抽出される。また、例えば、従来のH.264規格に従う方法と同様に、エンハンスメントレイヤの各参照フレームにおいて、処理対象マクロブロックに対応する位置が動きベクトルによって特定され、その位置を中心とする、処理対象マクロブロックのサイズよりも小さい範囲が動き補償画像として抽出される。もちろん、これ以外の方法であっても良い。

つまり、抽出される動き補償画像が、予測画像より低解像度であればよく、その抽出方法は任意であり、また、動き補償画像は、どのレイヤから抽出されてもよい。

このように抽出された低解像度の動き補償画像には、上述した他の場合と同様にアップコンバートを含むフィルタリング処理が施され、所望の解像度の予測画像が生成される。

動き補償画像を生成するレイヤが異なるだけなので、この場合の符号化装置１の構成は、図３乃至図６を参照して説明した場合の構成と基本的に同様である。ただし、フレームメモリ１９には、エンハンスメントレイヤのフレームが保持され、抽出回路７１は、フレームメモリ１９から、エンハンスメントレイヤの画像を読み出す。

［復号処理の流れの説明］
したがって、復号処理や可逆復号処理の流れも、図７や図８のフローチャートを参照して説明した場合と基本的に同様に実行される。この場合のフィルタリング予測回路６４によるフィルタリング予測処理の流れを図１９のフローチャートを参照して説明する。このフローチャートは、図９のフローチャートに対応する。

フィルタリング予測処理が開始されると、抽出回路７１は、ステップＳ３４１において、エンハンスメントレイヤの参照フレームから動き補償画像を低解像度で抽出する。ステップＳ３４２乃至ステップＳ３５０の各処理は、図９のステップＳ４２乃至ステップＳ５０の各処理と同様に実行され、図９の場合と同様に予測画像が生成される。

ステップＳ３５０の処理が終了すると、フィルタリング予測処理は終了し、処理は図８のステップＳ２８に戻り、ステップＳ２９に進む。

このように、エンハンスメントレイヤのフレームから動き補償画像を抽出する場合も、復号装置１は、動画像信号列に含まれる時間相関をより効率的に利用することで、高解像度の精度の高い予測画像を生成することができ、符号化効率を向上させることができる。また、動き補償画像が予測画像より低解像度とすることができるので、復号装置１は、例えばフレームメモリから読み出す画像情報量を低減させることができ、符号化や復号等の処理の負荷の増大を抑制しながら符号化効率を向上させることができる。

［符号化処理の流れの説明］
なお、この場合の復号装置１に対応する符号化装置１０１の構成は、図１０乃至図１２を参照して説明した場合と基本的に同様である。ただし、フレームメモリ１２２には、エンハンスメントレイヤのフレームが保持され、モード決定処理１２３は、フレームメモリ１９から、エンハンスメントレイヤの画像を読み出す。

この場合も、モード決定処理１２３のフィルタリング予測回路１４５、および、動き予測・補償回路１２５のフィルタリング予測回路１５５の構成は、図１１および図１２の場合と同様に、図６に示されるフィルタリング予測回路６４の構成と同様である。ただし、抽出回路７１は、復号装置１の場合と同様に、エンハンスメントレイヤのフレームから動き補償画像を抽出する。

したがって、符号化処理やモード決定処理の流れは、図１３や図１４のフローチャートを参照して説明した場合と基本的に同様に実行される。この場合のフィルタリング予測回路１５５によるフィルタリング予測処理の流れを図２０のフローチャートを参照して説明する。このフローチャートは、図１５のフローチャートに対応する。

フィルタリング予測処理が開始されると、動きベクトル検出回路１５１は、ステップＳ４５１において、図１５のステップＳ１５１の場合と同様に、動きベクトルを検出する。ステップＳ４５２において、抽出回路７１は、エンハンスメントレイヤの参照フレームから動き補償画像を低解像度で抽出する。ステップＳ４５３乃至ステップＳ４６１の各処理は、図１５のステップＳ１５３乃至ステップＳ１６１の各処理と同様に実行され、図１５の場合と同様に予測画像が生成される。

ステップＳ４６１の処理が終了すると、フィルタリング予測処理は終了し、処理は図１３のステップＳ１０９に戻り、ステップＳ１１０に進む。

このように、エンハンスメントレイヤのフレームから動き補償画像を抽出する場合も、符号化装置１０１は、動画像信号列に含まれる時間相関をより効率的に利用することで、高解像度の精度の高い予測画像を生成することができ、符号化効率を向上させることができる。また、動き補償画像が予測画像より低解像度とすることができるので、符号化装置１０１は、例えばフレームメモリから読み出す画像情報量を低減させることができ、符号化や復号等の処理の負荷の増大を抑制しながら符号化効率を向上させることができる。

すなわち、この方法は、空間スケーラビリティが考慮されていない単層構造で画像情報を符号化・復号する場合にも適用することができる。つまり、H.264/AVC規格の符号化・復号にも適用することができる。

なお、上述したように動き補償画像抽出の際に解像度を低解像度に調整すればよいので、動き補償画像の抽出を、複数のレイヤにおいて行うようにしてもよい。ただし、フィルタリング予測処理においては、動き補償画像の差分が求められるので、その時までに、各動き補償画像の解像度を互いに一致させる必要がある。

上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。この場合、例えば、図２１に示されるようなパーソナルコンピュータとして構成されるようにしてもよい。

図２１において、パーソナルコンピュータ５００のCPU（Central Processing Unit）５０１は、ROM（Read Only Memory）５０２に記憶されているプログラム、または記憶部５１３からRAM（Random Access Memory）５０３にロードされたプログラムに従って各種の処理を実行する。RAM５０３にはまた、CPU５０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

CPU５０１、ROM５０２、およびRAM５０３は、バス５０４を介して相互に接続されている。このバス５０４にはまた、入出力インタフェース５１０も接続されている。

入出力インタフェース５１０には、キーボード、マウスなどよりなる入力部５１１、CRT（Cathode Ray Tube）やLCD（Liquid Crystal Display）などよりなるディスプレイ、並びにスピーカなどよりなる出力部５１２、ハードディスクなどより構成される記憶部５１３、モデムなどより構成される通信部５１４が接続されている。通信部５１４は、インターネットを含むネットワークを介しての通信処理を行う。

入出力インタフェース５１０にはまた、必要に応じてドライブ５１５が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア５２１が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部５１３にインストールされる。

上述した一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、ネットワークや記録媒体からインストールされる。

この記録媒体は、例えば、図２１に示されるように、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM（Compact Disc - Read Only Memory）,DVD（Digital Versatile Disc）を含む）、光磁気ディスク（MD（Mini Disc）を含む）、もしくは半導体メモリなどよりなるリムーバブルメディア５２１により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM５０２や、記憶部５１３に含まれるハードディスクなどで構成される。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数のデバイス（装置）により構成される装置全体を表わすものである。

また、以上において、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。つまり、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、上述した復号装置１や符号化装置１０１は、任意の電子機器に適用することができる。以下にその例について説明する。

図２２は、本発明を適用した復号装置１を用いるテレビジョン受像機の主な構成例を示すブロック図である。

図２２に示されるテレビジョン受像機１０００は、地上波チューナ１０１３、ビデオデコーダ１０１５、映像信号処理回路１０１８、グラフィック生成回路１０１９、パネル駆動回路１０２０、および表示パネル１０２１を有する。

地上波チューナ１０１３は、地上アナログ放送の放送波信号を、アンテナを介して受信し、復調し、映像信号を取得し、それをビデオデコーダ１０１５に供給する。ビデオデコーダ１０１５は、地上波チューナ１０１３から供給された映像信号に対してデコード処理を施し、得られたデジタルのコンポーネント信号を映像信号処理回路１０１８に供給する。

映像信号処理回路１０１８は、ビデオデコーダ１０１５から供給された映像データに対してノイズ除去などの所定の処理を施し、得られた映像データをグラフィック生成回路１０１９に供給する。

グラフィック生成回路１０１９は、表示パネル１０２１に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成し、生成した映像データや画像データをパネル駆動回路１０２０に供給する。また、グラフィック生成回路１０１９は、項目の選択などにユーザにより利用される画面を表示するための映像データ（グラフィック）を生成し、それを番組の映像データに重畳したりすることによって得られた映像データをパネル駆動回路１０２０に供給するといった処理も適宜行う。

パネル駆動回路１０２０は、グラフィック生成回路１０１９から供給されたデータに基づいて表示パネル１０２１を駆動し、番組の映像や上述した各種の画面を表示パネル１０２１に表示させる。

表示パネル１０２１はLCD（Liquid Crystal Display）などよりなり、パネル駆動回路１０２０による制御に従って番組の映像などを表示させる。

また、テレビジョン受像機１０００は、音声A/D（Analog/Digital)変換回路１０１４、音声信号処理回路１０２２、エコーキャンセル／音声合成回路１０２３、音声増幅回路１０２４、およびスピーカ１０２５も有する。

地上波チューナ１０１３は、受信した放送波信号を復調することにより、映像信号だけでなく音声信号も取得する。地上波チューナ１０１３は、取得した音声信号を音声A/D変換回路１０１４に供給する。

音声A/D変換回路１０１４は、地上波チューナ１０１３から供給された音声信号に対してA/D変換処理を施し、得られたデジタルの音声信号を音声信号処理回路１０２２に供給する。

音声信号処理回路１０２２は、音声A/D変換回路１０１４から供給された音声データに対してノイズ除去などの所定の処理を施し、得られた音声データをエコーキャンセル／音声合成回路１０２３に供給する。

エコーキャンセル／音声合成回路１０２３は、音声信号処理回路１０２２から供給された音声データを音声増幅回路１０２４に供給する。

音声増幅回路１０２４は、エコーキャンセル／音声合成回路１０２３から供給された音声データに対してD/A変換処理、増幅処理を施し、所定の音量に調整した後、音声をスピーカ１０２５から出力させる。

さらに、テレビジョン受像機１０００は、デジタルチューナ１０１６およびMPEGデコーダ１０１７も有する。

デジタルチューナ１０１６は、デジタル放送（地上デジタル放送、BS（Broadcasting Satellite）／CS（Communications Satellite）デジタル放送）の放送波信号を、アンテナを介して受信し、復調し、MPEG-TS（Moving Picture Experts Group-Transport Stream）を取得し、それをMPEGデコーダ１０１７に供給する。

MPEGデコーダ１０１７は、デジタルチューナ１０１６から供給されたMPEG-TSに施されているスクランブルを解除し、再生対象（視聴対象）になっている番組のデータを含むストリームを抽出する。MPEGデコーダ１０１７は、抽出したストリームを構成する音声パケットをデコードし、得られた音声データを音声信号処理回路１０２２に供給するとともに、ストリームを構成する映像パケットをデコードし、得られた映像データを映像信号処理回路１０１８に供給する。また、MPEGデコーダ１０１７は、MPEG-TSから抽出したEPG（Electronic Program Guide)データを図示せぬ経路を介してCPU１０３２に供給する。

テレビジョン受像機１０００は、このように映像パケットをデコードするMPEGデコーダ１０１７として、上述した復号装置１を用いる。なお、放送局等より送信されるMPEG-TSは、符号化装置１０１によって符号化されている。

MPEGデコーダ１０１７は、復号装置１の場合と同様に、ベースレイヤにおける複数の参照面の画像に対してフィルタリングを行うことで、エンハンスメントレイヤにおけるカレントブロックの予測画像を生成する。したがって、MPEGデコーダ１０１７は、空間的なアップサンプリングフィルタに比べ、画像列中の信号成分をより有効に利用することが可能になる。この結果、予測画像は、ベースレイヤのカレントフレームの画像を利用する従来のアップコンバート予測により生成した予測画像よりも空間的に高い周波数成分を有しつつ予測残差を低減させることができる。つまり、エンハンスメントレイヤにおける符号化ピクチャの符号量を低減させることができ、符号化効率の改善に貢献することが可能になる。

MPEGデコーダ１０１７から供給された映像データは、ビデオデコーダ１０１５から供給された映像データの場合と同様に、映像信号処理回路１０１８において所定の処理が施され、グラフィック生成回路１０１９において、生成された映像データ等が適宜重畳され、パネル駆動回路１０２０を介して表示パネル１０２１に供給され、その画像が表示される。

MPEGデコーダ１０１７から供給された音声データは、音声A/D変換回路１０１４から供給された音声データの場合と同様に、音声信号処理回路１０２２において所定の処理が施され、エコーキャンセル／音声合成回路１０２３を介して音声増幅回路１０２４に供給され、D/A変換処理や増幅処理が施される。その結果、所定の音量に調整された音声がスピーカ１０２５から出力される。

また、テレビジョン受像機１０００は、マイクロホン１０２６、およびA/D変換回路１０２７も有する。

A/D変換回路１０２７は、音声会話用のものとしてテレビジョン受像機１０００に設けられるマイクロホン１０２６により取り込まれたユーザの音声の信号を受信し、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データをエコーキャンセル／音声合成回路１０２３に供給する。

エコーキャンセル／音声合成回路１０２３は、テレビジョン受像機１０００のユーザ（ユーザＡ）の音声のデータがA/D変換回路１０２７から供給されている場合、ユーザＡの音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路１０２４を介してスピーカ１０２５より出力させる。

さらに、テレビジョン受像機１０００は、音声コーデック１０２８、内部バス１０２９、SDRAM（Synchronous Dynamic Random Access Memory)１０３０、フラッシュメモリ１０３１、CPU１０３２、USB（Universal Serial Bus) I/F１０３３、およびネットワークI/F１０３４も有する。

A/D変換回路１０２７は、音声会話用のものとしてテレビジョン受像機１０００に設けられるマイクロホン１０２６により取り込まれたユーザの音声の信号を受信し、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データを音声コーデック１０２８に供給する。

音声コーデック１０２８は、A/D変換回路１０２７から供給された音声データを、ネットワーク経由で送信するための所定のフォーマットのデータに変換し、内部バス１０２９を介してネットワークI/F１０３４に供給する。

ネットワークI/F１０３４は、ネットワーク端子１０３５に装着されたケーブルを介してネットワークに接続される。ネットワークI/F１０３４は、例えば、そのネットワークに接続される他の装置に対して、音声コーデック１０２８から供給された音声データを送信する。また、ネットワークI/F１０３４は、例えば、ネットワークを介して接続される他の装置から送信される音声データを、ネットワーク端子１０３５を介して受信し、それを、内部バス１０２９を介して音声コーデック１０２８に供給する。

音声コーデック１０２８は、ネットワークI/F１０３４から供給された音声データを所定のフォーマットのデータに変換し、それをエコーキャンセル／音声合成回路１０２３に供給する。

エコーキャンセル／音声合成回路１０２３は、音声コーデック１０２８から供給される音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路１０２４を介してスピーカ１０２５より出力させる。

SDRAM１０３０は、CPU１０３２が処理を行う上で必要な各種のデータを記憶する。

フラッシュメモリ１０３１は、CPU１０３２により実行されるプログラムを記憶する。フラッシュメモリ１０３１に記憶されているプログラムは、テレビジョン受像機１０００の起動時などの所定のタイミングでCPU１０３２により読み出される。フラッシュメモリ１０３１には、デジタル放送を介して取得されたEPGデータ、ネットワークを介して所定のサーバから取得されたデータなども記憶される。

例えば、フラッシュメモリ１０３１には、CPU１０３２の制御によりネットワークを介して所定のサーバから取得されたコンテンツデータを含むMPEG-TSが記憶される。フラッシュメモリ１０３１は、例えばCPU１０３２の制御により、そのMPEG-TSを、内部バス１０２９を介してMPEGデコーダ１０１７に供給する。

MPEGデコーダ１０１７は、デジタルチューナ１０１６から供給されたMPEG-TSの場合と同様に、そのMPEG-TSを処理する。このようにテレビジョン受像機１０００は、映像や音声等よりなるコンテンツデータを、ネットワークを介して受信し、MPEGデコーダ１０１７を用いてデコードし、その映像を表示させたり、音声を出力させたりすることができる。

また、テレビジョン受像機１０００は、リモートコントローラ１０５１から送信される赤外線信号を受光する受光部１０３７も有する。

受光部１０３７は、リモートコントローラ１０５１からの赤外線を受光し、復調して得られたユーザ操作の内容を表す制御コードをCPU１０３２に出力する。

CPU１０３２は、フラッシュメモリ１０３１に記憶されているプログラムを実行し、受光部１０３７から供給される制御コードなどに応じてテレビジョン受像機１０００の全体の動作を制御する。CPU１０３２とテレビジョン受像機１０００の各部は、図示せぬ経路を介して接続されている。

USB I/F１０３３は、USB端子１０３６に装着されたUSBケーブルを介して接続される、テレビジョン受像機１０００の外部の機器との間でデータの送受信を行う。ネットワークI/F１０３４は、ネットワーク端子１０３５に装着されたケーブルを介してネットワークに接続し、ネットワークに接続される各種の装置と音声データ以外のデータの送受信も行う。

テレビジョン受像機１０００は、MPEGデコーダ１０１７として復号装置１を用いることにより、ストリームを構成する映像パケットに対するデコードにおいて、負荷を増大させずに、高精細な復号画像を得ることが可能になる。つまり、テレビジョン受像機１０００は、負荷の増大を抑制しながら符号化効率を向上させることができる。

図２３は、本発明を適用した復号装置１および符号化装置１０１を用いる携帯電話機の主な構成例を示すブロック図である。

図２３に示される携帯電話機１１００は、各部を統括的に制御するようになされた主制御部１１５０、電源回路部１１５１、操作入力制御部１１５２、画像エンコーダ１１５３、カメラI/F部１１５４、LCD制御部１１５５、画像デコーダ１１５６、多重分離部１１５７、記録再生部１１６２、変復調回路部１１５８、および音声コーデック１１５９を有する。これらは、バス１１６０を介して互いに接続されている。

また、携帯電話機１１００は、操作キー１１１９、CCD（Charge Coupled Devices）カメラ１１１６、液晶ディスプレイ１１１８、記憶部１１２３、送受信回路部１１６３、アンテナ１１１４、マイクロホン（マイク）１１２１、およびスピーカ１１１７を有する。

電源回路部１１５１は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話機１１００を動作可能な状態に起動する。

携帯電話機１１００は、CPU、ROMおよびRAM等でなる主制御部１１５０の制御に基づいて、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

例えば、音声通話モードにおいて、携帯電話機１１００は、マイクロホン（マイク）１１２１で集音した音声信号を、音声コーデック１１５９によってデジタル音声データに変換し、これを変復調回路部１１５８でスペクトラム拡散処理し、送受信回路部１１６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機１１００は、その変換処理により得られた送信用信号を、アンテナ１１１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（音声信号）は、公衆電話回線網を介して通話相手の携帯電話機に供給される。

また、例えば、音声通話モードにおいて、携帯電話機１１００は、アンテナ１１１４で受信した受信信号を送受信回路部１１６３で増幅し、さらに周波数変換処理およびアナログデジタル変換処理し、変復調回路部１１５８でスペクトラム逆拡散処理し、音声コーデック１１５９によってアナログ音声信号に変換する。携帯電話機１１００は、その変換して得られたアナログ音声信号をスピーカ１１１７から出力する。

更に、例えば、データ通信モードにおいて電子メールを送信する場合、携帯電話機１１００は、操作キー１１１９の操作によって入力された電子メールのテキストデータを、操作入力制御部１１５２において受け付ける。携帯電話機１１００は、そのテキストデータを主制御部１１５０において処理し、LCD制御部１１５５を介して、画像として液晶ディスプレイ１１１８に表示させる。

また、携帯電話機１１００は、主制御部１１５０において、操作入力制御部１１５２が受け付けたテキストデータやユーザ指示等に基づいて電子メールデータを生成する。携帯電話機１１００は、その電子メールデータを、変復調回路部１１５８でスペクトラム拡散処理し、送受信回路部１１６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機１１００は、その変換処理により得られた送信用信号を、アンテナ１１１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（電子メール）は、ネットワークおよびメールサーバ等を介して、所定のあて先に供給される。

また、例えば、データ通信モードにおいて電子メールを受信する場合、携帯電話機１１００は、基地局から送信された信号を、アンテナ１１１４を介して送受信回路部１１６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機１１００は、その受信信号を変復調回路部１１５８でスペクトラム逆拡散処理して元の電子メールデータを復元する。携帯電話機１１００は、復元された電子メールデータを、LCD制御部１１５５を介して液晶ディスプレイ１１１８に表示する。

なお、携帯電話機１１００は、受信した電子メールデータを、記録再生部１１６２を介して、記憶部１１２３に記録する（記憶させる）ことも可能である。

この記憶部１１２３は、書き換え可能な任意の記憶媒体である。記憶部１１２３は、例えば、RAMや内蔵型フラッシュメモリ等の半導体メモリであってもよいし、ハードディスクであってもよいし、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアであってもよい。もちろん、これら以外のものであってもよい。

さらに、例えば、データ通信モードにおいて画像データを送信する場合、携帯電話機１１００は、撮像によりCCDカメラ１１１６で画像データを生成する。CCDカメラ１１１６は、レンズや絞り等の光学デバイスと光電変換素子としてのCCDを有し、被写体を撮像し、受光した光の強度を電気信号に変換し、被写体の画像の画像データを生成する。CCDカメラ１１１６は、その画像データを、カメラI/F部１１５４を介して、画像エンコーダ１１５３で符号化し、符号化画像データに変換する。

携帯電話機１１００は、このような処理を行う画像エンコーダ１１５３として、上述した符号化装置１０１を用いる。画像エンコーダ１１５３は、符号化装置１０１の場合と同様に、予測画像の生成にフィルタリング予測を用いる。このようにすることにより、片方向予測、双方向予測、またはアップコンバート予測によって生成された予測画像と較べて高周波成分を多く含み、原画像との差が少ない予測画像が得られる。従って、残差に割り当てる符号量が少なくて済み、符号化効率を上げることが可能になる。エンハンスメントレイヤのフレームを参照する片方向予測や双方向予測の場合と較べて、参照フレームの解像度が小さいので、例えば参照フレームのフレームメモリ１２２への保存やフレームメモリ１２２からの読み出し等、処理の負荷が小さい。さらに、参照フレームの数が少なくとも２枚あればフィルタリング予測を行うことができるため、そのように符号化効率を上げるといったことを、処理を複雑にすることなく実現することが可能になる。

なお、携帯電話機１１００は、このとき同時に、CCDカメラ１１１６で撮像中にマイクロホン（マイク）１１２１で集音した音声を、音声コーデック１１５９においてアナログデジタル変換し、さらに符号化する。

携帯電話機１１００は、多重分離部１１５７において、画像エンコーダ１１５３から供給された符号化画像データと、音声コーデック１１５９から供給されたデジタル音声データとを、所定の方式で多重化する。携帯電話機１１００は、その結果得られる多重化データを、変復調回路部１１５８でスペクトラム拡散処理し、送受信回路部１１６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機１１００は、その変換処理により得られた送信用信号を、アンテナ１１１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（画像データ）は、ネットワーク等を介して、通信相手に供給される。

なお、画像データを送信しない場合、携帯電話機１１００は、CCDカメラ１１１６で生成した画像データを、画像エンコーダ１１５３を介さずに、LCD制御部１１５５を介して液晶ディスプレイ１１１８に表示させることもできる。

また、例えば、データ通信モードにおいて、簡易ホームページ等にリンクされた動画像ファイルのデータを受信する場合、携帯電話機１１００は、基地局から送信された信号を、アンテナ１１１４を介して送受信回路部１１６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機１１００は、その受信信号を変復調回路部１１５８でスペクトラム逆拡散処理して元の多重化データを復元する。携帯電話機１１００は、多重分離部１１５７において、その多重化データを分離して、符号化画像データと音声データとに分ける。

携帯電話機１１００は、画像デコーダ１１５６において符号化画像データをデコードすることにより、再生動画像データを生成し、これを、LCD制御部１１５５を介して液晶ディスプレイ１１１８に表示させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる動画データが液晶ディスプレイ１１１８に表示される。

携帯電話機１１００は、このような処理を行う画像デコーダ１１５６として、上述した復号装置１を用いる。つまり、画像デコーダ１１５６は、復号装置１の場合と同様に、ベースレイヤにおける複数の参照面の画像に対してフィルタリングを行うことで、エンハンスメントレイヤにおけるカレントブロックの予測画像を生成する。したがって、画像デコーダ１１５６は、空間的なアップサンプリングフィルタに比べ、画像列中の信号成分をより有効に利用することが可能になる。この結果、予測画像は、ベースレイヤのカレントフレームの画像を利用する従来のアップコンバート予測により生成した予測画像よりも空間的に高い周波数成分を有しつつ予測残差を低減させることができる。つまり、エンハンスメントレイヤにおける符号化ピクチャの符号量を低減させることができ、符号化効率の改善に貢献することが可能になる。

このとき、携帯電話機１１００は、同時に、音声コーデック１１５９において、デジタルの音声データをアナログ音声信号に変換し、これをスピーカ１１１７より出力させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる音声データが再生される。

なお、電子メールの場合と同様に、携帯電話機１１００は、受信した簡易ホームページ等にリンクされたデータを、記録再生部１１６２を介して、記憶部１１２３に記録する（記憶させる）ことも可能である。

また、携帯電話機１１００は、主制御部１１５０において、撮像されてCCDカメラ１１１６で得られた２次元コードを解析し、２次元コードに記録された情報を取得することができる。

さらに、携帯電話機１１００は、赤外線通信部１１８１で赤外線により外部の機器と通信することができる。

携帯電話機１１００は、画像エンコーダ１１５３として符号化装置１０１を用いることにより、例えばCCDカメラ１１１６において生成された画像データを符号化して伝送する際の、空間スケーラビリティを考慮した符号化を行うにあたり、動画像信号列に含まれる時間相関をより効率的に利用することで、例えば符号化や復号等の処理の負荷の増大を抑制しながら符号化効率を向上させることができる。

また、携帯電話機１１００は、画像デコーダ１１５６として復号装置１を用いることにより、例えば、簡易ホームページ等にリンクされた動画像ファイルのデータ（符号化データ）を受信する際の復号において、処理の負荷を増大させずに、高精細な復号画像を得ることが可能になる。つまり、携帯電話機１１００は、負荷の増大を抑制しながら符号化効率を向上させることができる。

なお、以上において、携帯電話機１１００が、CCDカメラ１１１６を用いるように説明したが、このCCDカメラ１１１６の代わりに、CMOS（Complementary Metal Oxide Semiconductor）を用いたイメージセンサ（CMOSイメージセンサ）を用いるようにしてもよい。この場合も、携帯電話機１１００は、CCDカメラ１１１６を用いる場合と同様に、被写体を撮像し、被写体の画像の画像データを生成することができる。

また、以上においては携帯電話機１１００として説明したが、例えば、PDA（Personal Digital Assistants）、スマートフォン、UMPC（Ultra Mobile Personal Computer）、ネットブック、ノート型パーソナルコンピュータ等、この携帯電話機１１００と同様の撮像機能や通信機能を有する装置であれば、どのような装置であっても携帯電話機１１００の場合と同様に、復号装置１および符号化装置１０１を適用することができる。

図２４は、本発明を適用した復号装置１および符号化装置１０１を用いるハードディスクレコーダの主な構成例を示すブロック図である。

図２４に示されるハードディスクレコーダ（HDDレコーダ）１２００は、チューナにより受信された、衛星や地上のアンテナ等より送信される放送波信号（テレビジョン信号）に含まれる放送番組のオーディオデータとビデオデータを、内蔵するハードディスクに保存し、その保存したデータをユーザの指示に応じたタイミングでユーザに提供する装置である。

ハードディスクレコーダ１２００は、例えば、放送波信号よりオーディオデータとビデオデータを抽出し、それらを適宜復号し、内蔵するハードディスクに記憶させることができる。また、ハードディスクレコーダ１２００は、例えば、ネットワークを介して他の装置からオーディオデータやビデオデータを取得し、それらを適宜復号し、内蔵するハードディスクに記憶させることもできる。

さらに、ハードディスクレコーダ１２００は、例えば、内蔵するハードディスクに記録されているオーディオデータやビデオデータを復号してモニタ１２６０に供給し、モニタ１２６０の画面にその画像を表示させ、モニタ１２６０のスピーカよりその音声を出力させることができる。また、ハードディスクレコーダ１２００は、例えば、チューナを介して取得された放送波信号より抽出されたオーディオデータとビデオデータ、または、ネットワークを介して他の装置から取得したオーディオデータやビデオデータを復号してモニタ１２６０に供給し、モニタ１２６０の画面にその画像を表示させ、モニタ１２６０のスピーカよりその音声を出力させることもできる。

もちろん、この他の動作も可能である。

図２４に示されるように、ハードディスクレコーダ１２００は、受信部１２２１、復調部１２２２、デマルチプレクサ１２２３、オーディオデコーダ１２２４、ビデオデコーダ１２２５、およびレコーダ制御部１２２６を有する。ハードディスクレコーダ１２００は、さらに、EPGデータメモリ１２２７、プログラムメモリ１２２８、ワークメモリ１２２９、ディスプレイコンバータ１２３０、OSD（On Screen Display）制御部１２３１、ディスプレイ制御部１２３２、記録再生部１２３３、D/Aコンバータ１２３４、および通信部１２３５を有する。

また、ディスプレイコンバータ１２３０は、ビデオエンコーダ１２４１を有する。記録再生部１２３３は、エンコーダ１２５１およびデコーダ１２５２を有する。

受信部１２２１は、リモートコントローラ（図示せず）からの赤外線信号を受信し、電気信号に変換してレコーダ制御部１２２６に出力する。レコーダ制御部１２２６は、例えば、マイクロプロセッサなどにより構成され、プログラムメモリ１２２８に記憶されているプログラムに従って、各種の処理を実行する。レコーダ制御部１２２６は、このとき、ワークメモリ１２２９を必要に応じて使用する。

通信部１２３５は、ネットワークに接続され、ネットワークを介して他の装置との通信処理を行う。例えば、通信部１２３５は、レコーダ制御部１２２６により制御され、チューナ（図示せず）と通信し、主にチューナに対して選局制御信号を出力する。

復調部１２２２は、チューナより供給された信号を、復調し、デマルチプレクサ１２２３に出力する。デマルチプレクサ１２２３は、復調部１２２２より供給されたデータを、オーディオデータ、ビデオデータ、およびEPGデータに分離し、それぞれ、オーディオデコーダ１２２４、ビデオデコーダ１２２５、またはレコーダ制御部１２２６に出力する。

オーディオデコーダ１２２４は、入力されたオーディオデータをデコードし、記録再生部１２３３に出力する。ビデオデコーダ１２２５は、入力されたビデオデータをデコードし、ディスプレイコンバータ１２３０に出力する。レコーダ制御部１２２６は、入力されたEPGデータをEPGデータメモリ１２２７に供給し、記憶させる。

ディスプレイコンバータ１２３０は、ビデオデコーダ１２２５またはレコーダ制御部１２２６より供給されたビデオデータを、ビデオエンコーダ１２４１により、例えばNTSC（National Television Standards Committee）方式のビデオデータにエンコードし、記録再生部１２３３に出力する。また、ディスプレイコンバータ１２３０は、ビデオデコーダ１２２５またはレコーダ制御部１２２６より供給されるビデオデータの画面のサイズを、モニタ１２６０のサイズに対応するサイズに変換し、ビデオエンコーダ１２４１によってNTSC方式のビデオデータに変換し、アナログ信号に変換し、ディスプレイ制御部１２３２に出力する。

ディスプレイ制御部１２３２は、レコーダ制御部１２２６の制御のもと、OSD（On Screen Display）制御部１２３１が出力したOSD信号を、ディスプレイコンバータ１２３０より入力されたビデオ信号に重畳し、モニタ１２６０のディスプレイに出力し、表示させる。

モニタ１２６０にはまた、オーディオデコーダ１２２４が出力したオーディオデータが、D/Aコンバータ１２３４によりアナログ信号に変換されて供給されている。モニタ１２６０は、このオーディオ信号を内蔵するスピーカから出力する。

記録再生部１２３３は、ビデオデータやオーディオデータ等を記録する記憶媒体としてハードディスクを有する。

記録再生部１２３３は、例えば、オーディオデコーダ１２２４より供給されるオーディオデータを、エンコーダ１２５１によりエンコードする。また、記録再生部１２３３は、ディスプレイコンバータ１２３０のビデオエンコーダ１２４１より供給されるビデオデータを、エンコーダ１２５１によりエンコードする。記録再生部１２３３は、そのオーディオデータの符号化データとビデオデータの符号化データとをマルチプレクサにより合成する。記録再生部１２３３は、その合成データをチャネルコーディングして増幅し、そのデータを、記録ヘッドを介してハードディスクに書き込む。

記録再生部１２３３は、再生ヘッドを介してハードディスクに記録されているデータを再生し、増幅し、デマルチプレクサによりオーディオデータとビデオデータに分離する。記録再生部１２３３は、デコーダ１２５２によりオーディオデータおよびビデオデータをデコードする。記録再生部１２３３は、復号したオーディオデータをD/A変換し、モニタ１２６０のスピーカに出力する。また、記録再生部１２３３は、復号したビデオデータをD/A変換し、モニタ１２６０のディスプレイに出力する。

レコーダ制御部１２２６は、受信部１２２１を介して受信されるリモートコントローラからの赤外線信号により示されるユーザ指示に基づいて、EPGデータメモリ１２２７から最新のEPGデータを読み出し、それをOSD制御部１２３１に供給する。OSD制御部１２３１は、入力されたEPGデータに対応する画像データを発生し、ディスプレイ制御部１２３２に出力する。ディスプレイ制御部１２３２は、OSD制御部１２３１より入力されたビデオデータをモニタ１２６０のディスプレイに出力し、表示させる。これにより、モニタ１２６０のディスプレイには、EPG（電子番組ガイド）が表示される。

また、ハードディスクレコーダ１２００は、インターネット等のネットワークを介して他の装置から供給されるビデオデータ、オーディオデータ、またはEPGデータ等の各種データを取得することができる。

通信部１２３５は、レコーダ制御部１２２６に制御され、ネットワークを介して他の装置から送信されるビデオデータ、オーディオデータ、およびEPGデータ等の符号化データを取得し、それをレコーダ制御部１２２６に供給する。レコーダ制御部１２２６は、例えば、取得したビデオデータやオーディオデータの符号化データを記録再生部１２３３に供給し、ハードディスクに記憶させる。このとき、レコーダ制御部１２２６および記録再生部１２３３が、必要に応じて再エンコード等の処理を行うようにしてもよい。

また、レコーダ制御部１２２６は、取得したビデオデータやオーディオデータの符号化データを復号し、得られるビデオデータをディスプレイコンバータ１２３０に供給する。ディスプレイコンバータ１２３０は、ビデオデコーダ１２２５から供給されるビデオデータと同様に、レコーダ制御部１２２６から供給されるビデオデータを処理し、ディスプレイ制御部１２３２を介してモニタ１２６０に供給し、その画像を表示させる。

また、この画像表示に合わせて、レコーダ制御部１２２６が、復号したオーディオデータを、D/Aコンバータ１２３４を介してモニタ１２６０に供給し、その音声をスピーカから出力させるようにしてもよい。

さらに、レコーダ制御部１２２６は、取得したEPGデータの符号化データを復号し、復号したEPGデータをEPGデータメモリ１２２７に供給する。

以上のようなハードディスクレコーダ１２００は、ビデオデコーダ１２２５、デコーダ１２５２、およびレコーダ制御部１２２６に内蔵されるデコーダとして復号装置１を用いる。つまり、ビデオデコーダ１２２５、デコーダ１２５２、およびレコーダ制御部１２２６に内蔵されるデコーダは、復号装置１の場合と同様に、ベースレイヤにおける複数の参照面の画像に対してフィルタリングを行うことで、エンハンスメントレイヤにおけるカレントブロックの予測画像を生成する。

したがって、ビデオデコーダ１２２５、デコーダ１２５２、およびレコーダ制御部１２２６に内蔵されるデコーダは、空間的なアップサンプリングフィルタに比べ、画像列中の信号成分をより有効に利用することが可能になる。この結果、予測画像は、ベースレイヤのカレントフレームの画像を利用する従来のアップコンバート予測により生成した予測画像よりも空間的に高い周波数成分を有しつつ予測残差を低減させることができる。つまり、エンハンスメントレイヤにおける符号化ピクチャの符号量を低減させることができ、符号化効率の改善に貢献することが可能になる。

したがって、ハードディスクレコーダ１２００は、例えば、チューナや通信部１２３５によるビデオデータ（符号化データ）の受信の際や、記録再生部１２３３によるビデオデータ（符号化データ）のハードディスクからの再生の際の復号において、処理の負荷を増大させずに、高精細な復号画像を得ることが可能になる。つまり、ハードディスクレコーダ１２００は、負荷の増大を抑制しながら符号化効率を向上させることができる。

また、ハードディスクレコーダ１２００は、エンコーダ１２５１として符号化装置１０１を用いる。したがって、エンコーダ１２５１は、符号化装置１０１の場合と同様に、双方向予測、またはアップコンバート予測によって生成された予測画像と較べて高周波成分を多く含み、原画像との差が少ない予測画像が得られる。従って、残差に割り当てる符号量が少なくて済み、符号化効率を上げることが可能になる。エンハンスメントレイヤのフレームを参照する片方向予測や双方向予測の場合と較べて、参照フレームの解像度が小さいので、例えば参照フレームのフレームメモリ１２２への保存やフレームメモリ１２２からの読み出し等、処理の負荷が小さい。さらに、参照フレームの数が少なくとも２枚あればフィルタリング予測を行うことができるため、そのように符号化効率を上げるといったことを、処理を複雑にすることなく実現することが可能になる。

したがって、ハードディスクレコーダ１２００は、、例えば、ハードディスクに符号化データを記録する際の、空間スケーラビリティを考慮した符号化を行うにあたり、動画像信号列に含まれる時間相関をより効率的に利用することで、例えば符号化や復号等の処理の負荷の増大を抑制しながら符号化効率を向上させることができる。

なお、以上においては、ビデオデータやオーディオデータをハードディスクに記録するハードディスクレコーダ１２００について説明したが、もちろん、記録媒体はどのようなものであってもよい。例えばフラッシュメモリ、光ディスク、またはビデオテープ等、ハードディスク以外の記録媒体を適用するレコーダであっても、上述したハードディスクレコーダ１２００の場合と同様に、復号装置１および符号化装置１０１を適用することができる。

図２５は、本発明を適用した復号装置１および符号化装置１０１を用いるカメラの主な構成例を示すブロック図である。

図２５に示されるカメラ１３００は、被写体を撮像し、被写体の画像をLCD１３１６に表示させたり、それを画像データとして、記録メディア１３３３に記録したりする。

レンズブロック１３１１は、光（すなわち、被写体の映像）を、CCD/CMOS１３１２に入射させる。CCD/CMOS１３１２は、CCDまたはCMOSを用いたイメージセンサであり、受光した光の強度を電気信号に変換し、カメラ信号処理部１３１３に供給する。

カメラ信号処理部１３１３は、CCD/CMOS１３１２から供給された電気信号を、Ｙ，Ｃｒ，Ｃｂの色差信号に変換し、画像信号処理部１３１４に供給する。画像信号処理部１３１４は、コントローラ１３２１の制御の下、カメラ信号処理部１３１３から供給された画像信号に対して所定の画像処理を施したり、その画像信号をエンコーダ１３４１で符号化したりする。画像信号処理部１３１４は、画像信号を符号化して生成した符号化データを、デコーダ１３１５に供給する。さらに、画像信号処理部１３１４は、オンスクリーンディスプレイ（OSD）１３２０において生成された表示用データを取得し、それをデコーダ１３１５に供給する。

以上の処理において、カメラ信号処理部１３１３は、バス１３１７を介して接続されるDRAM（Dynamic Random Access Memory）１３１８を適宜利用し、必要に応じて画像データや、その画像データが符号化された符号化データ等をそのDRAM１３１８に保持させる。

デコーダ１３１５は、画像信号処理部１３１４から供給された符号化データを復号し、得られた画像データ（復号画像データ）をLCD１３１６に供給する。また、デコーダ１３１５は、画像信号処理部１３１４から供給された表示用データをLCD１３１６に供給する。LCD１３１６は、デコーダ１３１５から供給された復号画像データの画像と表示用データの画像を適宜合成し、その合成画像を表示する。

オンスクリーンディスプレイ１３２０は、コントローラ１３２１の制御の下、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを、バス１３１７を介して画像信号処理部１３１４に出力する。

コントローラ１３２１は、ユーザが操作部１３２２を用いて指令した内容を示す信号に基づいて、各種処理を実行するとともに、バス１３１７を介して、画像信号処理部１３１４、DRAM１３１８、外部インタフェース１３１９、オンスクリーンディスプレイ１３２０、およびメディアドライブ１３２３等を制御する。FLASH ROM１３２４には、コントローラ１３２１が各種処理を実行する上で必要なプログラムやデータ等が格納される。

例えば、コントローラ１３２１は、画像信号処理部１３１４やデコーダ１３１５に代わって、DRAM１３１８に記憶されている画像データを符号化したり、DRAM１３１８に記憶されている符号化データを復号したりすることができる。このとき、コントローラ１３２１は、画像信号処理部１３１４やデコーダ１３１５の符号化・復号方式と同様の方式によって符号化・復号処理を行うようにしてもよいし、画像信号処理部１３１４やデコーダ１３１５が対応していない方式により符号化・復号処理を行うようにしてもよい。

また、例えば、操作部１３２２から画像印刷の開始が指示された場合、コントローラ１３２１は、DRAM１３１８から画像データを読み出し、それを、バス１３１７を介して外部インタフェース１３１９に接続されるプリンタ１３３４に供給して印刷させる。

さらに、例えば、操作部１３２２から画像記録が指示された場合、コントローラ１３２１は、DRAM１３１８から符号化データを読み出し、それを、バス１３１７を介してメディアドライブ１３２３に装着される記録メディア１３３３に供給して記憶させる。

記録メディア１３３３は、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアである。記録メディア１３３３は、もちろん、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であっても良い。

また、メディアドライブ１３２３と記録メディア１３３３を一体化し、例えば、内蔵型ハードディスクドライブやSSD（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

外部インタフェース１３１９は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタ１３３４と接続される。また、外部インタフェース１３１９には、必要に応じてドライブ１３３１が接続され、磁気ディスク、光ディスク、あるいは光磁気ディスクなどのリムーバブルメディア１３３２が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、FLASH ROM１３２４にインストールされる。

さらに、外部インタフェース１３１９は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。コントローラ１３２１は、例えば、操作部１３２２からの指示に従って、DRAM１３１８から符号化データを読み出し、それを外部インタフェース１３１９から、ネットワークを介して接続される他の装置に供給させることができる。また、コントローラ１３２１は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース１３１９を介して取得し、それをDRAM１３１８に保持させたり、画像信号処理部１３１４に供給したりすることができる。

以上のようなカメラ１３００は、デコーダ１３１５として復号装置１を用いる。つまり、デコーダ１３１５は、復号装置１の場合と同様に、ベースレイヤにおける複数の参照面の画像に対してフィルタリングを行うことで、エンハンスメントレイヤにおけるカレントブロックの予測画像を生成する。したがって、デコーダ１３１５は、空間的なアップサンプリングフィルタに比べ、画像列中の信号成分をより有効に利用することが可能になる。この結果、予測画像は、ベースレイヤのカレントフレームの画像を利用する従来のアップコンバート予測により生成した予測画像よりも空間的に高い周波数成分を有しつつ予測残差を低減させることができる。つまり、エンハンスメントレイヤにおける符号化ピクチャの符号量を低減させることができ、符号化効率の改善に貢献することが可能になる。

したがって、カメラ１３００は、例えば、CCD/CMOS１３１２において生成される画像データや、DRAM１３１８または記録メディア１３３３からビデオデータの符号化データを読み出す際や、ネットワークを介してビデオデータの符号化データを取得する際の、処理の負荷の増大を抑制しながら符号化効率を向上させることができる。

また、カメラ１３００は、エンコーダ１３４１として符号化装置１０１を用いる。エンコーダ１３４１は、符号化装置１０１の場合と同様に、双方向予測、またはアップコンバート予測によって生成された予測画像と較べて高周波成分を多く含み、原画像との差が少ない予測画像が得られる。従って、残差に割り当てる符号量が少なくて済み、符号化効率を上げることが可能になる。エンハンスメントレイヤのフレームを参照する片方向予測や双方向予測の場合と較べて、参照フレームの解像度が小さいので、例えば参照フレームのフレームメモリ１２２への保存やフレームメモリ１２２からの読み出し等、処理の負荷が小さい。さらに、参照フレームの数が少なくとも２枚あればフィルタリング予測を行うことができるため、そのように符号化効率を上げるといったことを、処理を複雑にすることなく実現することが可能になる。

したがって、カメラ１３００は、例えば、DRAM１３１８や記録メディア１３３３に符号化データを記録する際や、符号化データを他の装置に提供する際の、空間スケーラビリティを考慮した符号化を行うにあたり、動画像信号列に含まれる時間相関をより効率的に利用することで、例えば符号化や復号等の処理の負荷の増大を抑制しながら符号化効率を向上させることができる。

なお、コントローラ１３２１が行う復号処理に復号装置１の復号方法を適用するようにしてもよい。同様に、コントローラ１３２１が行う符号化処理に符号化装置１０１の符号化方法を適用するようにしてもよい。

また、カメラ１３００が撮像する画像データは動画像であってもよいし、静止画像であってもよい。

もちろん、復号装置１および符号化装置１０１は、上述した装置以外の装置やシステムにも適用可能である。

また、マクロブロックの大きさは任意である。本発明は、例えば図２６に示されるようなあらゆる大きさのマクロブロックに対して適用することができる。例えば、本発明は、通常の１６×１６画素のようなマクロブロックだけでなく、３２×３２画素のような拡張されたマクロブロック（拡張マクロブロック）にも適用することができる。

図２６において、上段には、左から、３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロック（パーティション）に分割された３２×３２画素で構成されるマクロブロックが順に示されている。また、中段には、左から、１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックに分割された１６×１６画素で構成されるブロックが順に示されている。さらに、下段には、左から、８×８画素、８×４画素、４×８画素、および４×４画素のブロックに分割された８×８画素のブロックが順に示されている。

すなわち、３２×３２画素のマクロブロックは、上段に示される３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロックでの処理が可能である。

上段の右側に示される１６×１６画素のブロックは、H．264/AVC方式と同様に、中段に示される１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックでの処理が可能である。

中段の右側に示される８×８画素のブロックは、H．264/AVC方式と同様に、下段に示される８×８画素、８×４画素、４×８画素、および４×４画素のブロックでの処理が可能である。

これらのブロックは、以下の３階層に分類することができる。すなわち、図２６の上段に示される３２×３２画素、３２×１６画素、および１６×３２画素のブロックを第１階層と称する。上段の右側に示される１６×１６画素のブロック、並びに、中段に示される１６×１６画素、１６×８画素、および８×１６画素のブロックを、第２階層と称する。中段の右側に示される８×８画素のブロック、並びに、下段に示される８×８画素、８×４画素、４×８画素、および４×４画素のブロックを、第３階層と称する。

このような階層構造を採用することにより、１６×１６画素のブロック以下に関しては、H．264/AVC方式と互換性を保ちながら、そのスーパーセットとして、より大きなブロックを定義することができる。

例えば、復号装置１および符号化装置１０１が、階層毎に予測画像を生成するようにしてもよい。また、例えば、復号装置１および符号化装置１０１が、第２の階層よりブロックサイズが大きい階層である第１階層において生成した予測画像を、第２階層に対しても利用するようにしてもよい。

第１階層や第２階層のように、比較的大きなブロックサイズを用いて符号化が行われるマクロブロックは、比較的高周波成分を含んでいない。これに対して、第３階層のように、比較的小さなブロックサイズを用いて符号化が行われるマクロブロックは、比較的、高周波成分を含んでいると考えられる。

そこで、ブロックサイズの異なる各階層に応じて、別々に予測画像を生成することにより、画像の持つ、局所的性質に適した符号化性能向上を実現させることが可能である。

１復号装置，１２可逆復号回路，１５加算回路，１９フレームメモリ，２１動き予測・補償回路，４１予測判定回路，５１予測選択回路，６４フィルタリング予測回路，７１抽出回路，７２フィルタリング回路，８１差分計算回路，８２アップコンバート回路，８３ローパスフィルタ回路，８４ゲイン調整回路，８５ハイパスフィルタ回路，８６ゲイン調整回路，８７加算回路，８８アップコンバート回路，８９加算回路，１０１符号化装置，１１２並べ替えバッファ，１２３モード決定回路，１２５動き予測・補償回路，１２６イントラ予測回路，１４５フィルタリング予測回路，１５５フィルタリング予測回路，２１１フィルタリング回路

Claims

符号化された画像を復号する復号手段と、
前記復号手段により復号された画像と予測画像とを加算し、復号済みの画像を生成する生成手段と、
前記生成手段により生成された復号済みの画像からなるフレームを参照フレームとして、符号化された前記画像の動きベクトルを用いて動き補償を行い、前記予測画像よりも低解像度の動き補償画像を、前記予測画像に対応する前記参照フレームから抽出する抽出手段と、
前記抽出手段により抽出された前記動き補償画像に対して、前記動き補償画像に含まれる時間方向の相関を利用して高周波成分を補うフィルタリング処理を行うことにより、前記動き補償画像よりも高解像度の前記予測画像を生成する予測画像生成手段と
を備える画像処理装置。
前記符号化された画像は、互いに解像度の異なる複数のレイヤに階層化されて符号化されており、
前記復号手段は、各レイヤにおいて前記符号化された画像を復号し、
前記生成手段は、各レイヤにおいて前記復号済みの画像を生成し、
前記抽出手段は、高解像度のレイヤの復号の際に、前記レイヤよりも低解像度のレイヤの前記フレームを前記参照フレームとし、前記低解像度のレイヤの前記参照フレームから前記動き補償画像を抽出し、
前記予測画像生成手段は、前記低解像度のレイヤの前記参照フレームから抽出された前記動き補償画像に対して前記フィルタリング処理を行うことにより、前記高解像度のレイヤの前記予測画像を生成する
請求項１に記載の画像処理装置。
前記予測画像生成手段は、
前記抽出手段により抽出された複数の前記動き補償画像の差分画像の解像度を変換し、高解像度化する解像度変換手段と、
前記解像度変換手段により高解像度化された前記差分画像にローパスフィルタをかける第１のフィルタ手段と、
前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像にハイパスフィルタをかける第２のフィルタ手段と、
前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像と、前記第２のフィルタ手段によりハイパスフィルタがかけられることによって得られた画像とを、前記抽出手段により抽出された複数の前記動き補償画像のうちのいずれかに加算し、前記予測画像を生成する加算手段と
を備える請求項１に記載の画像処理装置。
前記加算手段は、前記予測画像の時刻を基準として１時刻前のフレームから抽出された前記動き補償画像に対して、前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像と、前記第２のフィルタ手段によりハイパスフィルタがかけられることによって得られた画像とを加算する
請求項３に記載の画像処理装置。
複数の前記動き補償画像を用いて片方向予測を行い、前記予測画像を生成する片方向予測手段と、
複数の前記動き補償画像を用いて双方向予測を行い、前記予測画像を生成する双方向予測手段と、
符号化された前記画像のヘッダに含まれる識別フラグにより、前記予測画像を、前記片方向予測手段による片方向予測によって生成するのか、前記双方向予測手段による双方向予測によって生成するのか、または、前記予測画像生成手段による前記フィルタリング処理によって生成するのかを判定する判定手段と
をさらに備える請求項１に記載の画像処理装置。
符号化された画像を復号し、
復号された画像と予測画像とを加算し、復号済みの画像を生成し、
生成された復号済みの画像からなるフレームを参照フレームとして、符号化された前記画像の動きベクトルを用いて動き補償を行い、前記予測画像よりも低解像度の動き補償画像を、前記予測画像に対応する前記参照フレームから抽出し、
抽出された前記動き補償画像に対して、前記動き補償画像に含まれる時間方向の相関を利用して高周波成分を補うフィルタリング処理を行うことにより、前記動き補償画像よりも高解像度の前記予測画像を生成する
画像処理方法。
符号化対象の画像である原画像を符号化し、符号化された画像を生成する符号化手段と、
前記原画像と予測画像との差を示す残差信号に基づいて局所的に復号して得られた画像と前記原画像とに基づいて動きベクトルを検出する検出手段と、
局所的に復号して得られた前記画像からなるフレームを参照フレームとして、前記検出手段により検出された動きベクトルを用いて動き補償を行い、前記予測画像よりも低解像度の動き補償画像を、前記予測画像に対応する前記参照フレームから抽出する抽出手段と、
前記抽出手段により抽出された前記動き補償画像に対して、前記動き補償画像に含まれる時間方向の相関を利用して高周波成分を補うフィルタリング処理を行うことにより、前記動き補償画像よりも高解像度の前記予測画像を生成する生成手段と
を備える画像処理装置。
前記符号化手段は、互いに解像度の異なる複数のレイヤにおいて符号化された画像を生成し、
前記抽出手段は、高解像度のレイヤの復号の際に、前記レイヤよりも低解像度のレイヤの前記フレームを前記参照フレームとし、前記検出手段により前記低解像度のレイヤにおいて検出された前記動きベクトルを用いて、前記低解像度のレイヤの前記参照フレームから前記動き補償画像を抽出し、
前記生成手段は、前記低解像度のレイヤの前記参照フレームから抽出された前記動き補償画像に対して前記フィルタリング処理を行うことにより、前記高解像度のレイヤの前記予測画像を生成する
請求項７に記載の画像処理装置。
前記生成手段は、
前記抽出手段により抽出された複数の前記動き補償画像の差分画像の解像度を変換し、高解像度化する解像度変換手段と、
前記解像度変換手段により高解像度化された前記差分画像にローパスフィルタをかける第１のフィルタ手段と、
前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像にハイパスフィルタをかける第２のフィルタ手段と、
前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像と、前記第２のフィルタ手段によりハイパスフィルタがかけられることによって得られた画像とを、前記抽出手段により抽出された複数の前記動き補償画像のうちのいずれかに加算し、前記予測画像を生成する加算手段と
を備える請求項７に記載の画像処理装置。
前記加算手段は、前記予測画像の時刻を基準として１時刻前のフレームから抽出された前記動き補償画像に対して、前記第１のフィルタ手段によりローパスフィルタがかけられることによって得られた画像と、前記第２のフィルタ手段によりハイパスフィルタがかけられることによって得られた画像とを加算する
請求項９に記載の画像処理装置。
前記符号化手段は、復号装置において復号した画像に加算する予測画像を、片方向予測によって生成するのか、双方向予測によって生成するのか、または、前記フィルタリング処理によって生成するのかを識別する識別フラグをヘッダに含める
請求項７に記載の画像処理装置。
符号化対象の画像である原画像を符号化し、符号化された画像を生成し、
前記原画像と予測画像との差を示す残差信号に基づいて局所的に復号して得られた画像と前記原画像とに基づいて動きベクトルを検出し、
局所的に復号して得られた前記画像からなるフレームを参照フレームとして、検出された動きベクトルを用いて動き補償を行い、前記予測画像よりも低解像度の動き補償画像を、前記予測画像に対応する前記参照フレームから抽出し、
抽出された前記動き補償画像に対して、前記動き補償画像に含まれる時間方向の相関を利用して高周波成分を補うフィルタリング処理を行うことにより、前記動き補償画像よりも高解像度の前記予測画像を生成する
画像処理方法。