JP2011223337A

JP2011223337A - 画像処理装置および方法

Info

Publication number: JP2011223337A
Application number: JP2010090717A
Authority: JP
Inventors: Kazufumi Sato; 数史佐藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2010-04-09
Filing date: 2010-04-09
Publication date: 2011-11-04
Also published as: US20130028321A1; WO2011125866A1; CN102884791A

Abstract

【課題】画面全体における画質劣化を最小限にするともに、ローカルな画質劣化を改善することができるようにする。
【解決手段】適応ループフィルタ１１１は、デブロックフィルタ２１からの復号画像を、マクロブロック毎に、予測モードバッファ１１２からのイントラ予測モード情報に応じたクラスに分類する。適応ループフィルタ１１１は、分類されたクラス毎に、画面並べ替えバッファ１２からの原画像とデブロックフィルタ２１からの画像との残差を最小とするよう、フィルタ係数の算出を行う。適応ループフィルタ１１１は、分類されたクラス毎に、算出されたフィルタ係数を用いて、フィルタ処理を行い、フィルタ処理後の画像を、フレームメモリ２２に出力する。本発明は、例えば、H．264/AVC方式をベースに符号化する画像符号化装置に適用することができる。
【選択図】図５

Description

本発明は画像処理装置および方法に関し、特に、画面全体における画質劣化を最小限にするともに、ローカルな画質劣化を改善するようにした画像処理装置および方法に関する。

近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮する符号化方式を採用して画像を圧縮符号する装置が普及しつつある。この符号化方式には、例えば、MPEG（Moving Picture Experts Group）などがある。

特に、MPEG2(ISO/IEC 13818-2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準である。例えば、MPEG2は、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4乃至8Mbpsの符号量（ビットレート）が割り当てられる。また、MPEG2圧縮方式を用いることにより、例えば1920×1088画素を持つ高解像度の飛び越し走査画像であれば18乃至22 Mbpsの符号量（ビットレート）が割り当てられる。これにより、高い圧縮率と良好な画質の実現が可能である。

MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496-2としてその規格が国際標準に承認された。

さらに、近年、当初テレビ会議用の画像符号化を目的として、H．26L (ITU-T Q6/16 VCEG）という標準の規格化が進んでいる。H．26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。その後、MPEG4の活動の一環として、このH．26Lをベースに、H．26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われている。標準化のスケジュールとしては、2003年3月にはH．264及びMPEG-4 Part10 （Advanced Video Coding、以下H．264/AVCと記す）という国際標準となっている。

図１は、H．264/AVCに基づいた圧縮画像を出力とする画像符号化装置の構成例を示すブロック図である。

図１の例において、画像符号化装置１は、A/D変換部１１、画面並べ替えバッファ１２、演算部１３、直交変換部１４、量子化部１５、可逆符号化部１６、蓄積バッファ１７、逆量子化部１８、逆直交変換部１９、演算部２０、デブロックフィルタ２１、フレームメモリ２２、スイッチ２３、イントラ予測部２４、動き予測・補償部２５、予測画像選択部２６、およびレート制御部２７により構成されている。

A/D変換部１１は、入力された画像をA/D変換し、画面並べ替えバッファ１２に出力し、記憶させる。画面並べ替えバッファ１２は、記憶した表示の順番のフレームの画像を、GOP（Group of Picture）に応じて、符号化のためのフレームの順番に並べ替える。

演算部１３は、画面並べ替えバッファ１２から読み出された画像から、予測画像選択部２６により選択されたイントラ予測部２４からの予測画像または動き予測・補償部２５からの予測画像を減算し、その差分情報を直交変換部１４に出力する。直交変換部１４は、演算部１３からの差分情報に対して、離散コサイン変換、カルーネン・レーベ変換等の直交変換を施し、その変換係数を出力する。量子化部１５は直交変換部１４が出力する変換係数を量子化する。

量子化部１５の出力となる、量子化された変換係数は、可逆符号化部１６に入力され、ここで可変長符号化、算術符号化等の可逆符号化が施され、圧縮される。

可逆符号化部１６は、イントラ予測を示す情報をイントラ予測部２４から取得し、インター予測モードを示す情報などを動き予測・補償部２５から取得する。なお、イントラ予測を示す情報およびインター予測を示す情報は、以下、それぞれ、イントラ予測モード情報およびインター予測モード情報とも称する。

可逆符号化部１６は、量子化された変換係数を符号化するとともに、イントラ予測を示す情報、インター予測モードを示す情報などを符号化し、圧縮画像におけるヘッダ情報の一部とする。可逆符号化部１６は、符号化したデータを蓄積バッファ１７に供給して蓄積させる。

例えば、可逆符号化部１６においては、可変長符号化または算術符号化等の可逆符号化処理が行われる。可変長符号化としては、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）などがあげられる。算術符号化としては、CABAC（Context-Adaptive Binary Arithmetic Coding）などがあげられる。

蓄積バッファ１７は、可逆符号化部１６から供給されたデータを、H．264/AVC方式で符号化された圧縮画像として、例えば、後段の図示せぬ記録装置や伝送路などの復号側に出力する。

また、量子化部１５より出力された、量子化された変換係数は、逆量子化部１８にも入力され、逆量子化された後、さらに逆直交変換部１９において逆直交変換される。逆直交変換された出力は演算部２０により予測画像選択部２６から供給される予測画像と加算されて、局部的に復号された画像となる。デブロックフィルタ２１は、復号された画像のブロック歪を除去した後、フレームメモリ２２に供給し、蓄積させる。フレームメモリ２２には、デブロックフィルタ２１によりデブロックフィルタ処理される前の画像も供給され、蓄積される。

スイッチ２３はフレームメモリ２２に蓄積された参照画像を動き予測・補償部２５またはイントラ予測部２４に出力する。

この画像符号化装置１においては、例えば、画面並べ替えバッファ１２からのＩピクチャ、Ｂピクチャ、およびＰピクチャが、イントラ予測（イントラ処理とも称する）する画像として、イントラ予測部２４に供給される。また、画面並べ替えバッファ１２から読み出されたＢピクチャおよびＰピクチャが、インター予測（インター処理とも称する）する画像として、動き予測・補償部２５に供給される。

イントラ予測部２４は、画面並べ替えバッファ１２から読み出されたイントラ予測する画像とフレームメモリ２２から供給された参照画像に基づいて、候補となる全てのイントラ予測モードのイントラ予測処理を行い、予測画像を生成する。

その際、イントラ予測部２４は、候補となる全てのイントラ予測モードに対してコスト関数値を算出し、算出したコスト関数値が最小値を与えるイントラ予測モードを、最適イントラ予測モードとして選択する。

イントラ予測部２４は、最適イントラ予測モードで生成された予測画像とそのコスト関数値を、予測画像選択部２６に供給する。イントラ予測部２４は、予測画像選択部２６により最適イントラ予測モードで生成された予測画像が選択された場合、最適イントラ予測モードを示す情報を、可逆符号化部１６に供給する。可逆符号化部１６は、この情報を符号化し、圧縮画像におけるヘッダ情報の一部とする。

動き予測・補償部２５には、画面並べ替えバッファ１２から読み出されたインター処理する画像と、スイッチ２３を介してフレームメモリ２２から参照画像が供給される。動き予測・補償部２５は、候補となる全てのインター予測モードのブロックの動き予測を行い、各ブロックの動きベクトルを生成する。

動き予測・補償部２５は、予測した各ブロックの動きベクトルを用いて、候補となる全てのインター予測モードに対してコスト関数値を算出する。動き予測・補償部２５は、算出したコスト関数値のうち、最小値を与えるブロックの予測モードを、最適インター予測モードとして決定する。

動き予測・補償部２５は、決定された最適インター予測モードの対象ブロックの予測画像とそのコスト関数値を、予測画像選択部２６に供給する。動き予測・補償部２５は、予測画像選択部２６により最適インター予測モードの対象ブロックの予測画像が選択された場合、最適インター予測モードを示す情報（インター予測モード情報）を可逆符号化部１６に出力する。

このとき、動きベクトル情報、参照フレーム情報なども可逆符号化部１６に出力される。可逆符号化部１６は、動き予測・補償部２５からの情報をやはり可変長符号化、算術符号化といった可逆符号化処理し、圧縮画像のヘッダ部に挿入する。

予測画像選択部２６は、イントラ予測部２４または動き予測・補償部２５より出力された各コスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードから、最適予測モードを決定する。そして、予測画像選択部２６は、決定された最適予測モードの予測画像を選択し、演算部１３，２０に供給する。このとき、予測画像選択部２６は、予測画像の選択情報を、イントラ予測部２４または動き予測・補償部２５に供給する。

レート制御部２７は、蓄積バッファ１７に蓄積された圧縮画像に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１５の量子化動作のレートを制御する。

図２は、図１の画像符号化装置に対応する画像復号装置の構成例を示すブロック図である。

図２の例において、画像復号装置３１は、蓄積バッファ４１、可逆復号部４２、逆量子化部４３、逆直交変換部４４、演算部４５、デブロックフィルタ４６、画面並べ替えバッファ４７、D/A変換部４８、フレームメモリ４９、スイッチ５０、イントラ予測部５１、動き補償部５２、およびスイッチ５３により構成されている。

蓄積バッファ４１は伝送されてきた圧縮画像を蓄積する。可逆復号部４２は、蓄積バッファ４１より供給された、図１の可逆符号化部１６により符号化された情報を、可逆符号化部１６の符号化方式に対応する方式で復号する。逆量子化部４３は可逆復号部４２により復号された画像を、図１の量子化部１５の量子化方式に対応する方式で逆量子化する。逆直交変換部４４は、図１の直交変換部１４の直交変換方式に対応する方式で逆量子化部４３の出力を逆直交変換する。

逆直交変換された出力は演算部４５によりスイッチ５３から供給される予測画像と加算されて復号される。デブロックフィルタ４６は、復号された画像のブロック歪を除去した後、フレームメモリ４９に供給し、蓄積させるとともに、画面並べ替えバッファ４７に出力する。

画面並べ替えバッファ４７は、画像の並べ替えを行う。すなわち、図１の画面並べ替えバッファ１２により符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられる。D/A変換部４８は、画面並べ替えバッファ４７から供給された画像をD/A変換し、図示せぬディスプレイに出力し、表示させる。

スイッチ５０は、インター処理される画像と参照される画像をフレームメモリ４９から読み出し、動き補償部５２に出力するとともに、イントラ予測に用いられる画像をフレームメモリ４９から読み出し、イントラ予測部５１に供給する。

イントラ予測部５１には、ヘッダ情報を復号して得られたイントラ予測モードを示す情報が可逆復号部４２から供給される。イントラ予測部５１は、この情報に基づいて、予測画像を生成し、生成した予測画像を、スイッチ５３に出力する。

動き補償部５２には、ヘッダ情報を復号して得られた情報のうち、インター予測モード情報、動きベクトル情報、参照フレーム情報などが可逆復号部４２から供給される。インター予測モード情報は、マクロブロック毎に送信されてくる。動きベクトル情報や参照フレーム情報は、対象ブロック毎に送信されてくる。

動き補償部５２は、可逆復号部４２から供給されるインター予測モード情報が示す予測モードで、可逆復号部４２から供給される動きベクトル情報および参照フレーム情報などを用いて、対象ブロックに対する予測画像の画素値を生成する。生成された予測画像の画素値は、スイッチ５３を介して、演算部４５に供給される。

スイッチ５３は、動き補償部５２またはイントラ予測部５１により生成された予測画像を選択し、演算部４５に供給する。

さらに、このH．264/AVCの拡張として、RGBや4:2:2、4:4:4といった、業務用に必要な符号化ツールや、MPEG-2で規定されていた8x8DCTや量子化マトリクスをも含んだFRExt (Fidelity Range Extension) の標準化が2005年2月に完了した。これにより、H．264/AVCを用いて、映画に含まれるフィルムノイズをも良好に表現することが可能な符号化方式となって、Blu-Ray Disc（商標）等の幅広いアプリケーションに用いられる運びとなった。

しかしながら、昨今、ハイビジョン画像の4倍の、4000×2000画素程度の画像を圧縮したい、あるいは、インターネットのような、限られた伝送容量の環境において、ハイビジョン画像を配信したいといった、更なる高圧縮率符号化に対するニーズが高まっている。このため、先述の、ITU-T傘下のVCEG (=Video Coding Expert Group) において、符号化効率の改善に関する検討が継続され行なわれている。

かかる符号化効率改善の１手法として、非特許文献１において、適応ループフィルタ（ALF（Adaptive Loop Filter））という手法が提案されている。

図３は、適応ループフィルタを適用した画像符号化装置の構成例を示すブロック図である。なお、図３の例において、説明の便宜上、図１のA/D変換部１１、画面並べ替えバッファ１２、蓄積バッファ１７、スイッチ２３、イントラ予測部２４、予測画像選択部２６、およびレート制御部２７は省略されている。また、矢印なども適宜省略されている。したがって、図３の例の場合、フレームメモリ２２からの参照画像は、動き予測・補償部２５に直接入力され、動き予測・補償部２５からの予測画像は、演算部１３および２０に直接出力されている。

すなわち、図３の画像符号化装置６１は、デブロックフィルタ２１とフレームメモリ２２の間に適応ループフィルタ７１が追加された点のみが、図１の画像符号化装置１と異なっている。

適応ループフィルタ７１は、画面並べ替えバッファ１２（図示は省略）からの原画像との残差を最小とするよう、適応ループフィルタ係数の算出を行い、この適応ループフィルタ係数を用いて、デブロックフィルタ２１からの復号画像にフィルタ処理を行う。このフィルタとして、例えば、ウィナーフィルタ（Wiener Filter）が用いられる。

また、適応ループフィルタ７１は、算出した適応ループフィルタ係数を、可逆符号化部１６に送る。可逆符号化部１６においては、この適応ループフィルタ係数を、可変長符号化、算術符号化といった可逆符号化処理し、圧縮画像のヘッダ部に挿入する。

図４は、図３の画像符号化装置に対応する画像復号装置の構成例を示すブロック図である。なお、図４の例において、説明の便宜上、図２の蓄積バッファ４１、画面並べ替えバッファ４７、D/A変換部４８、スイッチ５０、イントラ予測部５１、およびスイッチ５３は省略されている。また、矢印なども適宜省略されている。したがって、図４の例の場合、フレームメモリ４９からの参照画像は、動き補償部５２に直接入力され、動き補償部５２からの予測画像は、演算部４５に直接出力されている。

すなわち、図４の画像復号装置８１は、デブロックフィルタ４６とフレームメモリ４９の間に適応ループフィルタ９１が追加された点のみが、図２の画像復号装置３１と異なっている。

適応ループフィルタ９１には、可逆復号部４２から復号され、ヘッダから抽出された適応ループフィルタ係数が供給される。適応ループフィルタ９１は供給されたフィルタ係数を用いて、デブロックフィルタ４６からの復号画像にフィルタ処理を行う。このフィルタとして、例えば、ウィナーフィルタ（Wiener Filter）が用いられる。

これにより、復号画像の画質を向上させ、さらに、参照画像の画質をも向上させることができる。

また、上述したH．264/AVC方式において、マクロブロックサイズは１６×１６画素である。しかしながら、マクロブロックサイズを１６×１６画素とするのは、次世代符号化方式の対象となるようなUHD(Ultra High Definition;4000×2000画素)といった大きな画枠に対しては最適ではない。

そこで、非特許文献２などにおいては、マクロブロックサイズを、例えば、３２×３２画素といった大きさに拡張することも提案されている。

なお、非特許文献２は、インタースライスに対して拡張されたマクロブロックを適用する提案であるが、非特許文献３には、拡張されたマクロブロックを、イントラスライスに適用することが提案されている。

Takeshi. Chujoh, et al., "Block-based Adaptive Loop Filter" ITU-T SG16 Q6 VCEG Contribution, AI18, Germany, July, 2008 "Video Coding Using Extended Block Sizes",VCEG-AD09,ITU-Telecommunications Standardization Sector STUDY GROUP Question 16 - Contribution 123, Jan 2009 "Intra Coding Using Extended Block Sizes",VCEG-AL28, July 2009

ところで、非特許文献１において提案されている方式では、平坦な領域とテクスチャを含む領域を区別せず、ウィナーフィルタにより、画面全体における符号化劣化を最小限に抑えようとしている。したがって、平坦な領域、およびテクスチャを含む領域のそれぞれで引き起こされるローカルな画質劣化を改善することが困難であった。すなわち、平坦な領域においては、ブロック歪みが起こりやすいのに対し、エッジやテクスチャを含む領域においては、モスキート歪みが起こりやすい。

この画質劣化の改善に対する困難な度合いは、特に、Ｉスライスにおいて顕著であった。

本発明は、このような状況に鑑みてなされたものであり、画面全体における画質劣化を最小限にするともに、ローカルな画質劣化を改善することができるものである。

本発明の一側面の画像処理装置は、画像を、所定のブロック毎に、イントラ予測モード情報に応じてクラス分類する分類手段と、前記分類手段によりクラス分類された各所定のブロックに対して、同じクラスにクラス分類された前記所定のブロックを用いて算出されたフィルタ係数を用いてフィルタ処理を行うフィルタ処理手段とを備える。

前記所定のブロックは、マクロブロックであり、前記分類手段は、前記イントラ予測モード情報のうち、前記マクロブロックに対する予測ブロックサイズに応じて、前記マクロブロック毎に画像をクラス分類することができる。

前記分類手段は、前記マクロブロックに対する予測ブロックサイズが、符号化規格で規定されているマクロブロックサイズより大きいか、小さいかに応じて、前記マクロブロック毎に画像をクラス分類することができる。

前記分類手段は、イントラ１６×１６予測モードで符号化されるマクロブロックについては、平坦領域に含まれるマクロブロックとしてクラス分類することができる。

前記分類手段は、前記イントラ１６×１６予測モードよりも小さいブロックサイズのイントラ予測モードで符号化されるマクロブロックについては、エッジもしくはテクスチャが含まれるマクロブロックとしてクラス分類することができる。

前記分類手段は、イントラ１６×１６予測モードよりも大きいブロックサイズのイントラ予測モードで符号化されるマクロブロックについては、平坦領域に含まれるマクロブロックとしてクラス分類することができる。

前記所定のブロックは、マクロブロックまたは前記マクロブロックを構成する各ブロックであり、前記分類手段は、前記イントラに関する予測モード情報のうち、同一予測ブロックサイズにおける前記マクロブロックまたはブロックに対する予測モードの種類に応じて、前記マクロブロックまたはブロック毎に画像をクラス分類することができる。

前記分類手段は、垂直予測モードと水平予測モードで符号化されるマクロブロックまたはブロックについては、エッジもしくはテクスチャが含まれるマクロブロックまたはブロックとしてクラス分類することができる。

前記分類手段は、垂直予測モードと水平予測モード以外の予測モードで符号化されるマクロブロックまたはブロックについては、エッジもしくはテクスチャが含まれるマクロブロックまたはブロックとしてクラス分類することができる。

前記同じクラスにクラス分類された前記所定のブロックを用いて前記フィルタ係数を算出するフィルタ係数算出手段をさらに備えることができる。

前記画像のビットストリームと、前記イントラ予測に関するモードを示す情報と、前記フィルタ係数算出手段により算出されたフィルタ係数とを伝送する伝送手段をさらに備えることができる。

前記画像のビットストリームと、前記イントラ予測に関するモードを示す情報と、前記フィルタ係数とを受け取る受け取り手段をさらに備えることができる。

本発明の一側面の画像処理方法は、分類手段と、フィルタ処理手段とを備える画像処理装置の画像処理方法において、前記分類手段が、画像を、所定のブロック毎に、イントラ予測モード情報に応じてクラス分類し、前記フィルタ処理手段が、クラス分類された各所定のブロックに対して、同じクラスにクラス分類された前記所定のブロックを用いて算出されたフィルタ係数を用いてフィルタ処理を行う。

本発明の一側面においては、画像が、所定のブロック毎に、イントラ予測モード情報に応じてクラス分類され、クラス分類された各所定のブロックに対して、同じクラスにクラス分類された前記所定のブロックを用いて算出されたフィルタ係数を用いてフィルタ処理が行われる。

なお、上述の画像処理装置は、独立した装置であっても良いし、１つの画像符号化装置または画像復号装置を構成している内部ブロックであってもよい。

本発明によれば、画面全体における画質劣化を最小限にするともに、ローカルな画質劣化を改善することができる。

H．264/AVC方式の画像符号化装置の構成例を示すブロック図である。 H．264/AVC方式の画像復号装置の構成例を示すブロック図である。適応ループフィルタを適用した画像符号化装置の構成例を示すブロック図である。適応ループフィルタを適用した画像復号装置の構成例を示すブロック図である。本発明を適用した画像符号化装置の一実施の形態の構成を示すブロック図である。１６×１６画素のイントラ予測モードの場合の処理順序を説明する図である。輝度信号の４×４画素のイントラ予測モードの種類を示す図である。輝度信号の４×４画素のイントラ予測モードの種類を示す図である。４×４画素のイントラ予測の方向を説明する図である。４×４画素のイントラ予測を説明する図である。輝度信号の４×４画素のイントラ予測モードの符号化を説明する図である。輝度信号の８×８画素のイントラ予測モードの種類を示す図である。輝度信号の８×８画素のイントラ予測モードの種類を示す図である。輝度信号の１６×１６画素のイントラ予測モードの種類を示す図である。輝度信号の１６×１６画素のイントラ予測モードの種類を示す図である。１６×１６画素のイントラ予測を説明する図である。色差信号のイントラ予測モードの種類を示す図である。デブロックフィルタの動作原理を説明する図である。 Bsの定義の方法を説明する図である。デブロックフィルタの動作原理を説明する図である。 indexAおよびindexBとαおよびβの値の対応関係の例を示す図である。 BsおよびindexAとtC0との対応関係の例を示す図である。マクロブロックの例を示す図である。図５の適応ループフィルタの構成例を示すブロック図である。図５の画像符号化装置の符号化処理を説明するフローチャートである。図２５のステップＳ１３のイントラ予測処理を説明するフローチャートである。図２５のステップＳ１４の動き予測・補償処理を説明するフローチャートである。図２５のステップＳ２４のクラス分類係数算出処理の例を説明するフローチャートである。本発明を適用した画像復号装置の一実施の形態の構成を示すブロック図である。図２９の適応ループフィルタの構成例を示すブロック図である。図２９の画像復号装置の復号処理を説明するフローチャートである。図３１のステップＳ１３３の予測画像生成処理を説明するフローチャートである。図３１のステップＳ１４０のクラス分類フィルタ処理の例を説明するフローチャートである。コンピュータのハードウエアの構成例を示すブロック図である。本発明を適用したテレビジョン受像機の主な構成例を示すブロック図である。本発明を適用した携帯電話機の主な構成例を示すブロック図である。本発明を適用したハードディスクレコーダの主な構成例を示すブロック図である。本発明を適用したカメラの主な構成例を示すブロック図である。

以下、図を参照して本発明の実施の形態について説明する。

［画像符号化装置の構成例］
図５は、本発明を適用した画像処理装置としての画像符号化装置の一実施の形態の構成を表している。

図５の画像符号化装置１０１は、A/D変換部１１、画面並べ替えバッファ１２、演算部１３、直交変換部１４、量子化部１５、可逆符号化部１６、蓄積バッファ１７、逆量子化部１８、逆直交変換部１９、演算部２０、デブロックフィルタ２１、フレームメモリ２２、スイッチ２３、イントラ予測部２４、動き予測・補償部２５、予測画像選択部２６、およびレート制御部２７を備える点で、図１の画像符号化装置１と共通している。

また、図５の画像符号化装置１０１は、適応ループフィルタ１１１および予測モードバッファ１１２が追加された点で、図１の画像符号化装置１と異なっている。

すなわち、適応ループフィルタ１１１は、デブロックフィルタ２１の後、フレームメモリ２２の前に設けられている。すなわち、適応ループフィルタ１１１は、演算部１３、直交変換部１４、量子化部１５、逆量子化部１８、逆直交変換部１９、演算部２０、デブロックフィルタ２１、フレームメモリ２２、スイッチ２３、イントラ予測部２４または動き予測・補償部２５、および予測画像選択部２６からなる動き補償ループ内に設けられている。すなわち、動き補償ループ内では、画像がループして用いられている。

適応ループフィルタ１１１は、デブロックフィルタ２１からの復号画像がＩピクチャである場合、その画像を、予測モードバッファ１１２からのイントラ予測モード情報に応じたクラスに分類する。適応ループフィルタ１１１は、分類されたクラス毎に、画面並べ替えバッファ１２からの原画像とデブロックフィルタ２１からの画像との残差を最小とするよう、フィルタ係数の算出を行う。適応ループフィルタ１１１は、分類されたクラス毎に、算出されたフィルタ係数を用いて、フィルタ処理を行い、フィルタ処理後の画像を、フレームメモリ２２に出力する。このフィルタとして、例えば、ウィナーフィルタ（Wiener Filter）が用いられる。

なお、デブロックフィルタ２１からの復号画像がＩピクチャではない場合、適応ループフィルタ１１１は、クラス分類を行わず、復号画像全体を用いてフィルタ係数の算出を行い、それを用いて、復号画像全体に対してフィルタ処理を行う。

また、適応ループフィルタ１１１は、算出したフィルタ係数を、可逆符号化部１６に送る。なお、このとき、可逆符号化部１６は、図３の場合のように、適応ループフィルタ１１１により算出されたフィルタ係数も、符号化し、圧縮画像のスライスヘッダ部またはピクチャパラメータセットに挿入する。

予測モードバッファ１１２は、イントラ予測部２４により決定されたイントラ予測モード情報を格納している。

［イントラ予測処理の説明］
次に、上述した各処理の詳細について説明する。図６を参照して、イントラ予測の各モードについて説明する。

まず、輝度信号に対するイントラ予測モードについて説明する。輝度信号のイントラ予測モードには、H．264/AVC方式の符号化規格で規定されている予測ブロックサイズ別に、イントラ４×４予測モード、イントラ８×８予測モード、およびイントラ１６×１６予測モードの３通りの方式が定められている。これは、ブロック単位を定めるモードであり、マクロブロック毎に設定される。また、色差信号に対しては、マクロブロック毎に輝度信号とは独立したイントラ予測モードを設定することが可能である。

そして、予測ブロックサイズ毎に、複数種類の予測方法を表す予測モードがそれぞれ設けられている。すなわち、イントラ４×４予測モードの場合、４×４画素の対象ブロック毎に、９種類の予測モードから１つの予測モードを設定することができる。イントラ８×８予測モードの場合、８×８画素の対象ブロック毎に、９種類の予測モードから１つの予測モードを設定することができる。また、イントラ１６×１６予測モードの場合、１６×１６画素の対象マクロブロックに対して、４種類の予測モードから１つの予測モードを設定することができる。

また、イントラ４×４予測モード、イントラ８×８予測モード、およびイントラ１６×１６予測モードは、それぞれ、４×４画素のイントラ予測モード、８×８画素のイントラ予測モード、および１６×１６画素のイントラ予測モードとも適宜称する。

図６の例において、各ブロックに付されている数字−１乃至２５は、その各ブロックのビットストリーム順（復号側における処理順）を表している。なお、輝度信号については、マクロブロックが４×４画素に分割されて、４×４画素のＤＣＴが行われる。そして、イントラ１６×１６予測モードの場合のみ、−１のブロックに示されるように、各ブロックの直流成分を集めて、４×４行列が生成され、これに対して、さらに、直交変換が施される。

一方、色差信号については、マクロブロックが４×４画素に分割され、４×４画素のＤＣＴが行われた後に、１６および１７の各ブロックに示されるように、各ブロックの直流成分を集めて、２×２行列が生成され、これに対して、さらに、直交変換が施される。

なお、このことは、イントラ８×８予測モードに関しては、ハイプロファイルまたはそれ以上のプロファイルで、対象マクロブロックに、８×８直交変換が施される場合についてのみ適用可能である。

図７および図８は、９種類の輝度信号の４×４画素のイントラ予測モード(Intra_4x4_pred_mode)を示す図である。平均値（ＤＣ）予測を示すモード２以外の８種類の各モードは、それぞれ、図９の番号０，１，３乃至８で示される方向に対応している。

９種類のIntra_4x4_pred_modeについて、図１０を参照して説明する。図１０の例において、画素ａ乃至ｐは、イントラ処理される対象ブロックの画素を表し、画素値Ａ乃至Ｍは、隣接ブロックに属する画素の画素値を表している。すなわち、画素ａ乃至ｐは、画面並べ替えバッファ６２から読み出された処理対象の画像であり、画素値Ａ乃至Ｍは、フレームメモリ７２から読み出され、参照される復号済みの画像の画素値である。

図７および図８に示す各イントラ予測モードの場合、画素ａ乃至ｐの予測画素値は、隣接ブロックに属する画素の画素値Ａ乃至Ｍを用いて、以下のように生成される。なお、画素値が“available”であるとは、画枠の端であったり、あるいは、まだ符号化されていないなどの理由がなく、利用可能であることを表す。これに対して、画素値が“unavailable”であるとは、画枠の端であったり、あるいは、まだ符号化されていないなどの理由により利用可能ではないことを表す。

モード０はVertical Prediction modeであり、画素値Ａ乃至Ｄが “available” の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（１）のように生成される。

画素ａ, ｅ, ｉ, ｍの予測画素値＝Ａ
画素ｂ, ｆ, ｊ, ｎの予測画素値＝Ｂ
画素ｃ, ｇ, ｋ, ｏの予測画素値＝Ｃ
画素ｄ, ｈ, ｌ, ｐの予測画素値＝Ｄ・・・（１）

モード１はHorizontal Prediction modeであり、画素値Ｉ乃至Ｌが “available” の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（２）のように生成される。

画素ａ, ｂ, ｃ, ｄの予測画素値＝Ｉ
画素ｅ, ｆ, ｇ, ｈの予測画素値＝Ｊ
画素ｉ, ｊ, ｋ, ｌの予測画素値＝Ｋ
画素ｍ, ｎ, ｏ, ｐの予測画素値＝Ｌ・・・（２）

モード２はDC Prediction modeであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌが全て “available” である時、予測画素値は式（３）のように生成される。

（Ａ＋Ｂ＋Ｃ＋Ｄ＋Ｉ＋Ｊ＋Ｋ＋Ｌ＋４）＞＞３・・・（３）

また、画素値Ａ,Ｂ,Ｃ,Ｄが全て “unavailable” である時、予測画素値は式（４）のように生成される。

（Ｉ＋Ｊ＋Ｋ＋Ｌ＋２）＞＞２・・・（４）

また、画素値Ｉ,Ｊ,Ｋ,Ｌが全て “unavailable” である時、予測画素値は式（５）のように生成される。

（Ａ＋Ｂ＋Ｃ＋Ｄ＋２）＞＞２・・・（５）

なお、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌが全て“unavailable” である時、１２８を予測画素値として用いる。

モード３はDiagonal_Down_Left Prediction modeであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが“available”の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（６）のように生成される。

画素ａの予測画素値＝（Ａ＋２Ｂ＋Ｃ＋２）＞＞２
画素ｂ，ｅの予測画素値＝（Ｂ＋２Ｃ＋Ｄ＋２）＞＞２
画素ｃ，ｆ，ｉの予測画素値＝（Ｃ＋２Ｄ＋Ｅ＋２）＞＞２
画素ｄ，ｇ，ｊ，ｍの予測画素値＝（Ｄ＋２Ｅ＋Ｆ＋２）＞＞２
画素ｈ，ｋ，ｎの予測画素値＝（Ｅ＋２Ｆ＋Ｇ＋２）＞＞２
画素ｌ，ｏの予測画素値＝（Ｆ＋２Ｇ＋Ｈ＋２）＞＞２
画素ｐの予測画素値＝（Ｇ＋３Ｈ＋２）＞＞２
・・・（６）

モード４はDiagonal_Down_Right Prediction modeであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが “available” の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（７）のように生成される。

画素ｍの予測画素値＝（Ｊ＋２Ｋ＋Ｌ＋２）＞＞２
画素ｉ，ｎの予測画素値＝（Ｉ＋２Ｊ＋Ｋ＋２）＞＞２
画素ｅ，ｊ，ｏの予測画素値＝（Ｍ＋２Ｉ＋Ｊ＋２）＞＞２
画素ａ，ｆ，ｋ，ｐの予測画素値＝（Ａ＋２Ｍ＋Ｉ＋２）＞＞２
画素ｂ，ｇ，ｌの予測画素値＝（Ｍ＋２Ａ＋Ｂ＋２）＞＞２
画素ｃ，ｈの予測画素値＝（Ａ＋２Ｂ＋Ｃ＋２）＞＞２
画素ｄの予測画素値＝（Ｂ＋２Ｃ＋Ｄ＋２）＞＞２
・・・（７）

モード５はDiagonal_Vertical_Right Prediction modeであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが“available”の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（８）のように生成される。

画素ａ，ｊの予測画素値＝（Ｍ＋Ａ＋１）＞＞１
画素ｂ，ｋの予測画素値＝（Ａ＋Ｂ＋１）＞＞１
画素ｃ，ｌの予測画素値＝（Ｂ＋Ｃ＋１）＞＞１
画素ｄの予測画素値＝（Ｃ＋Ｄ＋１）＞＞１
画素ｅ，ｎの予測画素値＝（Ｉ＋２Ｍ＋Ａ＋２）＞＞２
画素ｆ，ｏの予測画素値＝（Ｍ＋２Ａ＋Ｂ＋２）＞＞２
画素ｇ，ｐの予測画素値＝（Ａ＋２Ｂ＋Ｃ＋２）＞＞２
画素ｈの予測画素値＝（Ｂ＋２Ｃ＋Ｄ＋２）＞＞２
画素ｉの予測画素値＝（Ｍ＋２Ｉ＋Ｊ＋２）＞＞２
画素ｍの予測画素値＝（Ｉ＋２Ｊ＋Ｋ＋２）＞＞２
・・・（８）

モード６はHorizontal_Down Prediction modeであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが“available”の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（９）のように生成される。

画素ａ，ｇの予測画素値＝（Ｍ＋Ｉ＋１）＞＞１
画素ｂ，ｈの予測画素値＝（Ｉ＋２Ｍ＋Ａ＋２）＞＞２
画素ｃの予測画素値＝（Ｍ＋２Ａ＋Ｂ＋２）＞＞２
画素ｄの予測画素値＝（Ａ＋２Ｂ＋Ｃ＋２）＞＞２
画素ｅ，ｋの予測画素値＝（Ｉ＋Ｊ＋１）＞＞１
画素ｆ，ｌの予測画素値＝（Ｍ＋２Ｉ＋Ｊ＋２）＞＞２
画素ｉ，ｏの予測画素値＝（Ｊ＋Ｋ＋１）＞＞１
画素ｊ，ｐの予測画素値＝（Ｉ＋２Ｊ＋Ｋ＋２）＞＞２
画素ｍの予測画素値＝（Ｋ＋Ｌ＋１）＞＞１
画素ｎの予測画素値＝（Ｊ＋２Ｋ＋Ｌ＋２）＞＞２
・・・（９）

モード７は、Vertical_Left Prediction modeであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが“available”の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（１０）のように生成される。

画素ａの予測画素値＝（Ａ＋Ｂ＋１）＞＞１
画素ｂ，ｉの予測画素値＝（Ｂ＋Ｃ＋１）＞＞１
画素ｃ，ｊの予測画素値＝（Ｃ＋Ｄ＋１）＞＞１
画素ｄ，ｋの予測画素値＝（Ｄ＋Ｅ＋１）＞＞１
画素ｌの予測画素値＝（Ｅ＋Ｆ＋１）＞＞１
画素ｅの予測画素値＝（Ａ＋２Ｂ＋Ｃ＋２）＞＞２
画素ｆ，ｍの予測画素値＝（Ｂ＋２Ｃ＋Ｄ＋２）＞＞２
画素ｇ，ｎの予測画素値＝（Ｃ＋２Ｄ＋Ｅ＋２）＞＞２
画素ｈ，ｏの予測画素値＝（Ｄ＋２Ｅ＋Ｆ＋２）＞＞２
画素ｐの予測画素値＝（Ｅ＋２Ｆ＋Ｇ＋２）＞＞２
・・・（１０）

モード８は、Horizontal_Up Prediction modeであり、画素値Ａ,Ｂ,Ｃ,Ｄ,Ｉ,Ｊ,Ｋ,Ｌ,Ｍが“available”の場合のみ適用される。この場合、画素ａ乃至ｐの予測画素値は、次の式（１１）のように生成される。

画素ａの予測画素値＝（Ｉ＋Ｊ＋１）＞＞１
画素ｂの予測画素値＝（Ｉ＋２Ｊ＋Ｋ＋２）＞＞２
画素ｃ，ｅの予測画素値＝（Ｊ＋Ｋ＋１）＞＞１
画素ｄ，ｆの予測画素値＝（Ｊ＋２Ｋ＋Ｌ＋２）＞＞２
画素ｇ，ｉの予測画素値＝（Ｋ＋Ｌ＋１）＞＞１
画素ｈ，ｊの予測画素値＝（Ｋ＋３Ｌ＋２）＞＞２
画素ｋ，ｌ，ｍ，ｎ，ｏ，ｐの予測画素値＝Ｌ
・・・（１１）

次に、図１１を参照して、輝度信号の４×４画素のイントラ予測モード(Intra_4x4_pred_mode)の符号化方式について説明する。図１１の例において、４×４画素からなり、符号化対象となる対象ブロックＣが示されており、対象ブロックＣに隣接する４×４画素からなるブロックＡおよびブロックＢが示されている。

この場合、対象ブロックＣにおけるIntra_4x4_pred_modeと、ブロックＡおよびブロックＢにおけるIntra_4x4_pred_modeとは高い相関があると考えられる。この相関性を用いて、次のように符号化処理を行うことにより、より高い符号化効率を実現することができる。

すなわち、図１１の例において、ブロックＡおよびブロックＢにおけるIntra_4x4_pred_modeを、それぞれ、Intra_4x4_pred_modeAおよびIntra_4x4_pred_modeBとして、MostProbableModeを次の式（１２）と定義する。

MostProbableMode=Min(Intra_4x4_pred_modeA, Intra_4x4_pred_modeB)
・・・（１２）

すなわち、ブロックＡおよびブロックＢのうち、より小さなmode_numberを割り当てられている方をMostProbableModeとする。

ビットストリーム中には、対象ブロックＣに対するパラメータとして、prev_intra4x4_pred_mode_flag[luma4x4BlkIdx] および rem_intra4x4_pred_mode[luma4x4BlkIdx] という２つの値が定義されており、次の式（１３）に示される擬似コードに基づく処理により、復号処理が行われ、対象ブロックＣに対するIntra_4x4_pred_mode、Intra4x4PredMode[luma4x4BlkIdx] の値を得ることができる。

if(prev_intra4x4_pred_mode_flag[luma4x4BlkIdx])
Intra4x4PredMode[luma4x4BlkIdx] = MostProbableMode
else
if(rem_intra4x4_pred_mode[luma4x4BlkIdx] < MostProbableMode)
Intra4x4PredMode[luma4x4BlkIdx]=rem_intra4x4_pred_mode[luma4x4BlkIdx]
else
Intra4x4PredMode[luma4x4BlkIdx]=rem_intra4x4_pred_mode[luma4x4BlkIdx] + 1
・・・（１３）

次に、８×８画素のイントラ予測モードについて説明する。図１２および図１３は、９種類の輝度信号の８×８画素のイントラ予測モード(Intra_8x8_pred_mode)を示す図である。

対象の８×８ブロックにおける画素値を、p[x,y](0≦x≦7;0≦y≦7)とし、隣接ブロックの画素値をp[-1,-1],…,p[-1,15],p[-1,0],…,[p-1,7]のように表すものとする。

８×８画素のイントラ予測モードについては、予測値を生成するに先立ち、隣接画素にローパスフィルタリング処理が施される。ここで、ローパスフィルタリング処理前の画素値を、p[-1,-1],…,p[-1,15],p[-1,0],…p[-1,7]、処理後の画素値をp’[-1,-1],…,p’[-1,15],p’[-1,0],…p’[-1,7]と表すとする。

まず、p’[0,-1]は、p[-1,-1] が “available” である場合には、次の式（１４）のように算出され、“not available” である場合には、次の式（１５）のように算出される。

p’[0,-1] = (p[-1,-1] + 2*p[0,-1] + p[1,-1] + 2) >> 2
・・・（１４）
p’[0,-1] = (3*p[0,-1] + p[1,-1] + 2) >> 2
・・・（１５）

p’[x,-1] (x=0,…,7)は、次の式（１６）のように算出される。

p’[x,-1] = (p[x-1,-1] + 2*p[x,-1] + p[x+1,-1] + 2) >>2
・・・（１６）

p’[x,-1] (x=8,…,15)は、p[x,-1] (x=8,…,15) が “available” である場合には、次の式（１７）のように算出される。

p’[x,-1] = (p[x-1,-1] + 2*p[x,-1] + p[x+1,-1] + 2) >>2
p’[15,-1] = (p[14,-1] + 3*p[15,-1] + 2) >>2
・・・（１７）

p’[-1,-1]は、p[-1,-1]が “available” である場合には、以下のように算出される。すなわち、p’[-1,-1]は、p[0,-1]及びp[-1,0]の双方がavailableである場合には、式（１８）のように算出され、p[-1,0] が “unavailable” である場合には、式（１９）のように算出される。また、p’[-1,-1]は、p[0,-1] が “unavailable” である場合には、式（２０）のように算出される。

p’[-1,-1] = (p[0,-1] + 2*p[-1,-1] + p[-1,0] + 2) >>2
・・・（１８）

p’[-1,-1] = (3*p[-1,-1] + p[0,-1] + 2) >>2
・・・（１９）

p’[-1,-1] = (3*p[-1,-1] + p[-1,0] + 2) >>2
・・・（２０）

p’[-1,y] (y=0, … ,7) は、p[-1,y] (y=0, … ,7) が “available” の時、以下のように算出される。すなわち、まず、p’[-1,0]は、p[-1,-1]が “available” である場合には、次の式（２１）のように算出され、“unavailable” である場合には、式（２２）のように算出される。

p’[-1,0] = (p[-1,-1] + 2*p[-1,0] + p[-1,1] + 2) >>2
・・・（２１）

p’[-1,0] = (3*p[-1,0] + p[-1,1] + 2) >>2
・・・（２２）

また、p’[-1,y] (y=1,…,6)は、次の式（２３）のように算出され、p’[-1,7]は、式（２４）のように算出される。

p[-1,y] = (p[-1,y-1] + 2*p[-1,y] + p[-1,y+1] + 2) >>2
・・・（２３）

p’[-1,7] = (p[-1,6] + 3*p[-1,7] + 2) >>2
・・・（２４）

このように算出されたp’を用いて、図８および図９に示される各イントラ予測モードにおける予測値は以下のように生成される。

モード０はVertical Prediction modeであり、p[x,-1] (x=0, … ,7) が “available” である時のみ適用される。予測値pred8x8_L[x,y]は、次の式（２５）のように生成される。

pred8x8_L[x,y] = p’[x,-1] x,y=0,...,7
・・・（２５）

モード１はHorizontal Prediction modeであり、p[-1,y] (y=0, … ,7) が “available” である時のみ適用される。予測値pred8x8_L[x,y]は、次の式（２６）のように生成される。

pred8x8_L[x,y] = p’[-1,y] x,y=0,...,7
・・・（２６）

モード２はDC Prediction modeであり、予測値pred8x8_L[x,y]は以下の通り生成される。すなわち、p[x,-1] (x=0, … ,7) および p[-1,y] (y=0, … ,7) の両方が “available” である場合には、予測値pred8x8_L[x,y]は、次の式（２７）のように生成される。

p[x,-1] (x=0, … ,7) は “available” であるが、 p[-1,y] (y=0, … ,7) が “unavailable” である場合には、予測値pred8x8_L[x,y]は、次の式（２８）のように生成される。

p[x,-1] (x=0, … ,7) は “unavailable” であるが、 p[-1,y] (y=0, … ,7) が “available” である場合には、予測値pred8x8_L[x,y]は、次の式（２９）のように生成される。

p[x,-1] (x=0, … ,7) および p[-1,y] (y=0, … ,7) の両方が “unavailable” である場合には、予測値pred8x8_L[x,y]は、次の式（３０）のように生成される。

pred8x8_L[x,y] = 128
・・・（３０）

ただし、式（３０）は、8ビット入力の場合を表している。

モード３はDiagonal_Down_Left_prediction modeであり、予測値pred8x8_L[x,y]は以下の通り生成される。すなわち、Diagonal_Down_Left_prediction modeは、p[x,-1], x=0,…,15が “available” の時のみ適用され、x=7かつy=7である予測画素値は、次の式（３１）のように生成され、その他の予測画素値は、次の式（３２）のように生成される。

pred8x8_L[x,y] = (p’[14,-1] + 3*p[15,-1] + 2) >> 2
・・・（３１）

red8x8_L[x,y] = (p’[x+y,-1] + 2*p’[x+y+1,-1] + p’[x+y+2,-1] + 2) >> 2
・・・（３２）

モード４はDiagonal_Down_Right_prediction modeであり、予測値pred8x8_L[x,y]は以下の通り生成される。すなわち、Diagonal_Down_Right_prediction modeは、p[x,-1],x=0,…,7及びp[-1,y],y=0,…,7が “available”の時のみ適用され、x > y である予測画素値は、次の式（３３）のように生成され、x < y である予測画素値は、次の式（３４）のように生成される。また、x = y である予測画素値は、次の式（３５）のように生成される。

pred8x8_L[x,y] = (p’[x-y-2,-1] + 2*p’[x-y-1,-1] + p’[x-y,-1] + 2) >> 2
・・・（３３）

pred8x8_L[x,y] = (p’[-1,y-x-2] + 2*p’[-1,y-x-1] + p’[-1,y-x] + 2) >> 2
・・・（３４）

pred8x8_L[x,y] = (p’[0,-1] + 2*p’[-1,-1] + p’[-1,0] + 2) >> 2
・・・（３５）

モード５はVertical_Right_prediction modeであり、予測値pred8x8_L[x,y]は以下の通り生成される。すなわち、Vertical_Right_prediction modeは、p[x,-1],x=0,…,7及びp[-1,y],y=-1,…,7が “available”の時のみ適用される。今、zVRを、次の式（３６）のように定義する。

zVR = 2*x - y
・・・（３６）

この時、zVRが、0,2,4,6,8,10,12,14の場合には、画素予測値は、次の式（３７）のように生成され、zVRが1,3,5,7,9,11,13の場合には、画素予測値は、次の式（３８）のように生成される。

pred8x8_L[x,y] = (p’[x-(y>>1)-1,-1] + p’[x-(y>>1),-1] + 1) >> 1
・・・（３７）
pred8x8_L[x,y]
= (p’[x-(y>>1)-2,-1] + 2*p’[x-(y>>1)-1,-1] + p’[x-(y>>1),-1] + 2) >> 2
・・・（３８）

また、zVRが-1の場合には、画素予測値は、次の式（３９）のように生成され、これ以外の場合、すなわち、zVRが-2,-3,-4,-5,-6,-7の場合には、画素予測値は、次の式（４０）のように生成される。

pred8x8_L[x,y] = (p’[-1,0] + 2*p’[-1,-1] + p’[0,-1] + 2) >> 2
・・・（３９）

pred8x8_L[x,y] = (p’[-1,y-2*x-1] + 2*p’[-1,y-2*x-2] + p’[-1,y-2*x-3] + 2) >> 2
・・・（４０）

モード６はHorizontal_Down_prediction modeであり、予測値pred8x8_L[x,y]は以下の通り生成される。すなわち、Horizontal_Down_prediction modeは、p[x,-1],x=0,…,7及びp[-1,y],y=-1,…,7が “available”の時のみ適用される。今、zVRを次の式（４１）のように定義するものとする。

zHD = 2*y - x
・・・（４１）

この時、zHDが0,2,4,6,8,10,12,14の場合には、予測画素値は、次の式（４２）のように生成され、zHDが1,3,5,7,9,11,13の場合には、予測画素値は、次の式（４３）のように生成される。

pred8x8_L[x,y] = (p’[-1,y-(x>>1)-1] + p’[-1,y-(x>>1) + 1] >> 1
・・・（４２）

pred8x8_L[x,y]
= (p’[-1,y-(x>>1)-2] + 2*p’[-1,y-(x>>1)-1] + p’[-1,y-(x>>1)] + 2) >> 2
・・・（４３）

また、zHDが-1の場合には、予測画素値は、次の式（４４）のように生成され、zHDがこれ以外の値の場合、すなわち、-2,-3,-4,-5,-6,-7の場合には、予測画素値は、次の式（４５）のように生成される。

pred8x8_L[x,y] = (p’[-1,0] + 2*p[-1,-1] + p’[0,-1] + 2) >> 2
・・・（４４）

pred8x8_L[x,y] = (p’[x-2*y-1,-1] + 2*p’[x-2*y-2,-1] + p’[x-2*y-3,-1] + 2) >> 2
・・・（４５）

モード７はVertical_Left_prediction modeであり、予測値pred8x8_L[x,y]は以下の通り生成される。すなわち、Vertical_Left_prediction modeは、p[x,-1], x=0,…,15が “available” の時のみ適用され、y=0,2,4,6の場合、予測画素値は、次の式（４６）のように生成され、それ以外の場合、すなわち、y=1,3,5,7の場合、予測画素値は、次の式（４７）のように生成される。

pred8x8_L[x,y] = (p’[x+(y>>1),-1] + p’[x+(y>>1)+1,-1] + 1) >> 1
・・・（４６）

pred8x8_L[x,y]
= (p’[x+(y>>1),-1] + 2*p’[x+(y>>1)+1,-1] + p’[x+(y>>1)+2,-1] + 2) >> 2
・・・（４７）

モード８はHorizontal_Up_prediction modeであり、予測値pred8x8_L[x,y]は以下の通り生成される。すなわち、Horizontal_Up_prediction modeは、p[-1,y], y=0,…,7 が “available” の時のみ適用される。以下では、zHUを次の式（４８）のように定義する。

zHU = x + 2*y
・・・（４８）

zHUの値が0,2,4,6,8,10,12の場合、予測画素値は、次の式（４９）のように生成され、zHUの値が1,3,5,7,9,11の場合、予測画素値は、次の式（５０）のように生成される。

pred8x8_L[x,y] = (p’[-1,y+(x>>1)] + p’[-1,y+(x>>1)+1] + 1) >> 1
・・・（４９）

pred8x8_L[x,y] = (p’[-1,y+(x>>1)]
・・・（５０）

また、zHUの値が13の場合、予測画素値は、次の式（５１）のように生成され、それ以外の場合、すなわち、zHUの値が13より大きい場合、予測画素値は、次の式（５２）のように生成される。

pred8x8_L[x,y] = (p’[-1,6] + 3*p’[-1,7] + 2) >> 2
・・・（５１）

pred8x8_L[x,y] = p’[-1,7]
・・・（５２）

次に、１６×１６画素のイントラ予測モードについて説明する。図１４および図１５は、４種類の輝度信号の１６×１６画素のイントラ予測モード(Intra_16x16_pred_mode)を示す図である。

４種類のイントラ予測モードについて、図１６を参照して説明する。図１６の例において、イントラ処理される対象マクロブロックＡが示されており、P(x,y);x,y=-1,0,…,15は、対象マクロブロックＡに隣接する画素の画素値を表している。

モード０は、Vertical Prediction modeであり、P(x,-1); x,y=-1,0,…,15が “available” である時のみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（５３）のように生成される。

Pred(x,y) = P(x,-1);x,y=0,…,15
・・・（５３）

モード１はHorizontal Prediction modeであり、P(-1,y); x,y=-1,0,…,15が “available” である時のみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（５４）のように生成される。

Pred(x,y) = P(-1,y);x,y=0,…,15
・・・（５４）

モード２はDC Prediction modeであり、P(x,-1)およびP(-1,y); x,y=-1,0,…,15が全て “available” である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（５５）のように生成される。

また、P(x,-1); x,y=-1,0,…,15が “unavailable” である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（５６）のように生成される。

P(-1,y); x,y=-1,0,…,15が “unavailable” である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（５７）のように生成される。

P(x,-1)およびP(-1,y); x,y=-1,0,…,15が全て “unavailable” である場合には、予測画素値として１２８を用いる。

モード３はPlane Prediction modeであり、P(x,-1)及びP(-1,y); x,y=-1,0,…,15が全て “available” の場合のみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（５８）のように生成される。

次に、色差信号に対するイントラ予測モードについて説明する。図１７は、４種類の色差信号のイントラ予測モード(Intra_chroma_pred_mode)を示す図である。色差信号のイントラ予測モードは、輝度信号のイントラ予測モードと独立に設定が可能である。色差信号に対するイントラ予測モードは、上述した輝度信号の１６×１６画素のイントラ予測モードに順ずる。

ただし、輝度信号の１６×１６画素のイントラ予測モードが、１６×１６画素のブロックを対象としているのに対し、色差信号に対するイントラ予測モードは、８×８画素のブロックを対象としている。さらに、上述した図１４と図１７に示されるように、両者においてモード番号は対応していない。

ここで、図１６を参照して上述した輝度信号の１６×１６画素のイントラ予測モードの対象マクロブロックＡの画素値および隣接する画素値の定義に準じる。例えば、イントラ処理される対象マクロブロックＡ（色差信号の場合は、８×８画素）に隣接する画素の画素値をP(x,y);x,y=-1,0,…,7とする。

モード０はDC Prediction modeであり、P(x,-1)およびP(-1,y); x,y=-1,0,…,7が全て “available” である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（５９）のように生成される。

また、P(-1,y) ; x,y=-1,0,…,7が “unavailable” である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（６０）のように生成される。

また、P(x,-1) ; x,y=-1,0,…,7が “unavailable”である場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（６１）のように生成される。

モード１はHorizontal Prediction modeであり、P(-1,y) ; x,y=-1,0,…,7が “available” の場合にのみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（６２）のように生成される。

Pred(x,y) = P(-1,y);x,y=0,…,7
・・・（６２）

モード２はVertical Prediction modeであり、P(x,-1) ; x,y=-1,0,…,7が “available” の場合にのみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（６３）のように生成される。

Pred(x,y) = P(x,-1);x,y=0,…,7
・・・（６３）

モード３はPlane Prediction modeであり、P(x,-1)及びP(-1,y) ; x,y=-1,0,…,7 が “available” の場合にのみ適用される。この場合、対象マクロブロックＡの各画素の予測画素値Pred(x,y)は、次の式（６４）のように生成される。

［デブロックフィルタ］
次にデブロックフィルタについて説明する。デブロックフィルタ２１は、動き補償ループ内に含まれ、復号画像におけるブロック歪を除去する。これにより、動き補償処理により参照される画像へのブロック歪の伝播が抑制される。

デブロックフィルタの処理としては、符号化データに含まれる、Picture Parameter Set RBSP（Raw Byte Sequence Payload）に含まれるdeblocking_filter_control_present_flag、及び、スライスヘッダ（Slice Header）に含まれるdisable_deblocking_filter_idcという２つのパラメータによって、以下の（ａ）乃至（ｃ）の３通りの方法が選択可能である。

（ａ）ブロック境界、及びマクロブロック境界に施す
（ｂ）マクロブロック境界にのみ施す
（ｃ）施さない

量子化パラメータQPについては、以下の処理を輝度信号に対して適用する場合は、QPYを、色差信号に対して適用する場合はQPCを用いる。また、動きベクトル符号化、イントラ予測、エントロピー符号化（CAVLC/CABAC）においては、異なるスライスに属する画素値は"not available"として処理するが、デブロックフィルタ処理においては、異なるスライスに属する画素値でも、同一のピクチャに属する場合は"available"であるとして処理を行う。

以下においては、図１８に示されるように、デブロックフィルタ処理前の画素値をp0〜p3、q0〜q3とし、処理後の画素値をp0'〜p3'、q0'〜q3'とする。

まず、デブロックフィルタ処理に先立ち、図１８におけるp及びqに対して、図１９に示される表のように、Bs（Boundary Strength）が定義される。

図１８における(p2,p1,p0,q0,q1,q2)は、以下の式（６５）および式（６６）により示される条件が成立する場合のみ、デブロックフィルタ処理が施される。

Bs > 0 ・・・（６５）
|p0-q0| < α; |p1-p0| < β; |q1-q0| < β ・・・（６６）

式（６６）のαおよびβは、デフォルトでは以下のようにQPに応じてその値が定められているが、符号化データの、スライスヘッダに含まれる、slice_alpha_c0_offset_div2及びslice_beta_offset_div2という２つのパラメータによって、図２０に示されるグラフの矢印のように、ユーザがその強度を調整することが可能である。

図２１に示される表のように、αはindexAから求められる。同様に、βはindexBから求められる。このindexAおよびindexBは、以下の式（６７）乃至式（６９）のように定義される。

qP_aν＝（qP_p＋qP_q＋１）＞＞１・・・（６７）
indexA＝Clip3（0,51,qP_aν＋FilterOffsetA）・・・（６８）
indexB＝Clip3（0,51,qP_aν＋FilterOffsetB）・・・（６９）

式（６８）および式（６９）において、FilterOffsetA及びFilterOffsetBが、ユーザによる調整分に相当する。

デブロックフィルタ処理は、以下に説明するように、Bs<4の場合と、Bs=4の場合とで、互いに異なる方法が定義されている。Bs<4の場合、デブロックフィルタ処理後の画素値p'0及びq'0が、以下の式（７０）乃至式（７２）のように求められる。

Δ＝Clip3（−t_c,t_c（（（（q0−p0）＜＜２）＋（p1−q1）＋４）＞＞３））
・・・（７０）
p'0＝Clip1（p0＋Δ）・・・（７１）
q'0＝Clip1（q0＋Δ）・・・（７２）

ここで、t_cは、以下の式（７３）または式（７４）ように算出される。すなわち、chromaEdgeFlagの値が「０」である場合、t_cは以下の式（７３）のように算出される。

t_c＝t_c0＋（（a_p＜β）?1:0）＋（（a_ｑ＜β）?1:0）・・・（７３）

また、chromaEdgeFlagの値が「０」以外である場合、t_cは以下の式（７４）のように算出される。

t_c＝t_c0＋１・・・（７４）

t_C0の値は、BsとindexAの値に応じて、図２２Ａおよび図２２Ｂに示される表のように定義される。

また、式（７３）のa_p及びa_qの値は、以下の式（７５）および（７６）のように算出される。
a_p＝|p2−p0| ・・・（７５）
a_q＝|q2−q0| ・・・（７６）

デブロックフィルタ処理後の画素値p'1は以下のように求められる。すなわち、chromaEdgeFlagの値が「０」で、尚且つ、a_pの値がβ以下である場合、p'1は、以下の式（７７）のように求められる。

p'1＝p1＋Clip3（−t_c0,t_c0,（p2＋（（p0＋q0＋１）＞＞１）−（p1＜＜１））＞＞１）
・・・（７７）

また、式（７７）が成り立たない場合、p'1は、以下の式（７８）のように求められる。

p'1＝p1 ・・・（７８）

デブロックフィルタ処理後の画素値q'1は以下のように求められる。すなわち、chromaEdgeFlagの値が「０」で、尚且つ、a_qの値がβ以下である場合、q'1は、以下の式（７９）のように求められる。

q'1＝q1＋Clip3（−t_c0,t_c0,（q2＋（（p0＋q0＋１）＞＞１）−（q1＜＜１））＞＞１）
・・・（７９）

また、式（７９）が成り立たない場合、q'1は、以下の式（８０）のように求められる。

q'1＝q1 ・・・（８０）

p'2及びq'2の値は、Filtering前の値p2及びq2と変わらない。すなわち、p'2は、以下の式（８１）のように求められ、q'2は、以下の式（８２）のように求められる。

p'2＝p2 ・・・（８１）
q'2＝q2 ・・・（８２）

Bs=4の場合、デブロックフィルタ後の画素値p'i（i＝0..2）は、以下のように求められる。chromaEdgeFlag の値が「０」であり、以下の式（８３）に示される条件が成り立つ場合、p'0、p'1、及びp'2は、以下の式（８４）乃至式（８６）のように求められる。

ap＜β&&|p0−q0|＜（（α＞＞２）＋２）・・・（８３）
p'0＝（p2＋２×p1＋２×p0＋２×q0＋q1＋４）＞＞３・・・（８４）
p'1＝（p2＋p1＋p0＋q0＋２）＞＞２・・・（８５）
p'2＝（２×p3＋３×p2＋p1＋p0＋q0＋４）＞＞３・・・（８６）

また、式（８３）に示される条件が成り立たない場合、p'0、p'1、及びp'2は、以下の式（８７）乃至（８９）のように求められる。

p'0＝（２×p1＋p0＋q1＋２）＞＞２・・・（８７）
p'1＝p1 ・・・（８８）
p'2＝p2 ・・・（８９）

デブロックフィルタ処理後の画素値q'i（I＝0..2）は、以下のように求められる。すなわち、chromaEdgeFlagの値が「０」であり、以下の式（９０）に示される条件が成り立つ場合、q'0、q'1、及びq'2は、以下の式（９１）乃至（９３）のように求められる。

aq＜β&&|p0−q0|＜（（α＞＞２）＋２）・・・（９０）
q'0＝（p1＋２×p0＋２×q0＋２×q1＋q2＋４）＞＞３・・・（９１）
q'1＝（p0＋q0＋q1＋q2＋２）＞＞２・・・（９２）
q'2＝（２×q3＋３×q2＋q1＋q0＋p4＋４）＞＞３・・・（９３）

また、式（９０）に示される条件が成り立たない場合、q'0、q'1、及びq'2は、以下の式（９４）乃至（９６）のように求められる。

q'0＝（２×q1＋q0＋p1＋２）＞＞２・・・（９４）
q'1＝q1 ・・・（９５）
q'2＝q2 ・・・（９６）

［拡張マクロブロックの例］
また、H．264/AVC方式において、マクロブロックサイズは１６×１６画素である。しかしながら、マクロブロックサイズを１６画素×１６画素とするのは、次世代符号化方式の対象となるような、UHD（Ultra High Definition；４０００画素×２０００画素）といった大きな画枠に対しては、最適ではない。画像符号化装置１０１においては、図２３に示されるように、マクロブロックサイズを、例えば、３２画素×３２画素、６４×６４画素といった大きさにすることが採用される場合がある。

図２３は、非特許文献２で提案されているブロックサイズの例を示す図である。非特許文献２では、マクロブロックサイズが３２×３２画素に拡張されている。

図２３の上段には、左から、３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロック（パーティション）に分割された３２×３２画素で構成されるマクロブロックが順に示されている。図２３の中段には、左から、１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックに分割された１６×１６画素で構成されるブロックが順に示されている。また、図２３の下段には、左から、８×８画素、８×４画素、４×８画素、および４×４画素のブロックに分割された８×８画素のブロックが順に示されている。

すなわち、３２×３２画素のマクロブロックは、図２３の上段に示される３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロックでの処理が可能である。

上段の右側に示される１６×１６画素のブロックは、H．264/AVC方式と同様に、中段に示される１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックでの処理が可能である。

中段の右側に示される８×８画素のブロックは、H．264/AVC方式と同様に、下段に示される８×８画素、８×４画素、４×８画素、および４×４画素のブロックでの処理が可能である。

これらのブロックは、以下の３階層に分類することができる。すなわち、図２３の上段に示される３２×３２画素、３２×１６画素、および１６×３２画素のブロックを第１階層と呼ぶ。上段の右側に示される１６×１６画素のブロック、並びに、中段に示される１６×１６画素、１６×８画素、および８×１６画素のブロックを、第２階層と呼ぶ。中段の右側に示される８×８画素のブロック、並びに、下段に示される８×８画素、８×４画素、４×８画素、および４×４画素のブロックを、第３階層と呼ぶ。

図２３のような、階層構造を採用することにより、１６×１６画素ブロック以下に関しては、現在のH．264/AVC方式におけるマクロブロックと互換性を保ちながら、そのスーパーセットとして、より大きなブロックが定義されている。

［予測モードの選択］
さらに、より高い符号化効率を達成するには、適切な予測モードの選択が重要である。画像符号化装置１０１においては、例えば、High Complexity Modeと、Low Complexity Modeの２通りのモード判定方法を選択する方法が考えられる。この方法の場合、どちらも、それぞれの予測モードModeに関するコスト関数値を算出し、これを最小にする予測モードを当該ブロック乃至マクロブロックに対する最適モードとして選択する。

High Complexity Modeにおけるコスト関数値は、以下の式（９７）のように求めることができる。

Cost（Mode∈Ω）＝Ｄ＋λ×Ｒ・・・（９７）

式（９７）において、Ωは、当該ブロック乃至マクロブロックを符号化するための候補モードの全体集合である。また、Ｄは、当該予測モードModeで符号化した場合の、復号画像と入力画像の差分エネルギーである。さらに、λは、量子化パラメータの関数として与えられるLagrange未定乗数である。また、Ｒは、直交変換係数を含んだ、当該モードModeで符号化した場合の総符号量である。

つまり、High Complexity Modeでの符号化を行なうには、上記パラメータＤ及びＲを算出するため、全ての候補モードModeにより、一度、仮エンコード処理を行う必要があり、より高い演算量を要する。

これに対してLow Complexity Modeにおけるコスト関数値は、以下の式（９８）のように求めることができる。

Cost（Mode∈Ω）＝Ｄ＋QP2Quant（QP）×HeaderBit ・・・（９８）

となる。式（９８）において、Ｄは、High Complexity Modeの場合と異なり、予測画像と入力画像の差分エネルギーとなる。また、QP2Quant（QP）は、量子化パラメータQPの関数として与えられる。さらに、HeaderBitは、直交変換係数を含まない、動きベクトルや、モードといった、Headerに属する情報に関する符号量である。

すなわち、Low Complexity Modeにおいては、それぞれの候補モードModeに関して、予測処理を行う必要があるが、復号画像までは必要ないため、符号化処理まで行う必要はない。このため、High Complexity Modeより低い演算量での実現が可能である。

High Profileにおいては、例えば、４×４直交変換と、８×８直交変換との選択も、上述のHigh Complexity Mode若しくはLow Complexity Modeのいずれかに基づき行なわれる。

［詳細な構成例］
以上の画像符号化装置１０１においては、画像符号化処理に、適応ループフィルタ処理を適用する。画像符号化装置１０１は、動き予測・補償ループ内に適応ループフィルタ１１１を有し、Ｉピクチャの画像を、イントラ予測モード情報に応じてクラス分類し、クラス分類されたそれぞれのクラスに対して、最適フィルタ係数の算出およびフィルタ処理を行う。

ここで、イントラ予測モード情報には、実際には、図６乃至図１７を参照して上述したように、マクロブロック毎に設定される予測ブロックサイズの情報と、動き予測ブロック毎に設定される同一予測ブロックサイズにおける複数種類の予測方法を表す予測モードの情報がある。

画像復号装置１０１においては、Ｉピクチャの画像については、イントラ予測モード情報のうち、マクロブロック毎の予測ブロックサイズの情報（すなわち、イントラ４×４、８×８、１６×１６のうちのどのモード）に応じてクラス分類が行われる。

以下に、適応ループフィルタ１１１の構成の詳細について説明する。適応ループフィルタ１１１においては、非特許文献１において提案されている方法に準じて、動き補償ループ内で適応フィルタ処理を行う。ただし、Ｉピクチャに対して、以下の処理を行う点が、非特許文献１と異なる。

すなわち、非特許文献１においては、画面全体を１つのクラスとして、ウィナーフィルタにより劣化を最小限にする処理が行われる。

これに対して、適応ループフィルタ１１１においては、Ｉピクチャに関しては、当該マクロブロックが、イントラ４×４、８×８、１６×１６のうちのどのモードで符号化されたかに関する情報に基づいて、平坦領域であるマクロブロックと、エッジまたはテクスチャ領域であるマクロブロックにクラス分類が行われる。そして、それぞれのクラスに対して、ウィナーフィルタにより劣化を最小限にする処理が行われる。

つまり、イントラ１６×１６モードは、画面内のフラットな領域（平坦領域）に対して用いられる傾向にあり、一方、エッジやテクスチャなどを含む領域については、イントラ４×４モードまたはイントラ８×８モードが用いられる傾向にある。

画面内のフラットな領域に対しては、ブロック歪みが生じやすく、エッジやテクスチャを含む領域に対しては、モスキート歪みが生じやすい。しかしながら、非特許文献１に提案された方法では、このような画面内の局所的な（ローカルな）歪みを低減することが困難であった。

そこで、適応ループフィルタ１１１においては、Ｉピクチャについて、各マクロブロックがどの予測ブロックサイズのモードによって符号化されたかに応じてクラス分類が行われ、それぞれのクラスに対してフィルタ係数の算出、適応フィルタ処理が行われる。

すなわち、画面内を平坦領域と、エッジ、テクスチャ領域とのクラスに分け、それぞれに対して、適応フィルタ処理が行われる。

これにより、符号化効率を向上させるただけでなく、画面内のローカルな歪みを低減することが可能になる。なお、平坦領域のブロック歪みとエッジ、テクスチャ領域のモスキート歪みが低減されるので、結果的に、画面全体の歪みが低減され、デブロックフィルタ２１の処理を不要にすることも可能である。

また、画像の質を決めるＩピクチャの画質が向上されるので、結果として、ＧＯＰ全体の画質を向上させることができる。

さらに、適応ループフィルタ１１１においては、イントラ予測モード情報という符号化パラメータ情報を用いるため、クラス分類のためのフラグ情報（すなわち、どのクラスであるかということを識別するための情報）を復号側に送る必要がない。したがって、フラグ情報のオーバーヘッドにより符号化効率を低下させることがない。

以下においては、例えば、イントラ１６×１６により符号化されたマクロブロックが、平坦領域のクラスである第１のクラスに分類され、それ以外のイントラ予測モードにより符号化されたマクロブロックが、エッジ、テクスチャを含む領域のクラスである第２のクラスに分類される例を説明する。すなわち、H．264/AVC方式の符号化規格で規定されている通常マクロブロックのサイズである（最大の予測ブロックサイズ）である１６×１６よりも大きいか、小さいかに応じて、画像がクラス分類される。

なお、本発明の適用範囲は、これに限らず、例えば、イントラ４×４と、イントラ８×８と、イントラ１６×１６の３つのクラスに分類することも可能である。

また、イントラ予測モード情報のうちの上述した予測ブロックサイズ（イントラ予測モード情報）に限らず、動き予測ブロック毎の符号化パラメータである各予測ブロックサイズにおける、DC予測、Vertical予測、…などといった予測モードの種類によりクラス分類を行うことも可能である。

すなわち、例えば、Vertical(垂直)予測およびHorizontal（水平）予測は、０次オーダーホールドによる予測モードであり、モスキートノイズが生じやすいといえる。このため、エッジ・テクスチャ領域のクラスとして、Vertical予測およびHorizontal予測に符号化されたブロックもしくはマクロブロックを分類し、平坦領域のクラスとして、その他の予測モードで符号化されたブロックもしくはマクロブロックを分類し、適応フィルタ処理を行うようにしてもよい。

さらにまた、図２３を参照して上述した、拡張されたマクロブロックサイズを用いたイントラピクチャに対しても、本発明を適用することが可能である。この場合、例えば、H．264/AVC方式の符号化規格で規定されている通常マクロブロックのサイズである（最大の予測ブロックサイズ）である１６×１６よりも大きいか、小さいかに応じて、画像がクラス分類される。すなわち、符号化規格で規格されている通常マクロブロックサイズよりも大きい、あるいは、符号化規格で規格されている通常マクロブロックサイズ以上のサイズの場合（３２×３２など）、画面内のフラットな領域（平坦領域）に対して用いられる傾向にあるため、平坦領域のクラスに分類することができる。

［適応ループフィルタの構成例］
図２４は、入力されるピクチャがＩピクチャである場合の適応ループフィルタ１１１の構成例を示すブロック図である。なお、Ｉピクチャ以外のピクチャの場合の適応ループフィルタ１１１の構成例の図示は、説明の便宜上省略する。

図２４の例において、適応ループフィルタ１１１は、クラス分類部１３１、フィルタ係数算出部１３２−１および１３２−２、並びにフィルタ処理部１３３−１および１３３−２により構成されている。

デブロックフィルタ２１からのデブロックフィルタ処理後の画素値がクラス分類部１３１に供給される。また、それぞれのマクロブロックが、イントラ４×４、８×８、１６×１６のいずれの予測モードで符号化されたかに関する情報が含まれるイントラ予測モード情報が、予測モードバッファ１１２からクラス分類部１３１に供給される。

クラス分類部１３１は、そのイントラ予測モード情報に応じて、デブロックフィルタ処理後の各マクロブロックの画素値を、第１のクラスに属するものと、第２のクラスに属するものに分類し、それぞれをフィルタ係数算出部１３２−１および１３２−２に供給する。なお、図２４の例においては、上述したように、イントラ１６×１６により符号化されたマクロブロックが、平坦領域のクラスである第１のクラスに分類され、それ以外のイントラ予測モードにより符号化されたマクロブロックが、エッジ、テクスチャを含む領域のクラスである第２のクラスに分類される。

画面並べ替えバッファ１２から、入力画像画素値が、フィルタ係数算出部１３２−１および１３２−２に供給される。フィルタ係数算出部１３２−１および１３２−２は、第１のクラスおよび第２のクラスに対する適応フィルタ係数を算出する。

フィルタ係数算出部１３２−１により算出された第１のクラスに対する適応フィルタ係数は、第１のクラスのデブロックフィルタ処理後の画素値とともに、フィルタ処理部１３３−１に供給される。フィルタ係数算出部１３２−２により算出された第２のクラスに対する適応フィルタ係数は、第２のクラスのデブロックフィルタ処理後の画素値とともに、フィルタ処理部１３３−２に供給される。また、算出された各クラスに対する適応フィルタ係数は、可逆符号化部１６にも供給される。

フィルタ処理部１３３−１は、第１のクラスのデブロックフィルタ処理後の画素値に対して、第１のクラスに対する適応フィルタ係数を用いてフィルタ処理を行う。フィルタ処理部１３３−２は、第２のクラスのデブロックフィルタ処理後の画素値に対して、第２のクラスに対する適応フィルタ係数を用いてフィルタ処理を行う。適応フィルタ処理後の画素値は、それぞれ、フレームメモリ２２に出力される。

［画像符号化装置の符号化処理の説明］
次に、図２５のフローチャートを参照して、図５の画像符号化装置１０１の符号化処理について説明する。

ステップＳ１１において、A/D変換部１１は入力された画像をＡ／Ｄ変換する。ステップＳ１２において、画面並べ替えバッファ１２は、A/D変換部１１より供給された画像を記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。

画面並べ替えバッファ１２から供給される処理対象の画像がイントラ処理されるブロックの画像である場合、参照される復号済みの画像がフレームメモリ２２から読み出され、スイッチ２３を介してイントラ予測部２４に供給される。

これらの画像に基づいて、ステップＳ１３において、イントラ予測部２４は処理対象のブロックの画素を、候補となる全てのイントラ予測モードでイントラ予測する。なお、参照される復号済みの画素としては、デブロックフィルタ２１と適応ループフィルタ１１１によりフィルタリングされていない画素が用いられる。

ステップＳ１３におけるイントラ予測処理の詳細は、図２６を参照して後述するが、この処理により、候補となる全てのイントラ予測モードでイントラ予測が行われ、候補となる全てのイントラ予測モードに対してコスト関数値が算出される。そして、算出されたコスト関数値に基づいて、最適イントラ予測モードが選択され、最適イントラ予測モードのイントラ予測により生成された予測画像とそのコスト関数値が予測画像選択部２６に供給される。

画面並べ替えバッファ１２から供給される処理対象の画像がインター処理される画像である場合、参照される画像がフレームメモリ２２から読み出され、スイッチ２３を介して動き予測・補償部２５に供給される。これらの画像に基づいて、ステップＳ１４において、動き予測・補償部２５は、動き予測・補償処理を行う。

ステップＳ１４における動き予測・補償処理の詳細は、図２７を参照して後述する。この処理により、候補となる全てのインター予測モードで動き予測処理が行われ、候補となる全てのインター予測モードに対してコスト関数値が算出され、算出したコスト関数値に基づいて、最適インター予測モードが決定される。そして、最適インター予測モードにより生成された予測画像とそのコスト関数値が予測画像選択部２６に供給される。

ステップＳ１５において、予測画像選択部２６は、イントラ予測部２４および動き予測・補償部２５より出力された各コスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちの一方を、最適予測モードに決定する。そして、予測画像選択部２６は、決定した最適予測モードの予測画像を選択し、演算部１３，２０に供給する。この予測画像は、後述するステップＳ１６，Ｓ２１の演算に利用される。

なお、この予測画像の選択情報は、イントラ予測部２４または動き予測・補償部２５に供給される。最適イントラ予測モードの予測画像が選択された場合、イントラ予測部２４は、最適イントラ予測モードを示す情報（すなわち、イントラ予測モード情報）を、可逆符号化部１６に供給する。

最適インター予測モードの予測画像が選択された場合、動き予測・補償部２５は、最適インター予測モードを示す情報と、さらに、必要に応じて、最適インター予測モードに応じた情報を可逆符号化部１６に出力する。最適インター予測モードに応じた情報としては、動きベクトル情報や参照フレーム情報などがあげられる。

ステップＳ１６において、演算部１３は、ステップＳ１２で並び替えられた画像と、ステップＳ１５で選択された予測画像との差分を演算する。予測画像は、インター予測する場合は動き予測・補償部２５から、イントラ予測する場合はイントラ予測部２４から、それぞれ予測画像選択部２６を介して演算部１３に供給される。

差分データは元の画像データに較べてデータ量が小さくなっている。したがって、画像をそのまま符号化する場合に較べて、データ量を圧縮することができる。

ステップＳ１７において、直交変換部１４は演算部１３から供給された差分情報を直交変換する。具体的には、離散コサイン変換、カルーネン・レーベ変換等の直交変換が行われ、変換係数が出力される。

ステップＳ１８において、量子化部１５は変換係数を量子化する。この量子化に際しては、後述するステップＳ３０の処理で説明されるように、レートが制御される。

以上のようにして量子化された差分情報は、次のようにして局部的に復号される。すなわち、ステップＳ１９において、逆量子化部１８は量子化部１５により量子化された変換係数を量子化部１５の特性に対応する特性で逆量子化する。ステップＳ２０において、逆直交変換部１９は逆量子化部１８により逆量子化された変換係数を直交変換部１４の特性に対応する特性で逆直交変換する。

ステップＳ２１において、演算部２０は、予測画像選択部２６を介して入力される予測画像を局部的に復号された差分情報に加算し、局部的に復号された画像（演算部１３への入力に対応する画像）を生成する。

ステップＳ２２においてデブロックフィルタ２１は、演算部２０より出力された画像に対して、デブロックフィルタ処理を行う。これによりブロック歪みが除去される。デブロックフィルタ２１からの復号画像は、適応ループフィルタ１１１に出力される。

ステップＳ２３において、適応ループフィルタ１１１は、デブロックフィルタ２１からの復号画像がＩピクチャであるか否かを判定する。ステップＳ２３において、Ｉピクチャであると判定された場合、ステップＳ２４において、適応ループフィルタ１１１は、クラス分類係数算出処理を行う。このクラス分類係数算出処理の詳細は、図２８を参照して後述される。なお、この場合の適応ループフィルタ１１１は、図２４に示したように構成される。

ステップＳ２３の処理により、イントラ予測モードに応じてクラス分類が行われ、各クラスに対して適応フィルタ係数が算出される。そして、算出された適応フィルタ係数が、各クラスに分類されたデブロックフィルタ処理後の画素値とともに、対応するフィルタ処理部１３３−１および１３３−２に供給される。

一方、ステップＳ２３において、Ｉピクチャではないと判定された場合、ステップＳ２５に進む。ステップＳ２５において、適応ループフィルタ１１１は、画面全体に対して、１つの適応フィルタ係数を算出する。なお、Ｉピクチャではない場合の適応ループフィルタ１１１の詳細な構成例の図示は省略されている。

ステップＳ２４またはＳ２５で算出された適応ループフィルタ係数の情報は、可逆符号化部１６に供給され、後述するステップＳ２８において、可逆符号化部１６により符号化されて、圧縮画像のヘッダに付加される。

ステップＳ２６において、適応ループフィルタ１１１は、算出された適応フィルタ係数を用いて、デブロックフィルタ処理後の画素値に対して、適応ループフィルタ処理を行う。適応フィルタ処理後の画素値は、フレームメモリ２２に出力される。

すなわち、特に、Ｉピクチャの場合には、フィルタ処理部１３３−１は、第１のクラスのデブロックフィルタ処理後の画素値に対して、第１のクラスに対する適応フィルタ係数を用いてフィルタ処理を行う。フィルタ処理部１３３−２は、第２のクラスのデブロックフィルタ処理後の画素値に対して、第２のクラスに対する適応フィルタ係数を用いてフィルタ処理を行う。

ステップＳ２７においてフレームメモリ２２は、フィルタリングされた画像を記憶する。なお、フレームメモリ２２にはデブロックフィルタ２１と適応ループフィルタ１１１によりフィルタ処理されていない画像も演算部２０から供給され、記憶される。

一方、上述したステップＳ１８において量子化された変換係数は、可逆符号化部１６にも供給される。ステップＳ２８において、可逆符号化部１６は量子化部１５より出力された量子化された変換係数を符号化する。すなわち、差分画像が可変長符号化、算術符号化等の可逆符号化され、圧縮される。

また、このとき、上述したステップＳ２４またはＳ２５において可逆符号化部１６に入力された適応フィルタ係数、並びに、上述したステップＳ１５において可逆符号化部１６に入力された、イントラ予測部２４からのイントラ予測モード情報、または、動き予測・補償部２５からの最適インター予測モードに応じた情報なども符号化され、ヘッダ情報に付加される。

例えば、インター予測モードを示す情報は、マクロブロック毎に符号化される。動きベクトル情報や参照フレーム情報は、対象となるブロック毎に符号化される。フィルタ係数は、スライス毎あるいはピクチャパラメータセット毎に符号化される。

ステップＳ２９において蓄積バッファ１７は差分画像を圧縮画像として蓄積する。蓄積バッファ１７に蓄積された圧縮画像が適宜読み出され、伝送路を介して復号側に伝送される。

ステップＳ３０においてレート制御部２７は、蓄積バッファ１７に蓄積された圧縮画像に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１５の量子化動作のレートを制御する。

［イントラ予測処理の説明］
次に、図２６のフローチャートを参照して、図２５のステップＳ１３におけるイントラ予測処理を説明する。なお、図２６の例においては、輝度信号の場合を例として説明する。

イントラ予測部２４は、ステップＳ４１において、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対してイントラ予測を行う。

輝度信号のイントラ予測モードには、９種類の４×４画素および８×８画素のブロック単位、並びに４種類の１６×１６画素のマクロブロック単位の予測モードがあり、色差信号のイントラ予測モードには、４種類の８×８画素のブロック単位の予測モードがある。色差信号のイントラ予測モードは、輝度信号のイントラ予測モードと独立に設定が可能である。輝度信号の４×４画素および８×８画素のイントラ予測モードについては、４×４画素および８×８画素の輝度信号のブロック毎に１つのイントラ予測モードが定義される。輝度信号の１６×１６画素のイントラ予測モードと色差信号のイントラ予測モードについては、１つのマクロブロックに対して１つの予測モードが定義される。

具体的には、イントラ予測部２４は、処理対象のブロックの画素を、フレームメモリ２２から読み出され、スイッチ２３を介して供給される復号済みの画像を参照して、イントラ予測する。このイントラ予測処理が、各イントラ予測モードで行われることで、各イントラ予測モードでの予測画像が生成される。なお、参照される復号済みの画素としては、デブロックフィルタ２１と適応ループフィルタ１１１によりフィルタリングされていない画素が用いられる。

イントラ予測部２４は、ステップＳ４２において、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対するコスト関数値を算出する。ここで、コスト関数値を求めるためのコスト関数としては、式（９７）または式（９８）のコスト関数が用いられる。

イントラ予測部２４は、ステップＳ４３において、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対して、それぞれ最適モードを決定する。すなわち、上述したように、イントラ４×４予測モードおよびイントラ８×８予測モードの場合には、予測モードの種類が９種類あり、イントラ１６×１６予測モードの場合には、予測モードの種類が４種類ある。したがって、イントラ予測部２４は、ステップＳ４２において算出されたコスト関数値に基づいて、それらの中から、最適イントラ４×４予測モード、最適イントラ８×８予測モード、最適イントラ１６×１６予測モードを決定する。

イントラ予測部２４は、ステップＳ４４において、４×４画素、８×８画素、および１６×１６画素の各イントラ予測モードに対して決定された各最適モードの中から、ステップＳ４２において算出されたコスト関数値に基づいて、最適イントラ予測モードを選択する。すなわち、４×４画素、８×８画素、および１６×１６画素に対して決定された各最適モードの中から、コスト関数値が最小値であるモードを、最適イントラ予測モードとして選択する。そして、イントラ予測部２４は、最適イントラ予測モードで生成された予測画像とそのコスト関数値とを、予測画像選択部２６に供給する。

［動き予測・補償処理の説明］
次に、図２７のフローチャートを参照して、図２５のステップＳ１４の動き予測・補償処理について説明する。

動き予測・補償部２５は、ステップＳ６１において、１６×１６画素乃至４×４画素からなる８種類の各インター予測モードに対して動きベクトルと参照画像をそれぞれ決定する。すなわち、各インター予測モードの処理対象のブロックについて、動きベクトルと参照画像がそれぞれ決定される。

動き予測・補償部２５は、ステップＳ６２において、１６×１６画素乃至４×４画素からなる８種類の各インター予測モードについて、ステップＳ６１で決定された動きベクトルに基づいて、参照画像に動き予測と補償処理を行う。この動き予測と補償処理により、各インター予測モードでの予測画像が生成される。

動き予測・補償部２５は、ステップＳ６３において、１６×１６画素乃至４×４画素からなる８種類の各インター予測モードに対して、上述した式（９７）または式（９８）で示されるコスト関数値を算出する。

ステップＳ６４において、動き予測・補償部２５は、ステップＳ６３において算出されたインター予測モードに対してのコスト関数値を比較し、最小値を与える予測モードを、最適インター予測モードとして決定する。そして、動き予測・補償部２５は、最適インター予測モードで生成された予測画像とそのコスト関数値を、予測画像選択部２６に供給する。

［クラス分類係数算出処理の説明］
次に、図２８のフローチャートを参照して、図２５のステップＳ２４のクラス分類係数算出処理について説明する。なお、図２８のクラス分類係数算出処理は、図２４のＩピクチャの場合の適応ループフィルタ１１１により行われる処理である。

デブロックフィルタ２１からのデブロックフィルタ処理後の画素値がクラス分類部１３１に供給される。また、それぞれのマクロブロックが、イントラ４×４、８×８、１６×１６のいずれの予測モードで符号化されたかに関する情報が含まれるイントラ予測モード情報が予測モードバッファ１１２からクラス分類部１３１に供給される。

ステップＳ８１において、クラス分類部１３１は、それぞれのマクロブロックに対するイントラ予測モードの情報を取得する。

ステップＳ８２において、クラス分類部１３１は、取得したイントラ予測モードの情報を参照し、１つのマクロブロックに対するイントラ予測モードが、イントラ１６×１６予測モードであるか否かを判定する。ステップＳ８２において、イントラ１６×１６予測モードであると判定された場合、ステップＳ８３において、クラス分類部１３１は、デブロックフィルタ処理後の画素値を、第１のクラスに分類する。すなわち、イントラ１６×１６予測モードであるとされたマクロブロックの画素値は、平坦部領域クラスである第１のクラスに分類される。

ステップＳ８２において、イントラ１６×１６予測モードではないと判定された場合、ステップＳ８４において、クラス分類部１３１は、デブロックフィルタ処理後の画素値を、第２のクラスに分類する。すなわち、イントラ１６×１６予測モードではなく、イントラ８×８、またはイントラ４×４予測モードであるとされたマクロブロックの画素値は、エッジ・テクスチャ領域のクラスである第２のクラスに分類される。

ステップＳ８３またはＳ８４の後、処理は、ステップＳ８５に進む。ステップＳ８５において、クラス分類部１３１は、画面を構成するすべてのマクロブロックに対する処理が終了したか否かを判定し、終了していないと判定した場合、ステップＳ８２に戻り、それ以降の処理を繰り返す。

ステップＳ８５において、すべてのマクロブロックに対する処理が終了したと判定された場合、クラス分類部１３１は、各クラスに分類されたマクロブロックの画素値を、各フィルタ係数算出部１３２−１および１３２−２に供給し、処理は、ステップＳ８６に進む。

すなわち、クラス分類部１３１は、第１のクラスに分類されたマクロブロックの画素値を、フィルタ係数算出部１３２−１に供給し、第２のクラスに分類されたマクロブロックの画素値を、フィルタ係数算出部１３２−２に供給する。

ステップＳ８６において、フィルタ係数算出部１３２−１および１３２−２は、第１のクラスおよび第２のクラスに対する適応フィルタ係数を算出する。

すなわち、フィルタ係数算出部１３２−１は、画面並べ替えバッファ１２からの入力画像画素値と、第１のクラスのデブロックフィルタ処理後の画素値との残差を最小とするよう、第１のクラスに対する適応フィルタ係数を算出する。算出された第１のクラスに対する適応フィルタ係数は、第１のクラスのデブロックフィルタ処理後の画素値とともに、フィルタ処理部１３３−１に供給される。

また、フィルタ係数算出部１３２−２は、画面並べ替えバッファ１２からの入力画像画素値と、第２のクラスのデブロックフィルタ処理後の画素値との残差を最小とするよう、第２のクラスに対する適応フィルタ係数を算出する。算出された第２のクラスに対する適応フィルタ係数は、第２のクラスのデブロックフィルタ処理後の画素値とともに、フィルタ処理部１３３−２に供給される。各クラスの適応フィルタ係数は、さらに、可逆符号化部１６にも供給される。

以上のように、フィルタ処理を行う画素がＩピクチャである場合、その画素を、どのイントラ予測ブロックサイズのモードで符号化されたかに関する情報に応じて、平坦部領域のマクロブロックのクラスと、エッジまたはテクスチャが含まれる領域のマクロブロックのクラスとに分類し、クラス毎に適応ループフィルタ処理を行うようにした。

これにより、画面内のローカルな歪みを低減することが可能になる。また、Ｉピクチャの画質が情報されるので、結果として、ＧＯＰ全体の画質を向上させることができる。

さらに、イントラ予測モードの情報は、復号側に送る符号化情報（符号化パラメータ）であるので、クラス分類のための情報を復号側に送る必要がなく、クラス分類のための情報を送ることによる符号化効率の低下を防ぐことができる。

符号化された圧縮画像は、所定の伝送路を介して伝送され、画像復号装置により復号される。

［画像復号装置の構成例］
図２９は、本発明を適用した画像処理装置としての画像復号装置の一実施の形態の構成を表している。

図２９の画像復号装置２０１は、蓄積バッファ４１、可逆復号部４２、逆量子化部４３、逆直交変換部４４、演算部４５、デブロックフィルタ４６、画面並べ替えバッファ４７、D/A変換部４８、フレームメモリ４９、スイッチ５０、イントラ予測部５１、動き補償部５２、およびスイッチ５３を備える点で、図２の画像復号装置３１と共通している。

また、図２３の画像復号装置２０１は、適応ループフィルタ２１１および予測モードバッファ２１２が追加された点で、図２の画像復号装置３１と異なっている。

すなわち、可逆復号部４２は、図２の可逆復号部４２と同様に、蓄積バッファ４１より供給された、図５の可逆符号化部１６により符号化された情報を、可逆符号化部１６の符号化方式に対応する方式で復号する。このとき、動きベクトル情報、参照フレーム情報、予測モード情報（イントラ予測モード、またはインター予測モードを示す情報）、第１のクラスおよび第２のクラスの適応フィルタ係数なども復号される。

動きベクトル情報および参照フレーム情報は、ブロック毎に動き補償部５２に供給される。予測モード情報は、マクロブロック毎にイントラ予測部５１および動き補償部５２の対応する部に供給される。各クラスの適応フィルタ係数は、スライス毎またはピクチャパラメータセット毎に適応ループフィルタ２１１に供給される。

適応ループフィルタ２１１は、デブロックフィルタ４６の後、フレームメモリ４９の前に設けられている。すなわち、適応ループフィルタ２１１は、演算部４５、デブロックフィルタ４６、フレームメモリ４９、スイッチ５０、動き補償部５２、およびスイッチ５３からなる動き補償ループ内に設けられている。すなわち、動き補償ループ内では、画像がループして用いられている。

適応ループフィルタ２１１は、可逆復号部４２から供給された適応フィルタ係数を用いて、デブロックフィルタ４６からの復号画像にフィルタ処理を行う。このフィルタとして、例えば、ウィナーフィルタ（Wiener Filter）が用いられる。

ただし、適応ループフィルタ２１１は、デブロックフィルタ４６からの復号画像を、予測モードバッファ２１２からのイントラ予測モード情報に応じたクラスに分類する。適応ループフィルタ２１１は、分類されたクラス毎に、可逆復号部４２から供給された適応フィルタ係数を用いて、フィルタ処理をそれぞれ行い、フィルタ処理後の画像を、画面並べ替えバッファ４７およびフレームメモリ４９に出力する。

予測モードバッファ２１２は、イントラ予測部５１により決定されたイントラ予測モード情報を格納している。

なお、図５の適応ループフィルタ１１１においては、各クラスの画素値が用いられて適応フィルタ係数が算出され、算出されたフィルタ係数が用いられて、各クラスの画素値に対してフィルタ処理が行われる。これに対して、図２９の適応ループフィルタ２１１においては、圧縮画像のヘッダからスライス毎またはピクチャパラメータセット毎に取得されるフィルタ係数が用いられて、各クラスの画素値に対してフィルタ処理が行われる。

［適応ループフィルタの構成例］
図３０は、Ｉピクチャの場合の適応ループフィルタ２１１の構成例を示すブロック図である。なお、図２４の場合と同様に、Ｉピクチャ以外のピクチャの場合の適応ループフィルタ２１１の構成例の図示は、説明の便宜上省略する。

図３０の例において、適応ループフィルタ２１１は、フィルタ係数バッファ２３１−１および２３１−２、クラス分類部２３２、並びにフィルタ処理部２３３−１および２３３−２により構成されている。

可逆復号部４２は、ピクチャパラメータセットまたはスライスヘッダから得られる、第１のクラスおよび第２のクラスに対する適応フィルタ係数を、フィルタ係数バッファ２３１−１および２３１−２にそれぞれ供給してくる。

フィルタ係数バッファ２３１−１は、第１のクラスに対する適応フィルタ係数を蓄積し、フィルタ処理部２３３−１に供給する。フィルタ係数バッファ２３１−２は、第２のクラスに対する適応フィルタ係数を蓄積し、フィルタ処理部２３３−２に供給する。

デブロックフィルタ４６からのデブロックフィルタ処理後の画素値が、クラス分類部２３２に供給される。また、予測モードバッファ２１２からのそれぞれのマクロブロックが、イントラ４×４、８×８、１６×１６のいずれの予測モードで符号化されたかに関する情報が含まれるイントラ予測モード情報が、クラス分類部２３２に供給される。

クラス分類部２３２は、イントラ予測モード情報を参照し、デブロックフィルタ処理後の画素値を、第１のクラスに属するものと、第２のクラスに属するものに分類し、それぞれをフィルタ処理部２３３−１および２３３−２に供給する。すなわち、イントラ１６×１６により符号化されたマクロブロックが、平坦領域のクラスである第１のクラスに分類され、それ以外のイントラ予測モードにより符号化されたマクロブロックが、エッジ、テクスチャを含む領域のクラスである第２のクラスに分類される。

フィルタ処理部２３３−１は、フィルタ係数バッファ２３１−１からの第１のクラスに対する適応フィルタ係数を用いて、第１のクラスに分類された画素値に対して、フィルタ処理を行う。フィルタ処理部２３３−２は、フィルタ係数バッファ２３１−２からの第２のクラスに対する適応フィルタ係数を用いて、第２のクラスに分類された画素値に対して、フィルタ処理を行う。

適応フィルタ処理後の各画素値は、画面並べ替えバッファ４７およびフレームメモリ４９に出力される。

［画像復号装置の復号処理の説明］
次に、図３１のフローチャートを参照して、画像復号装置２０１が実行する復号処理について説明する。

ステップＳ１３１において、蓄積バッファ４１は伝送されてきた画像を蓄積する。ステップＳ１３２において、可逆復号部４２は、蓄積バッファ４１から供給される圧縮画像を復号する。すなわち、図５の可逆符号化部１６により符号化されたＩピクチャ、Ｐピクチャ、並びにＢピクチャが復号される。

このとき、動きベクトル情報、参照フレーム情報、予測モード情報（イントラ予測モード、またはインター予測モードを示す情報）、各クラスに対する適応フィルタ係数なども復号される。

すなわち、予測モード情報がイントラ予測モード情報である場合、予測モード情報は、イントラ予測部５１に供給される。予測モード情報がインター予測モード情報である場合、予測モード情報と対応する動きベクトル情報および参照フレーム情報は、動き補償部５２に供給される。各クラスに対する適応フィルタ係数は、スライスまたはピクチャパラメータセット毎に復号され、適応ループフィルタ２１１に供給される。

ステップＳ１３３において、イントラ予測部５１または動き補償部５２は、可逆復号部４２から供給される予測モード情報に対応して、それぞれ、予測画像生成処理を行う。

すなわち、可逆復号部４２からイントラ予測モード情報が供給された場合、イントラ予測部５１は、イントラ予測モードのイントラ予測処理を行い、イントラ予測画像を生成する。可逆復号部４２からインター予測モード情報が供給された場合、動き補償部５２は、インター予測モードの動き予測・補償処理を行い、インター予測画像を生成する。

ステップＳ１３３における予測画像生成処理の詳細は、図３２を参照して後述するが、この処理により、イントラ予測部５１により生成された予測画像（イントラ予測画像）、または動き補償部５２により生成された予測画像（インター予測画像）がスイッチ５３に供給される。

ステップＳ１３４において、スイッチ５３は予測画像を選択する。すなわち、イントラ予測部５１により生成された予測画像、または動き補償部５２により生成された予測画像が供給される。したがって、供給された予測画像が選択されて演算部４５に供給され、後述するステップＳ１３７において逆直交変換部４４の出力と加算される。

上述したステップＳ１３２において、可逆復号部４２により復号された変換係数は、逆量子化部４３にも供給される。ステップＳ１３５において、逆量子化部４３は可逆復号部４２により復号された変換係数を、図５の量子化部１５の特性に対応する特性で逆量子化する。

ステップＳ１３６において逆直交変換部４４は、逆量子化部４３により逆量子化された変換係数を、図５の直交変換部１４の特性に対応する特性で逆直交変換する。これにより図５の直交変換部１４の入力（演算部１３の出力）に対応する差分情報が復号されたことになる。

ステップＳ１３７において、演算部４５は、上述したステップＳ１３４の処理で選択され、スイッチ５３を介して入力される予測画像を差分情報と加算する。これにより元の画像が復号される。ステップＳ１３８においてデブロックフィルタ４６は、演算部４５より出力された画像に対して、デブロックフィルタ処理を行う。これにより、画面全体におけるブロック歪みが除去される。

ステップＳ１３９において、適応ループフィルタ２１１は、デブロックフィルタ２１からの復号画像がＩピクチャであるか否かを判定する。ステップＳ１３９において、Ｉピクチャであると判定された場合、ステップＳ１４０において、適応ループフィルタ１１１は、クラス分類フィルタ処理を行う。このクラス分類フィルタ処理の詳細は、図３３を参照して後述される。なお、この場合の適応ループフィルタ２１１は、図３０に示したように構成される。

ステップＳ１４０の処理により、イントラ予測モードに応じてクラス分類が行われ、各クラスに対して適応フィルタ処理が行われる。適応フィルタ処理後の画素値は、画面並べ替えバッファ４７およびフレームメモリ４９に出力される。

一方、ステップＳ１３９において、Ｉピクチャではないと判定された場合、ステップＳ１４１に進む。ステップＳ１４１において、適応ループフィルタ２１１は、画面の全画素値に対して、１つの適応フィルタ係数を用いて、適応フィルタ処理を行う。この場合の適応フィルタ係数も、可逆復号部４２によりスライスヘッダまたはピクチャパラメータセットから得られて、適応ループフィルタ２１１に供給されるものである。適応フィルタ処理後の画素値は、画面並べ替えバッファ４７およびフレームメモリ４９に出力される。なお、Ｉピクチャではない場合の適応ループフィルタ２１１の詳細な構成例の図示は省略されている。

ステップＳ１４２においてフレームメモリ４９は、適応フィルタリングされた画像を記憶する。

ステップＳ１４３において、画面並べ替えバッファ４７は、適応ループフィルタ２１１後の画像の並べ替えを行う。すなわち画像符号化装置１０１の画面並べ替えバッファ１２により符号化のために並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。

ステップＳ１４４において、D/A変換部４８は、画面並べ替えバッファ４７からの画像をD/A変換する。この画像が図示せぬディスプレイに出力され、画像が表示される。

［画像復号装置の予測画像生成処理の説明］
次に、図３２のフローチャートを参照して、図３１のステップＳ１３３の予測画像生成処理を説明する。

イントラ予測部５１は、ステップＳ１７１において、対象ブロックがイントラ符号化されているか否かを判定する。可逆復号部４２からイントラ予測モード情報がイントラ予測部５１に供給されると、イントラ予測部５１は、ステップＳ１７１において、対象ブロックがイントラ符号化されていると判定し、処理は、ステップＳ１７２に進む。このとき、イントラ予測部５１は、このイントラ予測モード情報を、予測モードバッファ２１２に供給する。

イントラ予測部５１は、ステップＳ１７２において、イントラ予測モード情報を取得し、ステップＳ１７３において、イントラ予測を行い、イントラ予測画像を生成する。

すなわち、処理対象の画像がイントラ処理される画像である場合、必要な画像がフレームメモリ４９から読み出され、スイッチ５０を介してイントラ予測部５１に供給される。ステップＳ１７３において、イントラ予測部５１は、ステップＳ１７２で取得したイントラ予測モード情報に従ってイントラ予測し、予測画像を生成する。生成した予測画像は、スイッチ５３に出力される。

一方、ステップＳ１７１において、イントラ符号化されていないと判定された場合、処理は、ステップＳ１７４に進む。

処理対象の画像がインター処理される画像である場合、可逆復号部４２からインター予測モード情報、参照フレーム情報、動きベクトル情報が動き補償部５２に供給される。

ステップＳ１７４において、動き補償部５２は、可逆復号部４２からの予測モード情報などを取得する。すなわち、動き（インター）予測モード情報、参照フレーム情報、動きベクトル情報が取得される。

ステップＳ１７５において、動き補償部５２は、動きベクトル情報を用いて、フレームメモリ４９からの参照画像に補償を行い、インター予測画像を生成する。生成された予測画像は、スイッチ５３を介して、演算部４５に供給され、図３１のステップＳ１３７において逆直交変換部４４の出力と加算される。

［画像復号装置のクラス分類フィルタ処理の説明］
次に、図３３のフローチャートを参照して、図３１のステップＳ１４０のクラス分類フィルタ処理について説明する。

ステップＳ１９１において、フィルタ処理部２３３−１および２３３−２は、それぞれ、フィルタ係数バッファ２３１−１および２３１−２からの、それぞれのクラスに対する適応フィルタ係数を受け取る。

また、可逆復号部４２からの各マクロブロックに対するイントラ予測モードの情報が、イントラ予測部５１および予測モードバッファ２１２を介して、クラス分類部２３２に供給される。

ステップＳ１９２において、クラス分類部２３２は、それぞれのマクロブロックが、イントラ４×４、８×８、１６×１６のいずれの予測モードで符号化されたかに関する情報が含まれるイントラ予測モードの情報を受け取る。

ステップＳ１９３において、クラス分類部２３２は、受け取ったイントラ予測モードの情報を参照して、各マクロブロックのイントラ予測モードが、イントラ１６×１６予測モードであるか否かを判定する。ステップＳ１９３において、イントラ１６×１６予測モードであると判定した場合、ステップＳ１９４において、クラス分類部２３２は、デブロックフィルタ処理後の画素値を、第１のクラスに分類する。すなわち、イントラ１６×１６予測モードであるとされたマクロブロックの画素値は、平坦部領域クラスである第１のクラスに分類される。クラス分類部２３２は、第１のクラスに分類したマクロブロックの画素値を、フィルタ処理部２３３−１に供給する。

ステップＳ１９５において、フィルタ処理部２３３−１は、第１のクラスについて適応フィルタ処理を行う。すなわち、フィルタ処理部２３３−１は、クラス分類部２３２により第１のクラスに分類されたマクロブロックの画素値に対して、フィルタ係数バッファ２３１−１からの第１のクラスに対する適応フィルタ係数を用いて、フィルタ処理を行う。この適応フィルタ処理後の画素値は、画面並べ替えバッファ４７およびフレームメモリ４９に供給される。

また、ステップＳ１９３において、イントラ１６×１６予測モードではないと判定した場合、ステップＳ１９６において、クラス分類部２３２は、デブロックフィルタ処理後の画素値を、第２のクラスに分類する。すなわち、イントラ１６×１６予測モードではなく、イントラ８×８、またはイントラ４×４予測モードであるとされたマクロブロックの画素値は、エッジ・テクスチャ領域のクラスである第２のクラスに分類される。クラス分類部２３２は、第２のクラスに分類したマクロブロックの画素値を、フィルタ処理部２３３−２に供給する。

ステップＳ１９７において、フィルタ処理部２３３−２は、第２のクラスについて適応フィルタ処理を行う。すなわち、フィルタ処理部２３３−２は、クラス分類部２３２により第２のクラスに分類されたマクロブロックの画素値に対して、フィルタ係数バッファ２３１−２からの第２のクラスに対する適応フィルタ係数を用いて、フィルタ処理を行う。この適応フィルタ処理後の画素値は、画面並べ替えバッファ４７およびフレームメモリ４９に供給される。

以上のように、画像符号化装置１０１および画像復号装置２０１においては、Ｉピクチャの場合、Ｉピクチャの画像が、イントラ予測モードに応じたクラスに分類され、クラス毎に、適応ループフィルタ処理が行われる。

これにより、画面全体における画質劣化を最小限にするとともに、画面の平坦部、およびテクスチャなどを含む領域のそれぞれで生じてしまうローカルな画質劣化も改善することができる。この結果、符号化効率が改善される。

以上においては、符号化方式としてH．264/AVC方式をベースに用いるようにしたが、本発明はこれに限らず、複数のブロックサイズのイントラ予測モードを有し、また、動き予測・補償ループ内に適応フィルタを含む、その他の符号化方式／復号方式を適用することができる。

なお、本発明は、例えば、MPEG、H．26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して受信する際に用いられる画像符号化装置および画像復号装置に適用することができる。また、本発明は、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像符号化装置および画像復号装置に適用することができる。さらに、本発明は、それらの画像符号化装置および画像復号装置などに含まれる動き予測補償装置にも適用することができる。

上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な汎用のパーソナルコンピュータなどが含まれる。

［パーソナルコンピュータの構成例］
図３４は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

コンピュータにおいて、CPU(Central Processing Unit)２５１、ROM(Read Only Memory)２５２、RAM(Random Access Memory)２５３は、バス２５４により相互に接続されている。

バス２５４には、さらに、入出力インタフェース２５５が接続されている。入出力インタフェース２５５には、入力部２５６、出力部２５７、記憶部２５８、通信部２５９、およびドライブ２６０が接続されている。

入力部２５６は、キーボード、マウス、マイクロホンなどよりなる。出力部２５７は、ディスプレイ、スピーカなどよりなる。記憶部２５８は、ハードディスクや不揮発性のメモリなどよりなる。通信部２５９は、ネットワークインタフェースなどよりなる。ドライブ２６０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア２６１を駆動する。

以上のように構成されるコンピュータでは、CPU２５１が、例えば、記憶部２５８に記憶されているプログラムを入出力インタフェース２５５及びバス２５４を介してRAM２５３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ（CPU２５１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア２６１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータでは、プログラムは、リムーバブルメディア２６１をドライブ２６０に装着することにより、入出力インタフェース２５５を介して、記憶部２５８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部２５９で受信し、記憶部２５８にインストールすることができる。その他、プログラムは、ROM２５２や記憶部２５８に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、上述した画像符号化装置１０１や画像復号装置２０１は、任意の電子機器に適用することができる。以下にその例について説明する。

［テレビジョン受像機の構成例］
図３５は、本発明を適用した画像復号装置を用いるテレビジョン受像機の主な構成例を示すブロック図である。

図３５に示されるテレビジョン受像機３００は、地上波チューナ３１３、ビデオデコーダ３１５、映像信号処理回路３１８、グラフィック生成回路３１９、パネル駆動回路３２０、および表示パネル３２１を有する。

地上波チューナ３１３は、地上アナログ放送の放送波信号を、アンテナを介して受信し、復調し、映像信号を取得し、それをビデオデコーダ３１５に供給する。ビデオデコーダ３１５は、地上波チューナ３１３から供給された映像信号に対してデコード処理を施し、得られたデジタルのコンポーネント信号を映像信号処理回路３１８に供給する。

映像信号処理回路３１８は、ビデオデコーダ３１５から供給された映像データに対してノイズ除去などの所定の処理を施し、得られた映像データをグラフィック生成回路３１９に供給する。

グラフィック生成回路３１９は、表示パネル３２１に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成し、生成した映像データや画像データをパネル駆動回路３２０に供給する。また、グラフィック生成回路３１９は、項目の選択などにユーザにより利用される画面を表示するための映像データ（グラフィック）を生成し、それを番組の映像データに重畳したりすることによって得られた映像データをパネル駆動回路３２０に供給するといった処理も適宜行う。

パネル駆動回路３２０は、グラフィック生成回路３１９から供給されたデータに基づいて表示パネル３２１を駆動し、番組の映像や上述した各種の画面を表示パネル３２１に表示させる。

表示パネル３２１はLCD（Liquid Crystal Display）などよりなり、パネル駆動回路３２０による制御に従って番組の映像などを表示させる。

また、テレビジョン受像機３００は、音声A/D（Analog/Digital)変換回路３１４、音声信号処理回路３２２、エコーキャンセル／音声合成回路３２３、音声増幅回路３２４、およびスピーカ３２５も有する。

地上波チューナ３１３は、受信した放送波信号を復調することにより、映像信号だけでなく音声信号も取得する。地上波チューナ３１３は、取得した音声信号を音声A/D変換回路３１４に供給する。

音声A/D変換回路３１４は、地上波チューナ３１３から供給された音声信号に対してA/D変換処理を施し、得られたデジタルの音声信号を音声信号処理回路３２２に供給する。

音声信号処理回路３２２は、音声A/D変換回路３１４から供給された音声データに対してノイズ除去などの所定の処理を施し、得られた音声データをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、音声信号処理回路３２２から供給された音声データを音声増幅回路３２４に供給する。

音声増幅回路３２４は、エコーキャンセル／音声合成回路３２３から供給された音声データに対してD/A変換処理、増幅処理を施し、所定の音量に調整した後、音声をスピーカ３２５から出力させる。

さらに、テレビジョン受像機３００は、デジタルチューナ３１６およびMPEGデコーダ３１７も有する。

デジタルチューナ３１６は、デジタル放送（地上デジタル放送、BS（Broadcasting Satellite）／CS（Communications Satellite）デジタル放送）の放送波信号を、アンテナを介して受信し、復調し、MPEG-TS（Moving Picture Experts Group-Transport Stream）を取得し、それをMPEGデコーダ３１７に供給する。

MPEGデコーダ３１７は、デジタルチューナ３１６から供給されたMPEG-TSに施されているスクランブルを解除し、再生対象（視聴対象）になっている番組のデータを含むストリームを抽出する。MPEGデコーダ３１７は、抽出したストリームを構成する音声パケットをデコードし、得られた音声データを音声信号処理回路３２２に供給するとともに、ストリームを構成する映像パケットをデコードし、得られた映像データを映像信号処理回路３１８に供給する。また、MPEGデコーダ３１７は、MPEG-TSから抽出したEPG（Electronic Program Guide)データを図示せぬ経路を介してCPU３３２に供給する。

テレビジョン受像機３００は、このように映像パケットをデコードするMPEGデコーダ３１７として、上述した画像復号装置２０１を用いる。したがって、MPEGデコーダ３１７は、画像復号装置２０１の場合と同様に、画面全体における画質劣化を最小限にするともに、ローカルな画質劣化を改善することができる。

MPEGデコーダ３１７から供給された映像データは、ビデオデコーダ３１５から供給された映像データの場合と同様に、映像信号処理回路３１８において所定の処理が施される。そして、所定の処理が施された映像データは、グラフィック生成回路３１９において、生成された映像データ等が適宜重畳され、パネル駆動回路３２０を介して表示パネル３２１に供給され、その画像が表示される。

MPEGデコーダ３１７から供給された音声データは、音声A/D変換回路３１４から供給された音声データの場合と同様に、音声信号処理回路３２２において所定の処理が施される。そして、所定の処理が施された音声データは、エコーキャンセル／音声合成回路３２３を介して音声増幅回路３２４に供給され、D/A変換処理や増幅処理が施される。その結果、所定の音量に調整された音声がスピーカ３２５から出力される。

また、テレビジョン受像機３００は、マイクロホン３２６、およびA/D変換回路３２７も有する。

A/D変換回路３２７は、音声会話用のものとしてテレビジョン受像機３００に設けられるマイクロホン３２６により取り込まれたユーザの音声の信号を受信する。A/D変換回路３２７は、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、テレビジョン受像機３００のユーザ（ユーザＡ）の音声のデータがA/D変換回路３２７から供給されている場合、ユーザＡの音声データを対象としてエコーキャンセルを行う。そして、エコーキャンセル／音声合成回路３２３は、エコーキャンセルの後、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路３２４を介してスピーカ３２５より出力させる。

さらに、テレビジョン受像機３００は、音声コーデック３２８、内部バス３２９、SDRAM（Synchronous Dynamic Random Access Memory)３３０、フラッシュメモリ３３１、CPU３３２、USB（Universal Serial Bus) I/F３３３、およびネットワークI/F３３４も有する。

A/D変換回路３２７は、音声会話用のものとしてテレビジョン受像機３００に設けられるマイクロホン３２６により取り込まれたユーザの音声の信号を受信する。A/D変換回路３２７は、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データを音声コーデック３２８に供給する。

音声コーデック３２８は、A/D変換回路３２７から供給された音声データを、ネットワーク経由で送信するための所定のフォーマットのデータに変換し、内部バス３２９を介してネットワークI/F３３４に供給する。

ネットワークI/F３３４は、ネットワーク端子３３５に装着されたケーブルを介してネットワークに接続される。ネットワークI/F３３４は、例えば、そのネットワークに接続される他の装置に対して、音声コーデック３２８から供給された音声データを送信する。また、ネットワークI/F３３４は、例えば、ネットワークを介して接続される他の装置から送信される音声データを、ネットワーク端子３３５を介して受信し、それを、内部バス３２９を介して音声コーデック３２８に供給する。

音声コーデック３２８は、ネットワークI/F３３４から供給された音声データを所定のフォーマットのデータに変換し、それをエコーキャンセル／音声合成回路３２３に供給する。

エコーキャンセル／音声合成回路３２３は、音声コーデック３２８から供給される音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路３２４を介してスピーカ３２５より出力させる。

SDRAM３３０は、CPU３３２が処理を行う上で必要な各種のデータを記憶する。

フラッシュメモリ３３１は、CPU３３２により実行されるプログラムを記憶する。フラッシュメモリ３３１に記憶されているプログラムは、テレビジョン受像機３００の起動時などの所定のタイミングでCPU３３２により読み出される。フラッシュメモリ３３１には、デジタル放送を介して取得されたEPGデータ、ネットワークを介して所定のサーバから取得されたデータなども記憶される。

例えば、フラッシュメモリ３３１には、CPU３３２の制御によりネットワークを介して所定のサーバから取得されたコンテンツデータを含むMPEG-TSが記憶される。フラッシュメモリ３３１は、例えばCPU３３２の制御により、そのMPEG-TSを、内部バス３２９を介してMPEGデコーダ３１７に供給する。

MPEGデコーダ３１７は、デジタルチューナ３１６から供給されたMPEG-TSの場合と同様に、そのMPEG-TSを処理する。このようにテレビジョン受像機３００は、映像や音声等よりなるコンテンツデータを、ネットワークを介して受信し、MPEGデコーダ３１７を用いてデコードし、その映像を表示させたり、音声を出力させたりすることができる。

また、テレビジョン受像機３００は、リモートコントローラ３５１から送信される赤外線信号を受光する受光部３３７も有する。

受光部３３７は、リモートコントローラ３５１からの赤外線を受光し、復調して得られたユーザ操作の内容を表す制御コードをCPU３３２に出力する。

CPU３３２は、フラッシュメモリ３３１に記憶されているプログラムを実行し、受光部３３７から供給される制御コードなどに応じてテレビジョン受像機３００の全体の動作を制御する。CPU３３２とテレビジョン受像機３００の各部は、図示せぬ経路を介して接続されている。

USB I/F３３３は、USB端子３３６に装着されたUSBケーブルを介して接続される、テレビジョン受像機３００の外部の機器との間でデータの送受信を行う。ネットワークI/F３３４は、ネットワーク端子３３５に装着されたケーブルを介してネットワークに接続し、ネットワークに接続される各種の装置と音声データ以外のデータの送受信も行う。

テレビジョン受像機３００は、MPEGデコーダ３１７として画像復号装置２０１を用いることにより、符号化効率を向上することができる。その結果として、テレビジョン受像機３００は、アンテナを介して受信した放送波信号や、ネットワークを介して取得したコンテンツデータから、より高精細な復号画像を得て、表示することができる。

［携帯電話機の構成例］
図３６は、本発明を適用した画像符号化装置および画像復号装置を用いる携帯電話機の主な構成例を示すブロック図である。

図３６に示される携帯電話機４００は、各部を統括的に制御するようになされた主制御部４５０、電源回路部４５１、操作入力制御部４５２、画像エンコーダ４５３、カメラI/F部４５４、LCD制御部４５５、画像デコーダ４５６、多重分離部４５７、記録再生部４６２、変復調回路部４５８、および音声コーデック４５９を有する。これらは、バス４６０を介して互いに接続されている。

また、携帯電話機４００は、操作キー４１９、CCD（Charge Coupled Devices）カメラ４１６、液晶ディスプレイ４１８、記憶部４２３、送受信回路部４６３、アンテナ４１４、マイクロホン（マイク）４２１、およびスピーカ４１７を有する。

電源回路部４５１は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話機４００を動作可能な状態に起動する。

携帯電話機４００は、CPU、ROMおよびRAM等でなる主制御部４５０の制御に基づいて、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

例えば、音声通話モードにおいて、携帯電話機４００は、マイクロホン（マイク）４２１で集音した音声信号を、音声コーデック４５９によってデジタル音声データに変換し、これを変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（音声信号）は、公衆電話回線網を介して通話相手の携帯電話機に供給される。

また、例えば、音声通話モードにおいて、携帯電話機４００は、アンテナ４１４で受信した受信信号を送受信回路部４６３で増幅し、さらに周波数変換処理およびアナログデジタル変換処理し、変復調回路部４５８でスペクトラム逆拡散処理し、音声コーデック４５９によってアナログ音声信号に変換する。携帯電話機４００は、その変換して得られたアナログ音声信号をスピーカ４１７から出力する。

更に、例えば、データ通信モードにおいて電子メールを送信する場合、携帯電話機４００は、操作キー４１９の操作によって入力された電子メールのテキストデータを、操作入力制御部４５２において受け付ける。携帯電話機４００は、そのテキストデータを主制御部４５０において処理し、LCD制御部４５５を介して、画像として液晶ディスプレイ４１８に表示させる。

また、携帯電話機４００は、主制御部４５０において、操作入力制御部４５２が受け付けたテキストデータやユーザ指示等に基づいて電子メールデータを生成する。携帯電話機４００は、その電子メールデータを、変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（電子メール）は、ネットワークおよびメールサーバ等を介して、所定のあて先に供給される。

また、例えば、データ通信モードにおいて電子メールを受信する場合、携帯電話機４００は、基地局から送信された信号を、アンテナ４１４を介して送受信回路部４６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機４００は、その受信信号を変復調回路部４５８でスペクトラム逆拡散処理して元の電子メールデータを復元する。携帯電話機４００は、復元された電子メールデータを、LCD制御部４５５を介して液晶ディスプレイ４１８に表示する。

なお、携帯電話機４００は、受信した電子メールデータを、記録再生部４６２を介して、記憶部４２３に記録する（記憶させる）ことも可能である。

この記憶部４２３は、書き換え可能な任意の記憶媒体である。記憶部４２３は、例えば、RAMや内蔵型フラッシュメモリ等の半導体メモリであってもよいし、ハードディスクであってもよいし、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアであってもよい。もちろん、これら以外のものであってもよい。

さらに、例えば、データ通信モードにおいて画像データを送信する場合、携帯電話機４００は、撮像によりCCDカメラ４１６で画像データを生成する。CCDカメラ４１６は、レンズや絞り等の光学デバイスと光電変換素子としてのCCDを有し、被写体を撮像し、受光した光の強度を電気信号に変換し、被写体の画像の画像データを生成する。その画像データを、カメラI/F部４５４を介して、画像エンコーダ４５３で、例えばMPEG２やMPEG４等の所定の符号化方式によって圧縮符号化することにより符号化画像データに変換する。

携帯電話機４００は、このような処理を行う画像エンコーダ４５３として、上述した画像符号化装置１０１を用いる。したがって、画像エンコーダ４５３は、画像符号化装置１０１の場合と同様に、画面全体における画質劣化を最小限にするともに、ローカルな画質劣化を改善することができる。

なお、携帯電話機４００は、このとき同時に、CCDカメラ４１６で撮像中にマイクロホン（マイク）４２１で集音した音声を、音声コーデック４５９においてアナログデジタル変換し、さらに符号化する。

携帯電話機４００は、多重分離部４５７において、画像エンコーダ４５３から供給された符号化画像データと、音声コーデック４５９から供給されたデジタル音声データとを、所定の方式で多重化する。携帯電話機４００は、その結果得られる多重化データを、変復調回路部４５８でスペクトラム拡散処理し、送受信回路部４６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機４００は、その変換処理により得られた送信用信号を、アンテナ４１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（画像データ）は、ネットワーク等を介して、通信相手に供給される。

なお、画像データを送信しない場合、携帯電話機４００は、CCDカメラ４１６で生成した画像データを、画像エンコーダ４５３を介さずに、LCD制御部４５５を介して液晶ディスプレイ４１８に表示させることもできる。

また、例えば、データ通信モードにおいて、簡易ホームページ等にリンクされた動画像ファイルのデータを受信する場合、携帯電話機４００は、基地局から送信された信号を、アンテナ４１４を介して送受信回路部４６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機４００は、その受信信号を変復調回路部４５８でスペクトラム逆拡散処理して元の多重化データを復元する。携帯電話機４００は、多重分離部４５７において、その多重化データを分離して、符号化画像データと音声データとに分ける。

携帯電話機４００は、画像デコーダ４５６において、符号化画像データを、MPEG２やMPEG４等の所定の符号化方式に対応した復号方式でデコードすることにより、再生動画像データを生成し、これを、LCD制御部４５５を介して液晶ディスプレイ４１８に表示させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる動画データが液晶ディスプレイ４１８に表示される。

携帯電話機４００は、このような処理を行う画像デコーダ４５６として、上述した画像復号装置２０１を用いる。したがって、画像デコーダ４５６は、画像復号装置２０１の場合と同様に、画面全体における画質劣化を最小限にするともに、ローカルな画質劣化を改善することができる。

このとき、携帯電話機４００は、同時に、音声コーデック４５９において、デジタルの音声データをアナログ音声信号に変換し、これをスピーカ４１７より出力させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる音声データが再生される。

なお、電子メールの場合と同様に、携帯電話機４００は、受信した簡易ホームページ等にリンクされたデータを、記録再生部４６２を介して、記憶部４２３に記録する（記憶させる）ことも可能である。

また、携帯電話機４００は、主制御部４５０において、撮像されてCCDカメラ４１６で得られた２次元コードを解析し、２次元コードに記録された情報を取得することができる。

さらに、携帯電話機４００は、赤外線通信部４８１で赤外線により外部の機器と通信することができる。

携帯電話機４００は、画像エンコーダ４５３として画像符号化装置１０１を用いることにより、符号化効率を向上させることができる。結果として、携帯電話機４００は、符号化効率のよい符号化データ（画像データ）を、他の装置に提供することができる。

また、携帯電話機４００は、画像デコーダ４５６として画像復号装置２０１を用いることにより、符号化効率を向上させることができる。その結果として、携帯電話機４００は、例えば、簡易ホームページにリンクされた動画像ファイルから、より高精細な復号画像を得て、表示することができる。

なお、以上において、携帯電話機４００が、CCDカメラ４１６を用いるように説明したが、このCCDカメラ４１６の代わりに、CMOS（Complementary Metal Oxide Semiconductor）を用いたイメージセンサ（CMOSイメージセンサ）を用いるようにしてもよい。この場合も、携帯電話機４００は、CCDカメラ４１６を用いる場合と同様に、被写体を撮像し、被写体の画像の画像データを生成することができる。

また、以上においては携帯電話機４００として説明したが、例えば、PDA（Personal Digital Assistants）、スマートフォン、UMPC（Ultra Mobile Personal Computer）、ネットブック、ノート型パーソナルコンピュータ等、この携帯電話機４００と同様の撮像機能や通信機能を有する装置であれば、どのような装置であっても携帯電話機４００の場合と同様に、画像符号化装置１０１および画像復号装置２０１を適用することができる。

［ハードディスクレコーダの構成例］
図３７は、本発明を適用した画像符号化装置および画像復号装置を用いるハードディスクレコーダの主な構成例を示すブロック図である。

図３７に示されるハードディスクレコーダ（HDDレコーダ）５００は、チューナにより受信された、衛星や地上のアンテナ等より送信される放送波信号（テレビジョン信号）に含まれる放送番組のオーディオデータとビデオデータを、内蔵するハードディスクに保存し、その保存したデータをユーザの指示に応じたタイミングでユーザに提供する装置である。

ハードディスクレコーダ５００は、例えば、放送波信号よりオーディオデータとビデオデータを抽出し、それらを適宜復号し、内蔵するハードディスクに記憶させることができる。また、ハードディスクレコーダ５００は、例えば、ネットワークを介して他の装置からオーディオデータやビデオデータを取得し、それらを適宜復号し、内蔵するハードディスクに記憶させることもできる。

さらに、ハードディスクレコーダ５００は、例えば、内蔵するハードディスクに記録されているオーディオデータやビデオデータを復号してモニタ５６０に供給し、モニタ５６０の画面にその画像を表示させる。また、ハードディスクレコーダ５００は、モニタ５６０のスピーカよりその音声を出力させることができる。

ハードディスクレコーダ５００は、例えば、チューナを介して取得された放送波信号より抽出されたオーディオデータとビデオデータ、または、ネットワークを介して他の装置から取得したオーディオデータやビデオデータを復号してモニタ５６０に供給し、モニタ５６０の画面にその画像を表示させる。また、ハードディスクレコーダ５００は、モニタ５６０のスピーカよりその音声を出力させることもできる。

もちろん、この他の動作も可能である。

図３７に示されるように、ハードディスクレコーダ５００は、受信部５２１、復調部５２２、デマルチプレクサ５２３、オーディオデコーダ５２４、ビデオデコーダ５２５、およびレコーダ制御部５２６を有する。ハードディスクレコーダ５００は、さらに、EPGデータメモリ５２７、プログラムメモリ５２８、ワークメモリ５２９、ディスプレイコンバータ５３０、OSD（On Screen Display）制御部５３１、ディスプレイ制御部５３２、記録再生部５３３、D/Aコンバータ５３４、および通信部５３５を有する。

また、ディスプレイコンバータ５３０は、ビデオエンコーダ５４１を有する。記録再生部５３３は、エンコーダ５５１およびデコーダ５５２を有する。

受信部５２１は、リモートコントローラ（図示せず）からの赤外線信号を受信し、電気信号に変換してレコーダ制御部５２６に出力する。レコーダ制御部５２６は、例えば、マイクロプロセッサなどにより構成され、プログラムメモリ５２８に記憶されているプログラムに従って、各種の処理を実行する。レコーダ制御部５２６は、このとき、ワークメモリ５２９を必要に応じて使用する。

通信部５３５は、ネットワークに接続され、ネットワークを介して他の装置との通信処理を行う。例えば、通信部５３５は、レコーダ制御部５２６により制御され、チューナ（図示せず）と通信し、主にチューナに対して選局制御信号を出力する。

復調部５２２は、チューナより供給された信号を、復調し、デマルチプレクサ５２３に出力する。デマルチプレクサ５２３は、復調部５２２より供給されたデータを、オーディオデータ、ビデオデータ、およびEPGデータに分離し、それぞれ、オーディオデコーダ５２４、ビデオデコーダ５２５、またはレコーダ制御部５２６に出力する。

オーディオデコーダ５２４は、入力されたオーディオデータを、例えばMPEG方式でデコードし、記録再生部５３３に出力する。ビデオデコーダ５２５は、入力されたビデオデータを、例えばMPEG方式でデコードし、ディスプレイコンバータ５３０に出力する。レコーダ制御部５２６は、入力されたEPGデータをEPGデータメモリ５２７に供給し、記憶させる。

ディスプレイコンバータ５３０は、ビデオデコーダ５２５またはレコーダ制御部５２６より供給されたビデオデータを、ビデオエンコーダ５４１により、例えばNTSC（National Television Standards Committee）方式のビデオデータにエンコードし、記録再生部５３３に出力する。また、ディスプレイコンバータ５３０は、ビデオデコーダ５２５またはレコーダ制御部５２６より供給されるビデオデータの画面のサイズを、モニタ５６０のサイズに対応するサイズに変換する。ディスプレイコンバータ５３０は、画面のサイズが変換されたビデオデータを、さらに、ビデオエンコーダ５４１によってNTSC方式のビデオデータに変換し、アナログ信号に変換し、ディスプレイ制御部５３２に出力する。

ディスプレイ制御部５３２は、レコーダ制御部５２６の制御のもと、OSD（On Screen Display）制御部５３１が出力したOSD信号を、ディスプレイコンバータ５３０より入力されたビデオ信号に重畳し、モニタ５６０のディスプレイに出力し、表示させる。

モニタ５６０にはまた、オーディオデコーダ５２４が出力したオーディオデータが、D/Aコンバータ５３４によりアナログ信号に変換されて供給されている。モニタ５６０は、このオーディオ信号を内蔵するスピーカから出力する。

記録再生部５３３は、ビデオデータやオーディオデータ等を記録する記憶媒体としてハードディスクを有する。

記録再生部５３３は、例えば、オーディオデコーダ５２４より供給されるオーディオデータを、エンコーダ５５１によりMPEG方式でエンコードする。また、記録再生部５３３は、ディスプレイコンバータ５３０のビデオエンコーダ５４１より供給されるビデオデータを、エンコーダ５５１によりMPEG方式でエンコードする。記録再生部５３３は、そのオーディオデータの符号化データとビデオデータの符号化データとをマルチプレクサにより合成する。記録再生部５３３は、その合成データをチャネルコーディングして増幅し、そのデータを、記録ヘッドを介してハードディスクに書き込む。

記録再生部５３３は、再生ヘッドを介してハードディスクに記録されているデータを再生し、増幅し、デマルチプレクサによりオーディオデータとビデオデータに分離する。記録再生部５３３は、デコーダ５５２によりオーディオデータおよびビデオデータをMPEG方式でデコードする。記録再生部５３３は、復号したオーディオデータをD/A変換し、モニタ５６０のスピーカに出力する。また、記録再生部５３３は、復号したビデオデータをD/A変換し、モニタ５６０のディスプレイに出力する。

レコーダ制御部５２６は、受信部５２１を介して受信されるリモートコントローラからの赤外線信号により示されるユーザ指示に基づいて、EPGデータメモリ５２７から最新のEPGデータを読み出し、それをOSD制御部５３１に供給する。OSD制御部５３１は、入力されたEPGデータに対応する画像データを発生し、ディスプレイ制御部５３２に出力する。ディスプレイ制御部５３２は、OSD制御部５３１より入力されたビデオデータをモニタ５６０のディスプレイに出力し、表示させる。これにより、モニタ５６０のディスプレイには、EPG（電子番組ガイド）が表示される。

また、ハードディスクレコーダ５００は、インターネット等のネットワークを介して他の装置から供給されるビデオデータ、オーディオデータ、またはEPGデータ等の各種データを取得することができる。

通信部５３５は、レコーダ制御部５２６に制御され、ネットワークを介して他の装置から送信されるビデオデータ、オーディオデータ、およびEPGデータ等の符号化データを取得し、それをレコーダ制御部５２６に供給する。レコーダ制御部５２６は、例えば、取得したビデオデータやオーディオデータの符号化データを記録再生部５３３に供給し、ハードディスクに記憶させる。このとき、レコーダ制御部５２６および記録再生部５３３が、必要に応じて再エンコード等の処理を行うようにしてもよい。

また、レコーダ制御部５２６は、取得したビデオデータやオーディオデータの符号化データを復号し、得られるビデオデータをディスプレイコンバータ５３０に供給する。ディスプレイコンバータ５３０は、ビデオデコーダ５２５から供給されるビデオデータと同様に、レコーダ制御部５２６から供給されるビデオデータを処理し、ディスプレイ制御部５３２を介してモニタ５６０に供給し、その画像を表示させる。

また、この画像表示に合わせて、レコーダ制御部５２６が、復号したオーディオデータを、D/Aコンバータ５３４を介してモニタ５６０に供給し、その音声をスピーカから出力させるようにしてもよい。

さらに、レコーダ制御部５２６は、取得したEPGデータの符号化データを復号し、復号したEPGデータをEPGデータメモリ５２７に供給する。

以上のようなハードディスクレコーダ５００は、ビデオデコーダ５２５、デコーダ５５２、およびレコーダ制御部５２６に内蔵されるデコーダとして画像復号装置２０１を用いる。したがって、ビデオデコーダ５２５、デコーダ５５２、およびレコーダ制御部５２６に内蔵されるデコーダは、画像復号装置２０１の場合と同様に、画面全体における画質劣化を最小限にするともに、ローカルな画質劣化を改善することができる。

したがって、ハードディスクレコーダ５００は、処理の高速化を実現するとともに、精度の高い予測画像を生成することができる。その結果として、ハードディスクレコーダ５００は、例えば、チューナを介して受信されたビデオデータの符号化データや、記録再生部５３３のハードディスクから読み出されたビデオデータの符号化データや、ネットワークを介して取得したビデオデータの符号化データから、より高精細な復号画像を得て、モニタ５６０に表示させることができる。

また、ハードディスクレコーダ５００は、エンコーダ５５１として画像符号化装置１０１を用いる。したがって、エンコーダ５５１は、画像符号化装置１０１の場合と同様に、画面全体における画質劣化を最小限にするともに、ローカルな画質劣化を改善することができる。

したがって、ハードディスクレコーダ５００は、例えば、処理の高速化を実現するとともに、ハードディスクに記録する符号化データの符号化効率を向上させることができる。その結果として、ハードディスクレコーダ５００は、ハードディスクの記憶領域をより効率よく使用することができる。

なお、以上においては、ビデオデータやオーディオデータをハードディスクに記録するハードディスクレコーダ５００について説明したが、もちろん、記録媒体はどのようなものであってもよい。例えばフラッシュメモリ、光ディスク、またはビデオテープ等、ハードディスク以外の記録媒体を適用するレコーダであっても、上述したハードディスクレコーダ５００の場合と同様に、画像符号化装置１０１および画像復号装置２０１を適用することができる。

［カメラの構成例］
図３８は、本発明を適用した画像復号装置および画像符号化装置を用いるカメラの主な構成例を示すブロック図である。

図３８に示されるカメラ６００は、被写体を撮像し、被写体の画像をLCD６１６に表示させたり、それを画像データとして、記録メディア６３３に記録したりする。

レンズブロック６１１は、光（すなわち、被写体の映像）を、CCD/CMOS６１２に入射させる。CCD/CMOS６１２は、CCDまたはCMOSを用いたイメージセンサであり、受光した光の強度を電気信号に変換し、カメラ信号処理部６１３に供給する。

カメラ信号処理部６１３は、CCD/CMOS６１２から供給された電気信号を、Ｙ，Ｃｒ，Ｃｂの色差信号に変換し、画像信号処理部６１４に供給する。画像信号処理部６１４は、コントローラ６２１の制御の下、カメラ信号処理部６１３から供給された画像信号に対して所定の画像処理を施したり、その画像信号をエンコーダ６４１で例えばMPEG方式により符号化したりする。画像信号処理部６１４は、画像信号を符号化して生成した符号化データを、デコーダ６１５に供給する。さらに、画像信号処理部６１４は、オンスクリーンディスプレイ（OSD）６２０において生成された表示用データを取得し、それをデコーダ６１５に供給する。

以上の処理において、カメラ信号処理部６１３は、バス６１７を介して接続されるDRAM（Dynamic Random Access Memory）６１８を適宜利用し、必要に応じて画像データや、その画像データが符号化された符号化データ等をそのDRAM６１８に保持させる。

デコーダ６１５は、画像信号処理部６１４から供給された符号化データを復号し、得られた画像データ（復号画像データ）をLCD６１６に供給する。また、デコーダ６１５は、画像信号処理部６１４から供給された表示用データをLCD６１６に供給する。LCD６１６は、デコーダ６１５から供給された復号画像データの画像と表示用データの画像を適宜合成し、その合成画像を表示する。

オンスクリーンディスプレイ６２０は、コントローラ６２１の制御の下、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを、バス６１７を介して画像信号処理部６１４に出力する。

コントローラ６２１は、ユーザが操作部６２２を用いて指令した内容を示す信号に基づいて、各種処理を実行するとともに、バス６１７を介して、画像信号処理部６１４、DRAM６１８、外部インタフェース６１９、オンスクリーンディスプレイ６２０、およびメディアドライブ６２３等を制御する。FLASH ROM６２４には、コントローラ６２１が各種処理を実行する上で必要なプログラムやデータ等が格納される。

例えば、コントローラ６２１は、画像信号処理部６１４やデコーダ６１５に代わって、DRAM６１８に記憶されている画像データを符号化したり、DRAM６１８に記憶されている符号化データを復号したりすることができる。このとき、コントローラ６２１は、画像信号処理部６１４やデコーダ６１５の符号化・復号方式と同様の方式によって符号化・復号処理を行うようにしてもよいし、画像信号処理部６１４やデコーダ６１５が対応していない方式により符号化・復号処理を行うようにしてもよい。

また、例えば、操作部６２２から画像印刷の開始が指示された場合、コントローラ６２１は、DRAM６１８から画像データを読み出し、それを、バス６１７を介して外部インタフェース６１９に接続されるプリンタ６３４に供給して印刷させる。

さらに、例えば、操作部６２２から画像記録が指示された場合、コントローラ６２１は、DRAM６１８から符号化データを読み出し、それを、バス６１７を介してメディアドライブ６２３に装着される記録メディア６３３に供給して記憶させる。

記録メディア６３３は、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアである。記録メディア６３３は、もちろん、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であっても良い。

また、メディアドライブ６２３と記録メディア６３３を一体化し、例えば、内蔵型ハードディスクドライブやSSD（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

外部インタフェース６１９は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタ６３４と接続される。また、外部インタフェース６１９には、必要に応じてドライブ６３１が接続され、磁気ディスク、光ディスク、あるいは光磁気ディスクなどのリムーバブルメディア６３２が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、FLASH ROM６２４にインストールされる。

さらに、外部インタフェース６１９は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。コントローラ６２１は、例えば、操作部６２２からの指示に従って、DRAM６１８から符号化データを読み出し、それを外部インタフェース６１９から、ネットワークを介して接続される他の装置に供給させることができる。また、コントローラ６２１は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース６１９を介して取得し、それをDRAM６１８に保持させたり、画像信号処理部６１４に供給したりすることができる。

以上のようなカメラ６００は、デコーダ６１５として画像復号装置２０１を用いる。したがって、デコーダ６１５は、画像復号装置２０１の場合と同様に、画面全体における画質劣化を最小限にするともに、ローカルな画質劣化を改善することができる。

したがって、カメラ６００は、精度の高い予測画像を生成することができる。その結果として、カメラ６００は、例えば、CCD/CMOS６１２において生成された画像データや、DRAM６１８または記録メディア６３３から読み出されたビデオデータの符号化データや、ネットワークを介して取得したビデオデータの符号化データから、より高速に、より高精細な復号画像を得て、LCD６１６に表示させることができる。

また、カメラ６００は、エンコーダ６４１として画像符号化装置１０１を用いる。したがって、エンコーダ６４１は、画像符号化装置１０１の場合と同様に、画面全体における画質劣化を最小限にするともに、ローカルな画質劣化を改善することができる。

したがって、カメラ６００は、例えば、ハードディスクに記録する符号化データの符号化効率を向上させることができる。その結果として、カメラ６００は、より高速に、DRAM６１８や記録メディア６３３の記憶領域をより効率よく使用することができる。

なお、コントローラ６２１が行う復号処理に画像復号装置２０１の復号方法を適用するようにしてもよい。同様に、コントローラ６２１が行う符号化処理に画像符号化装置１０１の符号化方法を適用するようにしてもよい。

また、カメラ６００が撮像する画像データは動画像であってもよいし、静止画像であってもよい。

もちろん、画像符号化装置１０１および画像復号装置２０１は、上述した装置以外の装置やシステムにも適用可能である。

１６可逆符号化部，２１デブロックフィルタ，２４イントラ予測部，４２可逆復号部，４６デブロックフィルタ，５１イントラ予測部，１０１画像符号化装置，１１１適応ループフィルタ，１１２予測モードバッファ，１３１クラス分類部，１３２−１，１３２−２フィルタ係数算出部，１３３−１，１３３−２フィルタ処理部，２０１画像復号装置，２１１適応ループフィルタ，２１２予測モードバッファ，２３１−１，２３１−２フィルタ係数バッファ，２３２クラス分類部，２３３−１，２３３−２フィルタ処理部

Claims

画像を、所定のブロック毎に、イントラ予測モード情報に応じてクラス分類する分類手段と、
前記分類手段によりクラス分類された各所定のブロックに対して、同じクラスにクラス分類された前記所定のブロックを用いて算出されたフィルタ係数を用いてフィルタ処理を行うフィルタ処理手段と
を備える画像処理装置。
前記所定のブロックは、マクロブロックであり、
前記分類手段は、前記イントラ予測モード情報のうち、前記マクロブロックに対する予測ブロックサイズに応じて、前記マクロブロック毎に画像をクラス分類する
請求項１に記載の画像処理装置。
前記分類手段は、前記マクロブロックに対する予測ブロックサイズが、符号化規格で規定されているマクロブロックサイズより大きいか、小さいかに応じて、前記マクロブロック毎に画像をクラス分類する
請求項２に記載の画像処理装置。
前記分類手段は、イントラ１６×１６予測モードで符号化されるマクロブロックについては、平坦領域に含まれるマクロブロックとしてクラス分類する
請求項３に記載の画像処理装置。
前記分類手段は、前記イントラ１６×１６予測モードよりも小さいブロックサイズのイントラ予測モードで符号化されるマクロブロックについては、エッジもしくはテクスチャが含まれるマクロブロックとしてクラス分類する
請求項３に記載の画像処理装置。
前記分類手段は、イントラ１６×１６予測モードよりも大きいブロックサイズのイントラ予測モードで符号化されるマクロブロックについては、平坦領域に含まれるマクロブロックとしてクラス分類する
請求項３に記載の画像処理装置。
前記所定のブロックは、マクロブロックまたは前記マクロブロックを構成する各ブロックであり、
前記分類手段は、前記イントラに関する予測モード情報のうち、同一予測ブロックサイズにおける前記マクロブロックまたはブロックに対する予測モードの種類に応じて、前記マクロブロックまたはブロック毎に画像をクラス分類する
請求項１に記載の画像処理装置。
前記分類手段は、垂直予測モードと水平予測モードで符号化されるマクロブロックまたはブロックについては、エッジもしくはテクスチャが含まれるマクロブロックまたはブロックとしてクラス分類する
請求項７に記載の画像処理装置。
前記分類手段は、垂直予測モードと水平予測モード以外の予測モードで符号化されるマクロブロックまたはブロックについては、エッジもしくはテクスチャが含まれるマクロブロックまたはブロックとしてクラス分類する
請求項７に記載の画像処理装置。
前記同じクラスにクラス分類された前記所定のブロックを用いて前記フィルタ係数を算出するフィルタ係数算出手段
をさらに備える請求項１に記載の画像処理装置。
前記画像のビットストリームと、前記イントラ予測に関するモードを示す情報と、前記フィルタ係数算出手段により算出されたフィルタ係数とを伝送する伝送手段
をさらに備える請求項１０に記載の画像処理装置。
前記画像のビットストリームと、前記イントラ予測に関するモードを示す情報と、前記フィルタ係数とを受け取る受け取り手段
をさらに備える請求項１に記載の画像処理装置。
分類手段と、フィルタ処理手段とを備える画像処理装置の画像処理方法において、
前記分類手段が、画像を、所定のブロック毎に、イントラ予測モード情報に応じてクラス分類し、
前記フィルタ処理手段が、
クラス分類された各所定のブロックに対して、同じクラスにクラス分類された前記所定のブロックを用いて算出されたフィルタ係数を用いてフィルタ処理を行う
画像処理方法。