JP2012085211A

JP2012085211A - 画像処理装置および方法、並びにプログラム

Info

Publication number: JP2012085211A
Application number: JP2010231591A
Authority: JP
Inventors: Kazufumi Sato; 数史佐藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2010-10-14
Filing date: 2010-10-14
Publication date: 2012-04-26
Also published as: CN103155564A; US20130170542A1; BR112013008418A2; WO2012050021A1

Abstract

【課題】画像符号化の負荷を低減させることができるようにする。
【解決手段】フィルタ制御部５０１は、適応ループフィルタ処理対象の画像のタイプに関する情報に基づいて、適応ループフィルタのオン／オフを決定する。ON/OFF部５１１は、フィルタ制御部５０１から供給されるON/OFF情報の値に従って、フィルタ係数算出部５１２の動作を制御する。フィルタ係数算出部５１２は、ON/OFFフラグがオンである場合、適応ループフィルタ処理のフィルタ係数を算出する。フィルタリング部５１３は、そのフィルタ係数を用いて、デブロックフィルタ１１１から供給されるデブロックフィルタ処理後の画像に対して、適応ループフィルタ処理を行う。本発明は、例えば、画像処理装置に適用することができる。
【選択図】図１１

Description

本発明は、画像処理装置および方法、並びにプログラムに関し、特に、画像符号化の負荷を低減させることができるようにした画像処理装置および方法、並びにプログラムに関する。

近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEG（Moving Picture Experts Group）などの方式に準拠した装置が、放送局などの情報配信、及び一般家庭における情報受信の双方において普及しつつある。

特に、MPEG2（ISO（International Organization for Standardization）/IEC（International Electrotechnical Commission） 13818-2）は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば７２０×４８０画素を持つ標準解像度の飛び越し走査画像であれば４Mbps乃至８Mbpsの符号量（ビットレート）、１９２０×１０８８画素を持つ高解像度の飛び越し走査画像であれば１８Mbps乃至２２Mbpsの符号量（ビットレート）を割り当てることで、高い圧縮率と良好な画質の実現が可能である。

MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、１９９８年１２月にISO/IEC 14496-2としてその規格が国際標準に承認された。

更に、近年、当初テレビ会議用の画像符号化を目的として、H.26L （ITU-T（International Telecommunication Union Telecommunication Standardization Sector） Q6/16 VCEG（Video Coding Expert Group））という標準の規格化が進んでいる。H.26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH.26Lをベースに、H.26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われている。

標準化のスケジュールとしては、２００３年３月にはH.264及びMPEG-4 Part10 （Advanced Video Coding、以下AVCと記す）という名の元に国際標準となった。

更に、その拡張として、RGBや4:2:2、4:4:4といった、業務用に必要な符号化ツールや、MPEG2で規定されていた８×８DCTや量子化マトリクスをも含んだFRExt（Fidelity Range Extension）の標準化が２００５年２月に完了し、これにより、AVCを用いて、映画に含まれるフィルムノイズをも良好に表現することが可能な符号化方式となって、Blu-Ray Disc等の幅広いアプリケーションに用いられる運びとなった。

しかしながら、昨今、ハイビジョン画像の４倍の、４０９６×２０４８画素程度の画像を圧縮したい、或いは、インターネットのような、限られた伝送容量の環境において、ハイビジョン画像を配信したいといった、更なる高圧縮率符号化に対するニーズが高まっている。このため、先述の、ITU-T傘下のVCEGにおいて、符号化効率の改善に関する検討が継続され行なわれている。

ところで、4000×2000画素といった、更に高い解像度の画像の伝送や、既存のハイビジョン画像を、インターネットのような限られたバンド幅の回線において伝送する場合、AVCにより実現される圧縮率ではまだ不十分である。このため、ITU-T傘下のVCEG（Video Coding Expert Group）という団体において、更なる符号化効率の改善が行なわれている（例えば非特許文献１参照）。

かかる符号化効率改善の１手法として、非特許文献１において、適応ループフィルタ（ALF（Adaptive Loop Filter））という手法が提案されている。

Takeshi. Chujoh, et al., "Block-based Adaptive Loop Filter" ITU-T SG16 Q6 VCEG Contribution, AI18, Germany, July, 2008

しかしながら、当該シーケンスに含まれる、全てのピクチャやスライスに対し、非特許文献１において提案されている適応ループフィルタを適用するには、多大な演算量が必要となり、画像符号化処理の負荷が増大する恐れがあった。

本発明は、このような状況に鑑みてなされたものであり、画質劣化の増大を抑制しながら適応ループフィルタの負荷を低減させることにより、この適応ループフィルタ処理を行うことによる画像符号化処理の負荷の増大を抑制することができるようにすることを目的とする。

本発明の一側面は、画像データに対して行われる適応フィルタ処理の動作を、前記画像データが他の画像データから参照されるか否かに応じて制御するフィルタ制御手段と、動き補償ループ内において、前記フィルタ制御手段により制御されて、前記画像データに対して前記適応フィルタ処理を行うフィルタ処理手段とを備える画像処理装置である。

前記フィルタ制御手段は、前記画像データの符号化処理において、前記適応フィルタ処理の対象となる前記画像データが前記他の画像データから参照される場合、前記適応フィルタ処理が行われるように制御し、前記画像データの符号化処理において、前記適応フィルタ処理の対象となる前記画像データが前記他の画像データから参照されない場合、前記適応フィルタ処理が行われないように制御することができる。

前記画像データはピクチャ単位のデータであり、前記フィルタ制御手段は、前記ピクチャのタイプに応じて、前記画像データに対する前記適応フィルタ処理の動作を制御することができる。

前記フィルタ制御手段は、前記画像データがＩピクチャである場合、前記適応フィルタ処理が行われるように制御し、前記画像データがＰピクチャおよびＢピクチャである場合、前記適応フィルタ処理が行われないように制御することができる。

前記フィルタ制御手段は、前記画像データがＩピクチャもしくはＰピクチャである場合、前記適応フィルタ処理が行われるように制御し、前記画像データがＢピクチャである場合、前記適応フィルタ処理が行われないように制御することができる。

前記フィルタ制御手段は、前記画像データが、階層Ｂピクチャを含む画像データのＩピクチャ、Ｐピクチャ、若しくは、参照されるＢピクチャである場合、前記適応フィルタ処理が行われるように制御し、前記画像データが、階層Ｂピクチャを含む画像データの参照されないＢピクチャである場合、前記適応フィルタ処理が行われないように制御することができる。

前記画像データはスライス単位のデータであり、前記フィルタ制御手段は、前記スライスのタイプに応じて、前記画像データに対する前記適応フィルタ処理の動作を制御することができる。

前記フィルタ制御手段は、前記画像データがＩスライスである場合、前記適応フィルタ処理が行われるように制御し、前記画像データがＰスライスおよびＢスライスである場合、前記適応フィルタ処理が行われないように制御することができる。

前記フィルタ制御手段は、前記画像データがＩスライスもしくはＰスライスである場合、前記適応フィルタ処理が行われるように制御し、前記画像データがＢピクチャである場合、前記適応フィルタ処理が行われないように制御することができる。

前記フィルタ制御手段は、前記画像データが、階層Ｂスライスを含む画像データのＩスライス、Ｐスライス、若しくは、参照されるＢスライスである場合、前記適応フィルタ処理が行われるように制御し、前記画像データが、階層Ｂピクチャを含む画像データの参照されないＢスライスである場合、前記適応フィルタ処理が行われないように制御することができる。

前記適応フィルタ処理された画像データを符号化する符号化手段をさらに備え、前記符号化手段は、前記適応フィルタ処理のフィルタ係数および前記適応フィルタ処理を行う否かを示すフラグ情報を符号化し、前記画像データの符号化データに付加することができる。

前記フィルタ制御手段は、前記画像データが他の画像データから参照されるか否かに応じて、前記適応フィルタ処理のフィルタ係数のタップ長を制御し、前記フィルタ処理手段は、前記フィルタ制御手段により制御されたタップ長のフィルタ係数を用いて、前記画像データに対して前記適応フィルタ処理を行うことができる。

前記フィルタ制御手段は、前記画像データの符号化処理において、前記適応フィルタ処理の対象となる前記画像データが前記他の画像データから参照される場合、前記タップ長を長くするように制御し、前記画像データの符号化処理において、前記適応フィルタ処理の対象となる前記画像データが前記他の画像データから参照されない場合、前記タップ長を短くするように制御することができる。

本発明の一側面は、また、画像処理装置のフィルタ制御手段が、画像データに対して行われる適応フィルタ処理の動作を、前記画像データが他の画像データから参照されるか否かに応じて制御し、前記画像処理装置のフィルタ処理手段が、動き補償ループ内において、前記画像データに対して前記適応フィルタ処理を行う画像処理方法である。

本発明の一側面は、さらに、コンピュータを、画像データに対して行われる適応フィルタ処理の動作を、前記画像データが他の画像データから参照されるか否かに応じて制御するフィルタ制御手段、動き補償ループ内において、前記フィルタ制御手段により制御されて、前記画像データに対して前記適応フィルタ処理を行うフィルタ処理手段として機能させるためのプログラムである。

本発明の一側面においては、画像データに対して行われる適応フィルタ処理の動作が、画像データの、所定のデータ単位毎の種類に応じて制御され、動き補償ループ内において、画像データに対して適応フィルタ処理が行われる。

本発明によれば、画像を処理することができる。特に、画質劣化の増大を抑制しながら画像符号化処理の負荷を低減させることができる。

AVC符号化方式に基づく画像圧縮情報を出力する画像符号化装置を示すブロック図である。 AVC符号化方式に基づく画像圧縮情報を入力とする画像復号装置を示すブロック図である。デブロックフィルタの動作原理を説明する図である。 Bsの定義の方法を説明する図である。デブロックフィルタの動作原理を説明する図である。 indexAおよびindexBとαおよびβの値の対応関係の例を示す図である。 BsおよびindexAとtC0との対応関係の例を示す図である。適応ループフィルタを適用した画像符号化装置の一部の構成例を示すブロック図である。適応ループフィルタを適用した画像復号装置の一部の構成例を示すブロック図である。本発明を適用した画像符号化装置の主な構成例を示すブロック図である。適応ループフィルタの主な構成例を示すブロック図である。適応ループフィルタのＯＮ／ＯＦＦ制御の様子の例を説明する図である。適応ループフィルタのＯＮ／ＯＦＦ制御の様子の、他の例を説明する図である。スライスヘッダのシンタックスの例を説明する図である。適応ループフィルタのパラメータのシンタックスの例を説明する図である。適応ループフィルタのパラメータのシンタックスの例を説明する、図１５に続く図である。適応ループフィルタのパラメータのシンタックスの例を説明する、図１６に続く図である。符号化処理の流れの例を説明するフローチャートである。適応ループフィルタ処理の流れの例を説明するフローチャートである。適応ループフィルタの他の構成例を示すブロック図である。適応ループフィルタ処理の流れの、他の例を説明するフローチャートである。マクロブロックの例を説明する図である。本発明を適用したパーソナルコンピュータの主な構成例を示すブロック図である。本発明を適用したテレビジョン受像機の主な構成例を示すブロック図である。本発明を適用した携帯電話機の主な構成例を示すブロック図である。本発明を適用したハードディスクレコーダの主な構成例を示すブロック図である。本発明を適用したカメラの主な構成例を示すブロック図である。

以下、発明を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
１．第１の実施の形態（画像符号化装置）
２．第２の実施の形態（画像符号化装置）
３．第３の実施の形態（パーソナルコンピュータ）
４．第４の実施の形態（テレビジョン受像機）
５．第５の実施の形態（携帯電話機）
６．第６の実施の形態（ハードディスクレコーダ）
７．第７の実施の形態（カメラ）

＜１．第１の実施の形態＞
［AVC符号化方式の画像符号化装置］
図１は、AVC符号化方式により画像を符号化する画像符号化装置の一実施の形態の構成を表している。

図１に示される画像符号化装置１００は、AVC規格に基づいた符号化方式で画像を符号化し、出力する装置である。図１に示されるように、画像符号化装置１００は、A／D変換部１０１、画面並べ替えバッファ１０２、演算部１０３、直交変換部１０４、量子化部１０５、可逆符号化部１０６、および蓄積バッファ１０７を有する。また、画像符号化装置１００は、逆量子化部１０８、逆直交変換部１０９、演算部１１０、デブロックフィルタ１１１、フレームメモリ１１２、選択部１１３、イントラ予測部１１４、動き予測・補償部１１５、選択部１１６、およびレート制御部１１７を有する。

A/D変換部１０１は、入力された画像データをA/D変換し、画面並べ替えバッファ１０２に出力し、記憶させる。画面並べ替えバッファ１０２は、記憶した表示の順番のフレームの画像を、GOP（Group of Picture）構造に応じて、符号化のためのフレームの順番に並べ替える。画面並べ替えバッファ１０２は、フレームの順番を並び替えた画像を、演算部１０３に供給する。また、画面並べ替えバッファ１０２は、フレームの順番を並び替えた画像を、イントラ予測部１１４および動き予測・補償部１１５にも供給する。

演算部１０３は、画面並べ替えバッファ１０２から読み出された画像から、選択部１１６を介してイントラ予測部１１４若しくは動き予測・補償部１１５から供給される予測画像を減算し、その差分情報を直交変換部１０４に出力する。

例えば、イントラ符号化が行われる画像の場合、演算部１０３は、画面並べ替えバッファ１０２から読み出された画像から、イントラ予測部１１４から供給される予測画像を減算する。また、例えば、インター符号化が行われる画像の場合、演算部１０３は、画面並べ替えバッファ１０２から読み出された画像から、動き予測・補償部１１５から供給される予測画像を減算する。

直交変換部１０４は、演算部１０３から供給される差分情報に対して、離散コサイン変換、カルーネン・レーベ変換等の直交変換を施し、その変換係数を量子化部１０５に供給する。

量子化部１０５は、直交変換部１０４が出力する変換係数を量子化する。量子化部１０５は、レート制御部１１７から供給される符号量の目標値に関する情報に基づいて量子化パラメータを設定し、量子化を行う。量子化部１０５は、量子化された変換係数を可逆符号化部１０６に供給する。

可逆符号化部１０６は、その量子化された変換係数に対して、可変長符号化、算術符号化等の可逆符号化を施す。係数データは、レート制御部１１７の制御の下で量子化されているので、この符号量は、レート制御部１１７が設定した目標値となる（若しくは目標値に近似する）。

可逆符号化部１０６は、イントラ予測を示す情報などをイントラ予測部１１４から取得し、インター予測モードを示す情報や動きベクトル情報などを動き予測・補償部１１５から取得する。なお、イントラ予測（画面内予測）を示す情報は、以下、イントラ予測モード情報とも称する。また、インター予測（画面間予測）を示す情報モードを示す情報は、以下、インター予測モード情報とも称する。

可逆符号化部１０６は、量子化された変換係数を符号化するとともに、フィルタ係数、イントラ予測モード情報、インター予測モード情報、および量子化パラメータなどの各種情報を、符号化データのヘッダ情報の一部とする（多重化する）。可逆符号化部１０６は、符号化して得られた符号化データを蓄積バッファ１０７に供給して蓄積させる。

例えば、可逆符号化部１０６においては、可変長符号化または算術符号化等の可逆符号化処理が行われる。可変長符号化としては、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）などがあげられる。算術符号化としては、CABAC（Context-Adaptive Binary Arithmetic Coding）などがあげられる。

蓄積バッファ１０７は、可逆符号化部１０６から供給された符号化データを、一時的に保持し、所定のタイミングにおいて、H．264/AVC方式で符号化された符号化画像として、例えば、後段の図示せぬ記録装置や伝送路などに出力する。

また、量子化部１０５において量子化された変換係数は、逆量子化部１０８にも供給される。逆量子化部１０８は、その量子化された変換係数を、量子化部１０５による量子化に対応する方法で逆量子化する。逆量子化部１０８は、得られた変換係数を、逆直交変換部１０９に供給する。

逆直交変換部１０９は、供給された変換係数を、直交変換部１０４による直交変換処理に対応する方法で逆直交変換する。逆直交変換された出力（復元された差分情報）は、演算部１１０に供給される。

演算部１１０は、逆直交変換部１０９より供給された逆直交変換結果、すなわち、復元された差分情報に、選択部１１６を介してイントラ予測部１１４若しくは動き予測・補償部１１５から供給される予測画像を加算し、局部的に復号された画像（復号画像）を得る。

例えば、差分情報が、イントラ符号化が行われる画像に対応する場合、演算部１１０は、その差分情報にイントラ予測部１１４から供給される予測画像を加算する。また、例えば、差分情報が、インター符号化が行われる画像に対応する場合、演算部１１０は、その差分情報に動き予測・補償部１１５から供給される予測画像を加算する。

その加算結果は、デブロックフィルタ１１１またはフレームメモリ１１２に供給される。

デブロックフィルタ１１１は、適宜デブロックフィルタ処理を行うことにより復号画像のブロック歪を除去するとともに、例えばウィナーフィルタ（Wiener Filter）を用いて適宜ループフィルタ処理を行うことにより画質改善を行う。デブロックフィルタ１１１は、各画素をクラス分類し、クラスごとに適切なフィルタ処理を施す。デブロックフィルタ１１１は、そのフィルタ処理結果をフレームメモリ１１２に供給する。

フレームメモリ１１２は、所定のタイミングにおいて、蓄積されている参照画像を、選択部１１３を介してイントラ予測部１１４または動き予測・補償部１１５に出力する。

例えば、イントラ符号化が行われる画像の場合、フレームメモリ１１２は、参照画像を、選択部１１３を介してイントラ予測部１１４に供給する。また、例えば、インター符号化が行われる場合、フレームメモリ１１２は、参照画像を、選択部１１３を介して動き予測・補償部１１５に供給する。

選択部１１３は、フレームメモリ１１２から供給される参照画像がイントラ符号化を行う画像である場合、その参照画像をイントラ予測部１１４に供給する。また、選択部１１３は、フレームメモリ１１２から供給される参照画像がインター符号化を行う画像である場合、その参照画像を動き予測・補償部１１５に供給する。

イントラ予測部１１４は、画面内の画素値を用いて予測画像を生成するイントラ予測（画面内予測）を行う。イントラ予測部１１４は、複数のモード（イントラ予測モード）によりイントラ予測を行う。

H.264画像情報符号化方式において、輝度信号に対しては、イントラ4×4予測モード、イントラ8×8予測モード及びイントラ16×16予測モードが定義されており、また、色差信号に関しては、それぞれのマクロブロックごとに、輝度信号とは独立した予測モードを定義することが可能である。イントラ4×4予測モードについては、それぞれの4×4輝度ブロックに対して、イントラ8×8予測モードについては、それぞれの8×8輝度ブロックに対して、１つのイントラ予測モードが定義されることになる。イントラ16×16予測モード、並びに、色差信号に対しては、１つのマクロブロックに対して、それぞれ１つの予測モードが定義されることになる。

イントラ予測部１１４は、全てのイントラ予測モードで予測画像を生成し、各予測画像を評価し、最適なモードを選択する。イントラ予測部１１４は、最適なイントラ予測モードを選択すると、その最適なモードで生成された予測画像を、選択部１１６を介して演算部１０３や演算部１１０に供給する。

また、上述したように、イントラ予測部１１４は、採用したイントラ予測モードを示すイントラ予測モード情報等の情報を、適宜可逆符号化部１０６に供給する。

動き予測・補償部１１５は、インター符号化が行われる画像について、画面並べ替えバッファ１０２から供給される入力画像と、選択部１１３を介してフレームメモリ１１２から供給される参照画像とを用いて、動き予測を行い、検出された動きベクトルに応じて動き補償処理を行い、予測画像（インター予測画像情報）を生成する。

動き予測・補償部１１５は、候補となる全てのインター予測モードのインター予測処理を行い、予測画像を生成する。動き予測・補償部１１５は、生成された予測画像を、選択部１１６を介して演算部１０３や演算部１１０に供給する。

また、動き予測・補償部１１５は、採用されたインター予測モードを示すインター予測モード情報や、算出した動きベクトルを示す動きベクトル情報を可逆符号化部１０６に供給する。

選択部１１６は、イントラ符号化を行う画像の場合、イントラ予測部１１４の出力を演算部１０３や演算部１１０に供給し、インター符号化を行う画像の場合、動き予測・補償部１１５の出力を演算部１０３や演算部１１０に供給する。

レート制御部１１７は、蓄積バッファ１０７に蓄積された圧縮画像に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。

［AVC符号化方式の画像復号装置］
図２は、離散コサイン変換若しくはカルーネン・レーベ変換等の直交変換と動き補償により画像圧縮を実現する画像復号装置の主な構成例を示すブロック図である。図９に示される画像復号装置２００は、画像符号化装置１００に対応する復号装置である。

画像符号化装置１００より符号化された符号化データは、例えば、所定の伝送路を介して、この画像符号化装置１００に対応する画像復号装置２００に供給され、復号される。

図２に示されるように、画像復号装置２００は、蓄積バッファ２０１、可逆復号部２０２、逆量子化部２０３、逆直交変換部２０４、演算部２０５、デブロックフィルタ２０６、画面並べ替えバッファ２０７、およびD/A変換部２０８を有する。また、画像復号装置２００は、フレームメモリ２０９、選択部２１０、イントラ予測部２１１、動き予測・補償部２１２、および選択部２１３を有する。

蓄積バッファ２０１は、伝送されてきた符号化データを蓄積する。この符号化データは、画像符号化装置１００により符号化されたものである。可逆復号部２０２は、蓄積バッファ２０１から所定のタイミングで読み出された符号化データを、図１の可逆符号化部１０６の符号化方式に対応する方式で復号する。

また、当該フレームがイントラ符号化されたものである場合、符号化データのヘッダ部にはイントラ予測モード情報が格納されている。可逆復号部２０２は、このイントラ予測モード情報も復号し、その情報をイントラ予測部２１１に供給する。これに対して、当該フレームがインター符号化されたものである場合、符号化データのヘッダ部には動きベクトル情報が格納されている。可逆復号部２０２は、この動きベクトル情報も復号し、その情報を動き予測・補償部２１２に供給する。

逆量子化部２０３は、可逆復号部２０２により復号されて得られた係数データ（量子化係数）を、図１の量子化部１０５の量子化方式に対応する方式で逆量子化する。つまり、逆量子化部２０３は、図１の逆量子化部１０８と同様の方法で量子化係数の逆量子化を行う。

逆量子化部２０３は、逆量子化された係数データ、つまり、直交変換係数を、逆直交変換部２０４に供給する。逆直交変換部２０４は、図１の直交変換部１０４の直交変換方式に対応する方式（図１の逆直交変換部１０９と同様の方式）で、その直交変換係数を逆直交変換し、画像符号化装置１００において直交変換される前の残差データに対応する復号残差データを得る。

逆直交変換されて得られた復号残差データは、演算部２０５に供給される。また、演算部２０５には、選択部２１３を介して、イントラ予測部２１１若しくは動き予測・補償部２１２から予測画像が供給される。

演算部２０５は、その復号残差データと予測画像とを加算し、画像符号化装置１００の演算部１０３により予測画像が減算される前の画像データに対応する復号画像データを得る。演算部２０５は、その復号画像データをデブロックフィルタ２０６に供給する。

デブロックフィルタ２０６は、供給された復号画像のブロック歪を除去した後、画面並べ替えバッファ２０７に供給する。

画面並べ替えバッファ２０７は、画像の並べ替えを行う。すなわち、図１の画面並べ替えバッファ１０２により符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられる。D/A変換部２０８は、画面並べ替えバッファ２０７から供給された画像をD/A変換し、図示せぬディスプレイに出力し、表示させる。

デブロックフィルタ２０６の出力は、さらに、フレームメモリ２０９に供給される。

フレームメモリ２０９、選択部２１０、イントラ予測部２１１、動き予測・補償部２１２、および選択部２１３は、画像符号化装置１００のフレームメモリ１１２、選択部１１３、イントラ予測部１１４、動き予測・補償部１１５、および選択部１１６にそれぞれ対応する。

選択部２１０は、インター処理される画像と参照される画像をフレームメモリ２０９から読み出し、動き予測・補償部２１２に供給する。また、選択部２１０は、イントラ予測に用いられる画像をフレームメモリ２０９から読み出し、イントラ予測部２１１に供給する。

イントラ予測部２１１には、ヘッダ情報を復号して得られたイントラ予測モードを示す情報等が可逆復号部２０２から適宜供給される。イントラ予測部２１１は、この情報に基づいて、フレームメモリ２０９から取得した参照画像から予測画像を生成し、生成した予測画像を選択部２１３に供給する。

動き予測・補償部２１２は、ヘッダ情報を復号して得られた情報（予測モード情報、動きベクトル情報、参照フレーム情報、フラグ、および各種パラメータ等）を可逆復号部２０２から取得する。

動き予測・補償部２１２は、可逆復号部２０２から供給されるそれらの情報に基づいて、フレームメモリ２０９から取得した参照画像から予測画像を生成し、生成した予測画像を選択部２１３に供給する。

選択部２１３は、動き予測・補償部２１２またはイントラ予測部２１１により生成された予測画像を選択し、演算部２０５に供給する。

［直交変換］
ところで、AVC符号化方式においては、直交変換方式として、Baseline Profile、Extended Profile、Main Profileでは4×4直交変換のみ用いることが可能であり、High Profile以上においては、図３に示されるように、画面内で、4×4直交変換と、8×8直交変換を切り替えて用いることができる。

［デブロックフィルタ］
ところで、AVC符号化方式においては、図１及び図２に示された通り、ループ内にデブロックフィルタを含む。これにより、復号画像におけるブロック歪を除去すると共に、動き補償処理により、これを参照する画像に、ブロック歪が伝播するのを防ぐという効果を有する。

以下では、AVC符号化方式におけるデブロックフィルタにおける動作原理について述べる。

デブロックフィルタの処理としては、画像圧縮情報に含まれる、Picture Parameter Set RBSPに含まれるdeblocking_filter_control_present_flag、及び、Slice Headerに含まれるdisable_deblocking_filter_idcという２つのパラメータに拠って、以下の３通りが指定可能である。

（ａ）ブロック境界、及びマクロブロック境界に施す
（ｂ）Macroblock境界にのみ施す
（ｃ）施さない

量子化パラメータQPについては、以下の処理を輝度信号に対して適用する場合は、QP_Yを、色差信号に対して適用する場合はQP_Cを用いる。また、動きベクトル符号化、イントラ予測、エントロピー符号化（CAVLC/CABAC）においては、異なるスライスに属する画素値は"not available"（使用不可）として処理するが、デブロックフィルタ処理においては、異なるスライスに属する画素値でも、同一のピクチャに属する場合は"available"（使用可）であるとして処理を行う。

以下では、図３に示すように、デブロックフィルタ処理前の画素値をp0〜p3、q0〜q3とし、処理後の画素値をp0'〜p3'、q0'〜q3'とする。

デブロックフィルタ処理に先立ち、図３におけるp及びqに対して、図４に示されるように、Bs (Boundary Strength) が定義される。

図３における（p2,p1,p0,q0,q1,q2）は、以下の２つの条件（式（１）および式（２））が成立する場合のみ、デブロックフィルタ処理が施される。

Bs > 0 ・・・（１）
|p0-q0| < α; |p1-p0| < β; |q1-q0| < β ・・・（２）

式（２）のα、βは、デフォルトでは以下のようにQPに応じてその値が定められているが、画像亜圧縮情報中の（符号化データに含まれる）、スライスヘッダ（Slice Header）に含まれる、「slice_alpha_c0_offset_div2」及び「slice_beta_offset_div2」という２つのパラメータに拠って、図５に示される通り、ユーザがその強度を調整することができる。

図６において、indexAとindexBは以下の式（３）乃至式（５）のように定義される。

・・・（３）

・・・（４）

・・・（５）

上の式（３）乃至（５）において、「FilterOffsetA」及び「FilterOffsetB」が、ユーザによる調整分に相当する。

デブロックフィルタ処理は、以下のように（１）Bs<4の場合と（２）Bs=4の場合とで、異なる方法が定義されている。

Bs<4の場合、デブロックフィルタ処理後の画素値p'0及びq'0 は、以下の式（６）乃至式（８）のように求められる。

・・・（６）

・・・（７）

・・・（８）

ここで、t_cは以下のように算出される。すなわち、chromaEdgeFlagの値が０である場合、t_cは以下の式（９）のように算出される。それ以外の場合、t_cは、以下の式（１０）のように算出される。

・・・（９）

・・・（１０）

t_C0の値は、BsとindexAの値に応じて、図７に示される表のように定義される。また、a_p及びa_qの値は以下の式（１１）および式（１２）に示されるように算出される。

・・・（１１）

・・・（１２）

デブロックフィルタ処理後の画素値p'₁は、以下のように求められる。すなわち、chromaEdgeFlagの値が０であり、かつ、ａ_ｐの値がベータ以下である場合、p'₁は、以下の式（１３）のように算出される。また、この条件が満たされない場合、p'₁は、以下の式（１４）のように算出される。

・・・（１３）

・・・（１４）

デブロックフィルタ処理後の画素値q'₁は以下のように求められる。すなわち、chromaEdgeFlagの値が０であり、かつ、a_qの値がβ以下である場合、q'₁は以下の式（１５）のように算出される。また、この条件が満たされない場合、q'₁は、以下の式（１６）のように算出される。

・・・（１５）

・・・（１６）

p'₂及びq'₂の値については、Filtering前の値p₂及びq₂と変わらない。すなわち、p'₂及びq'₂は、以下の式（１７）および式（１８）のように求められる。

・・・（１７）

・・・（１８）

Bs=4の場合、デブロックフィルタ後の画素値p'_I（i=0..2）は以下のように求められる。すなわち、chromaEdgeFlagの値が０で、以下の条件（式（１９））が成り立つ場合、p'₀,p'₁,及びp'₂は、以下の式（２０）乃至式（２２）のように求められる。また、上述した条件が当てはまらない場合、p'₀,p'₁,及びp'₂は、以下の式（２３）乃至式（２５）のように算出される。

・・・（１９）

・・・（２０）

・・・（２１）

・・・（２２）

・・・（２３）

・・・（２４）

・・・（２５）

デブロックフィルタ処理後の画素値q'_ｉ（i=0..2）は、以下のように求められる。すなわち、chromaEdgeFlagの値が０であり、かつ、以下の条件（式（２６））が成り立つ場合、q'₀,q'₁,及びq'₂は、以下の式（２７）乃至式（２９）のように求められる。また、上述した条件が当てはまらない場合、q'₀,q'₁,及びq'₂は、以下の式（３０）乃至式（３２）のように算出される。

・・・（２６）

・・・（２７）

・・・（２８）

・・・（２９）

・・・（３０）

・・・（３１）

・・・（３２）

［ループフィルタ］
上述したように、符号化効率改善の１手法として、非特許文献１において、以下のような手法が提案されている。

図８は、非特許文献１において提案されている画像符号化装置の一部の構成例を示すブロック図である。この非特許文献１において提案されている画像符号化装置３００は、図１を参照して説明したAVC符号化方式で画像を符号化する画像符号化装置１００と基本的に同様の構成を有するが、図８に示されるように、さらにループフィルタ３０１を有する。

ループフィルタ３０１は、ウィナーフィルタ（Wiener Filter）であり、原画像との残差を最小にするようにループフィルタ係数を算出し、そのループフィルタ係数を用いて、デブロックフィルタ処理後の画素値をフィルタ処理し、そのフィルタ処理結果をフレームメモリ１１２に供給して格納させる。

また、このループフィルタ係数は、可逆符号化部１０６に供給されて符号化される（画像データの符号化データに付加される）。つまり、ループフィルタ係数は、画像復号装置に供給される。

図９は、図８の画像符号化装置３００に対応する画像復号装置の一部の構成例を示すブロック図である。画像復号装置４００は、図２を参照して説明したAVC符号化方式で符号化された画像である符号化データを復号する画像復号装置２００と基本的に同様の構成を有するが、図９に示されるように、さらにループフィルタ４０１を有する。

ループフィルタ４０１は、ウィナーフィルタ（Wiener Filter）であり、符号化データに付加されて画像符号化装置３００から供給されたループフィルタ係数を取得し、そのループフィルタ係数を用いて、デブロックフィルタ処理後の画素値をフィルタ処理し、そのフィルタ処理結果をフレームメモリ２０９等に供給する。

このようにすることにより、復号画像の画質を向上させることができる。更に、参照画像の画質も向上させることができる。

［予測モードの選択］
ところで、マクロブロックサイズを１６画素×１６画素とするのは、次世代符号化方式の対象となるような、UHD（Ultra High Definition；４０００画素×２０００画素）といった大きな画枠に対しては、最適ではない。そこで、マクロブロックサイズを、例えば、３２画素×３２画素、６４×６４画素といった大きさにすることが提案されている。

より高い符号化効率を達成するには、適切な予測モードの選択が重要である。例えば、High Complexity Modeと、Low Complexity Modeの２通りのモード判定方法を選択する方法が考えられる。この方法の場合、どちらも、それぞれの予測モードModeに関するコスト関数値を算出し、これを最小にする予測モードを当該ブロック乃至マクロブロックに対する最適モードとして選択する。

High Complexity Modeにおけるコスト関数は、以下の式（３３）のように求めることができる。

Cost（Mode∈Ω）＝Ｄ＋λ×Ｒ・・・（３３）

式（３３）において、Ωは、当該ブロック乃至マクロブロックを符号化するための候補
モードの全体集合である。また、Ｄは、当該予測モードModeで符号化した場合の、復号画像と入力画像の差分エネルギーである。さらに、λは、量子化パラメータの関数として与えられるLagrange未定乗数である。また、Ｒは、直交変換係数を含んだ、当該モードModeで符号化した場合の総符号量である。

つまり、High Complexity Modeでの符号化を行なうには、上記パラメータＤ及びＲを算出するため、全ての候補モードModeにより、一度、仮エンコード処理を行う必要があり、より高い演算量を要する。

これに対してLow Complexity Modeにおけるコスト関数は、以下の式（３４）のように求めることができる。

Cost（Mode∈Ω）＝Ｄ＋QP2Quant（QP）×HeaderBit ・・・（３４）

式（３４）において、Ｄは、High Complexity Modeの場合と異なり、予測画像と入力画像の差分エネルギーとなる。また、QP2Quant（QP）は、量子化パラメータQPの関数として与えられる。さらに、HeaderBitは、直交変換係数を含まない、動きベクトルや、モードといった、Headerに属する情報に関する符号量である。

すなわち、Low Complexity Modeにおいては、それぞれの候補モードModeに関して、予測処理を行う必要があるが、復号画像までは必要ないため、符号化処理まで行う必要はない。このため、High Complexity Modeより低い演算量での実現が可能である。

ところで、上述したように、当該シーケンスに含まれる、全てのピクチャやスライスに対して、非特許文献１において提案されている適応ループフィルタを適用するのは多大なる演算量を要するので、画像符号化処理の負荷が増大してしまう恐れがあった。

そこで、以下において、ループフィルタ処理を、負荷が増大しないように適用する画像符号化装置について説明する。

［画像符号化装置］
図１０は、本発明を適用した画像処理装置としての画像符号化装置の一実施の形態の構成を表している。

図１０の画像符号化装置５００は、A/D変換部１０１、画面並べ替えバッファ１０２、演算部１０３、直交変換部１０４、量子化部１０５、可逆符号化部１０６、蓄積バッファ１０７、逆量子化部１０８、逆直交変換部１０９、演算部１１０、デブロックフィルタ１１１、フレームメモリ１１２、選択部１１３、イントラ予測部１１４、動き予測・補償部１１５、選択部１１６、およびレート制御部１１７を備える点で、図１の画像符号化装置１００と共通している。

また、図５の画像符号化装置５００は、フィルタ制御部５０１および適応ループフィルタ５０２が追加された点で、図１の画像符号化装置１００と異なっている。

適応ループフィルタ５０２は、デブロックフィルタ１１１とフレームメモリ１１２の間に設けられている。すなわち、適応ループフィルタ５０２は、演算部１０３、直交変換部１０４、量子化部１０５、逆量子化部１０８、逆直交変換部１０９、演算部１１０、デブロックフィルタ１１１、フレームメモリ１１２、選択部１１３、イントラ予測部１１４または動き予測・補償部１１５、および選択部１１６からなる動き補償ループ内に設けられている。すなわち、動き補償ループ内では、画像がループして用いられている。

フィルタ制御部５０１は、適応ループフィルタ処理対象の画像（ピクチャ若しくはスライス）のタイプ（種類）に関する情報を画面並べ替えバッファ１０２から取得し、そのタイプに応じて、デブロックフィルタ１１１の出力に対して、適応ループフィルタ５０２のフィルタ処理を行うか否か（適応ループフィルタのオン／オフ）を制御する。

例えば、フィルタ制御部５０１は、適応ループフィルタ処理対象の画像が「参照される画像」の場合のみ、適応ループフィルタをオンにする（それ以外の画像に対してはオフにする）。制御方法の、より具体的な例については後述する。

適応ループフィルタ５０２は、フィルタ制御部５０１により制御されて、フィルタ係数を算出し、算出されたフィルタ係数を用いて、デブロックフィルタのから出力される画像に対するフィルタ処理を行い、フィルタ処理後の画像を、フレームメモリ１１２に出力する。このフィルタとして、例えば、ウィナーフィルタ（Wiener Filter）が用いられる。

また、適応ループフィルタ５０２は、算出したフィルタ係数やフィルタ処理のオン／オフを示すフラグ情報（ON/OFFフラグ）を、可逆符号化部１０６に送る。可逆符号化部１０６は、このフィルタ係数やON/OFFフラグも、符号化し、符号化データに付加する。

［適応ループフィルタの詳細］
図１１は、適応ループフィルタ５０２の主な構成例を示すブロック図である。図１１に示されるように、適応ループフィルタ５０２は、ON/OFF部５１１、フィルタ係数算出部５１２、およびフィルタリング部５１３を有する。

フィルタ制御部５０１には、画面並べ替えバッファ１０２から、例えばピクチャタイプやスライスタイプ等の、適応ループフィルタ処理対象の画像のタイプに関する情報が供給される。フィルタ制御部５０１は、その情報に基づいて、適応ループフィルタのオン／オフを決定（制御）するON/OFF情報を生成し、それを適応ループフィルタ５０２のON/OFF部５１１に供給する。

ON/OFF部５１１は、フィルタ制御部５０１から供給されるON/OFF情報の値に従って、フィルタ係数算出部５１２の動作を制御するON/OFFフラグを生成し、それをフィルタ係数算出部５１２に供給する。例えば、適応ループフィルタ処理をオンに設定するON/OFF情報が供給された場合、ON/OFF部５１１は、ON/OFFフラグを、適応ループフィルタ処理がオンであることを示す値に設定し、フィルタ係数算出部５１２に供給する。また、例えば、適応ループフィルタ処理をオフに設定するON/OFF情報が供給された場合、ON/OFF部５１１は、ON/OFFフラグを、適応ループフィルタ処理がオフであることを示す値に設定し、フィルタ係数算出部５１２に供給する。

フィルタ係数算出部５１２には、このON/OFFフラグの他に、デブロックフィルタ１１１からデブロックフィルタ処理後の画像が供給される。さらに、フィルタ係数算出部５１２には、画面並べ替えバッファ１０２から入力画像も供給される。これらの画像には、少なくとも適応ループフィルタ処理を施す部分が含まれる。

フィルタ係数算出部５１２は、ON/OFF部５１１から供給されるON/OFFフラグが、適応ループフィルタ処理がオンであることを示す値である場合、デブロックフィルタ１１１から供給されるデブロックフィルタ処理後の画像と、画面並べ替えバッファ１０２から取得した入力画像とを用いて、適応ループフィルタ処理のフィルタ係数を算出する。フィルタ係数算出部５１２は、そのフィルタ係数とON/OFFフラグをフィルタリング部５１３に供給する。

これに対して、ON/OFF部５１１から供給されるON/OFFフラグが、適応ループフィルタ処理がオフであることを示す値である場合、フィルタ係数算出部５１２は、フィルタ係数を算出せず、適応ループフィルタ処理がオフであることを示すON/OFFフラグのみをフィルタリング部５１３に供給する。

フィルタリング部５１３は、フィルタ係数算出部５１２から供給されたON/OFFフラグが、適応ループフィルタ処理がオンであることを示す値である場合、フィルタ係数算出部５１２から供給されたフィルタ係数を用いて、デブロックフィルタ１１１から供給されるデブロックフィルタ処理後の画像に対して、適応ループフィルタ処理を行う。フィルタリング部５１３は、そのフィルタ処理結果をフレームメモリ１１２に供給し、保持させる。

また、フィルタ係数算出部５１２から供給されたON/OFFフラグが、適応ループフィルタ処理がオフであることを示す値である場合、フィルタリング部５１３は、適応ループフィルタ処理を行わずに、デブロックフィルタ１１１から供給されるデブロックフィルタ処理後の画像を、フレームメモリ１１２に供給し、保持させる。

フィルタ係数算出部５１２は、ON/OFF部５１１から供給されるON/OFFフラグが、適応ループフィルタ処理がオンであることを示す値である場合、算出したフィルタ係数と、ON/OFFフラグとを可逆符号化部１０６に供給する。また、ON/OFF部５１１から供給されるON/OFFフラグが、適応ループフィルタ処理がオフであることを示す値である場合、フィルタ係数算出部５１２は、ON/OFFフラグのみを可逆符号化部１０６に供給する。

［オン／オフ制御例１］
例えば、各タイプのピクチャが、図１２に示されるような順（例えば左から右に向かう順）に処理されるとする。フィルタ制御部５０１は、「参照される画像」として、これらのピクチャの中の、例えばＩピクチャとＰピクチャを適応ループフィルタ処理の処理対象とする。つまり、フィルタ制御部５０１は、適応ループフィルタ処理対象のピクチャがＩピクチャ若しくはＰピクチャの場合、適応ループフィルタ処理をオンに設定するON/OFF情報をON/OFF部５１１に供給する。Ｂピクチャに対しては、フィルタ処理部５０１は、適応ループフィルタ処理をオフに設定するON/OFF情報をON/OFF部５１１に供給する。

非特許文献１に記載の方法においては、全てのピクチャ若しくはスライスに対して適応ループフィルタを施しているのに対し、フィルタ制御部５０１は、適応ループフィルタをかけるか否かを、所定の画像単位毎に制御する。

適応ループフィルタ処理においては、最適フィルタ係数を、ウィナーフィルタ（Wiener Filter）により算出する必要があり、これには多大なる演算量を要する。したがって、非特許文献１に記載の方法の場合、全ての画像（ピクチャ若しくはスライス）に対してそれぞれ最適なフィルタ係数を求めなければならないので、この演算量が大幅に増大してしまい、画像符号化処理の負荷が大幅に増大してしまう恐れがある。

そうだからと言って、単純に、適応ループフィルタ処理を全て省略するようにすると、適応ループフィルタ処理を行う場合に対して、復号画像の画質劣化が増大してしまう恐れがある。

そもそも、適応ループフィルタの役割は、復号画像の画質を向上させると共に、これを参照する画像の予測効率をも向上させるというものである。つまり、参照元となる画像（参照される画像）に対する適応ループフィルタの効果の方が、そうでない画像に対する適応ループフィルタの効果よりも、シーケンス全体の画質により大きな影響を及ぼす。

そこで、フィルタ制御部５０１は、上述したように、当該シーケンス内において、参照される画像（例えばピクチャやスライス）に対してのみ適応ループフィルタを施し、そうでない画像（例えばピクチャやスライス）に対しては適応ループフィルタを施さないように、適応ループフィルタ５０２の動作を制御する。

このように、復号画像への影響が少ない画像に対する適応ループフィルタ処理を省略するように制御を行うことで、画像符号化装置５００は、復号画像の画質劣化を抑制しながら、フィルタ係数算出等の演算量を大幅に低減させることができる。換言するに、画像符号化装置５００は、フィルタ処理の効果が大きい画像に対してのみ適応ループフィルタ処理を適用することにより、不要な負荷の増大を抑制しながら、復号画像の画質を向上させることができる。

なお、図１２に示されるピクチャの並び順は一例であり、本発明は、それ以外の並び順のシーケンスに対しても適用することができる。

［オン／オフ制御例２］
図１３は、階層ＢピクチャによるGOP（Group Of Picture）構造の例を示す図である。

図１３に示されるように、この場合、Ｂピクチャは複数階層状に構成される。図１３において、Ｂピクチャは、下から上に向かう順に階層化されている。つまり、最下段のＢピクチャが第１階層であり、中段のＢピクチャが第２階層であり、最上段のＢピクチャが第３階層である。Ｂ（ｎ）のｎ（括弧内の数字）は、階層番号を示す。つまり、Ｂ（１）は、第１階層のＢピクチャであり、Ｂ（２）は、第２階層のＢピクチャであり、Ｂ（３）は、第３階層のＢピクチャである。

矢印は参照関係を示している。矢印の向きに参照される。つまり、第３階層のＢピクチャ（Ｂ（３））は、第２階層のＢピクチャ（Ｂ（２））とＩピクチャ、Ｐピクチャ、若しくは第１階層のＢピクチャ（Ｂ（１））を参照し、第２階層のＢピクチャ（Ｂ（２））は、第１階層のＢピクチャ（Ｂ（１））とＩピクチャ若しくはＰピクチャを参照し、第１階層のＢピクチャ（Ｂ（１））は、他のＢピクチャを参照せず、ＩピクチャやＰピクチャのみを参照する。

より具体的には、第１階層のＢピクチャ５３３はＩピクチャ５３１およびＰピクチャ５３２を参照する。また、第２階層のＢピクチャ５３４はＩピクチャ５３１およびＢピクチャ５３３を参照し、Ｂピクチャ５３５はＢピクチャ５３３およびＰピクチャ５３２を参照する。

さらに、第３階層のＢピクチャ５３６はＩピクチャ５３１およびＢピクチャ５３４を参照し、Ｂピクチャ５３７はＢピクチャ５３３およびＢピクチャ５３４を参照し、Ｂピクチャ５３８はＢピクチャ５３３およびＢピクチャ５３５を参照し、Ｂピクチャ５３９はＢピクチャ５３５およびＰピクチャ５３２を参照する。

もちろん、階層数、階層構造、各ピクチャの配列、および各ピクチャの参照関係は、任意であり、図１３に示されるパターン以外のパターンであってもよい。

このようなGOP構造の画像に対して、フィルタ制御部５０１は、例えば、第３階層のＢピクチャ以外、すなわち、第２階層のＢピクチャ、第１階層のＢピクチャ、Ｉピクチャ、およびＰピクチャを「参照される画像」とする。

もちろん、図１２の場合と同様に、「参照される画像」であるか否かを分ける方法は、どのような方法であってもよく、上述した以外の方法であってもよい。

例えば、第１階層のＢピクチャ、Ｉピクチャ、およびＰピクチャを「参照される画像」とするようにしてもよい。また、ＩピクチャとＰピクチャを「参照される画像」とするようにしてもよい。Ｉピクチャのみ若しくはＰピクチャのみを「参照される画像」とするようにしてもよい。

また、この場合も、図１２の場合と同様に、「参照される画像」であるか否かの判定は、任意の単位で画像の種類を示す情報に基づいて行うことができる。つまり、例えば、スライスタイプに基づいて、スライス毎に「参照される画像」であるか否かの判定が行われるようにしてもよいし、その他の任意の単位で適応ループフィルタの動作が制御されるようにしてもよい。

なお、図１３に示されるような階層Ｂピクチャを用いたGOP構造は、早送りや巻き戻し等の特殊速度再生（トリックプレイ）に適している。例えば、ＩピクチャとＰピクチャのみを復号することで８倍の高速デコードを実現することができ、さらに第１階層のＢピクチャを復号することで４倍の高速デコードを実現することができ、さらに第２階層のＢピクチャを復号することで２倍の高速デコードを実現することができる。

フィルタ制御部５０１が、上述したように適応ループフィルタの動作を制御することにより、このような高速デコードにおいて表示されるピクチャの画質を、適応ループフィルタ５０２のフィルタ処理によって良好に保つことが出来る。つまり、フィルタ制御部５０１は、高速デコードに好適なフィルタ制御を行うことができる。

［画像のタイプ］
上述したように、フィルタ制御部５０１は、画像のタイプに応じて、適応ループフィルタ５０２の動作を制御する。図１４にスライスヘッダのシンタックスの例を示す。図１４に示されるように、スライスヘッダにおいては、当該スライスの種類（I,P、B等）を示すスライスタイプ（slice_tupe）が記述される。例えば、フィルタ制御部５０１は、画面並べ替えバッファ１０２から入力画像のスライスヘッダを取得し、そのスライスヘッダに記述される情報（スライスタイプ）に基づいて画像のタイプを判定する。

なお、画像のタイプに関する情報は、スライスヘッダ以外に記述されるようにしてもよい。例えば、ピクチャタイプを示す情報が、ピクチャパラメータセット情報に記述されるようにしてもよい。その場合、フィルタ制御部５０１は、画面並べ替えバッファ１０２から、入力画像のピクチャパラメータセット情報を取得し、その中に記述されるピクチャタイプを示す情報を参照し、その値に基づいて画像のタイプを判定する。

なお、このスライスヘッダやピクチャパラメータセット情報等は、予め入力画像のデータに含まれるようにしてもよいし、画面並べ替えバッファ１０２等において生成されるようにしてもよい。

フィルタ制御部５０１は、このような画像のタイプに関する情報に基づいて、適応ループフィルタ５０２の動作を容易に制御することができる。

［ON/OFFフラグ］
上述したように、フィルタ係数算出部５１２は、ON/OFFフラグを（フィルタ係数を算出した場合、そのフィルタ係数も）、可逆符号化部１０６に供給する。図１５乃至図１７は、適応ループフィルタに関するフラグ情報のシンタックスを示す図である。

例えば、可逆符号化部１０６は、フィルタ係数算出部５１２から供給されたON/OFFフラグを、適応ループフィルタフラグ（adaptive_loop_filtar_flag）として符号化データにセットする（図１５）。また、フィルタ係数が供給された場合、可逆符号化部１０６は、そのフィルタ係数も符号化して符号化データに付加する（図１５乃至図１７）。

このようにして、適応ループフィルタ処理のON/OFFフラグやフィルタ係数が、画像復号装置に供給される。

なお、以上に説明したON/OFFフラグやフィルタ係数等の情報は、例えば、符号化データの任意の位置に付加されるようにしてもよいし、符号化データとは別に復号側に伝送されるようにしてもよい。例えば、可逆符号化部１０６が、これらの情報を、ビットストリームにシンタックスとして記述するようにしてもよい。また、可逆符号化部１０６が、これらの情報を、補助情報として所定の領域に格納して伝送するようにしてもよい。例えば、これらの情報が、SEI（Suplemental Enhancement Information）等のパラメータセット（例えばシーケンスやピクチャのヘッダ等）に格納されるようにしてもよい。

また、可逆符号化部１０６が、これらの情報を、符号化データとは別に（別のファイルとして）、画像復号装置に伝送させるようにしてもよい。その場合、これらの情報と符号化データとの対応関係を明確にする（復号側で把握することができるようにする）必要があるが、その方法は任意である。例えば、別途、対応関係を示すテーブル情報を作成してもよいし、対応先のデータを示すリンク情報を互いのデータに埋め込むなどしてもよい。

［符号化処理の流れ］
次に、図１８のフローチャートを参照して、図１０の画像符号化装置５００により実行される符号化処理の流れの例を説明する。

符号化処理が開始されると、ステップＳ５０１において、A/D変換部１０１は入力された画像をA/D変換する。ステップＳ５０２において、画面並べ替えバッファ１０２は、A/D変換部１０１から供給された画像を記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。

画面並べ替えバッファ１０２から供給される処理対象の画像がイントラ処理されるブロックの画像である場合、参照される復号済みの画像がフレームメモリ１１２から読み出され、選択部１１３を介してイントラ予測部１１４に供給される。

これらの画像に基づいて、ステップＳ５０３において、イントラ予測部１１４は処理対象のブロックの画素を、候補となる全てのイントラ予測モードでイントラ予測する。なお、参照される復号済みの画素としては、デブロックフィルタ１１１と適応ループフィルタ５０２によりフィルタリングされていない画素が用いられる。

ステップＳ５０３の処理により、候補となる全てのイントラ予測モードでイントラ予測が行われ、候補となる全てのイントラ予測モードに対してコスト関数値が算出される。そして、算出されたコスト関数値に基づいて、最適イントラ予測モードが選択され、最適イントラ予測モードのイントラ予測により生成された予測画像とそのコスト関数値が選択部１１６に供給される。

画面並べ替えバッファ１０２から供給される処理対象の画像がインター処理される画像である場合、参照される画像がフレームメモリ１１２から読み出され、選択部１１３を介して動き予測・補償部１１５に供給される。これらの画像に基づいて、ステップＳ５０４において、動き予測・補償部１１５は、インター動き予測処理を行う。

ステップＳ５０４の処理により、候補となる全てのインター予測モードで動き予測処理が行われ、候補となる全てのインター予測モードに対してコスト関数値が算出され、算出したコスト関数値に基づいて、最適インター予測モードが決定される。そして、最適インター予測モードにより生成された予測画像とそのコスト関数値が選択部１１６に供給される。

ステップＳ５０５において、選択部１１６は、イントラ予測部１１４および動き予測・補償部１１５より出力された各コスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちの一方を、最適予測モードに決定する。そして、選択部１１６は、決定した最適予測モードの予測画像を選択し、演算部１０３および演算部１１０に供給する。この予測画像は、後述するステップＳ５０６およびステップＳ５１１の演算に利用される。

なお、この予測画像の選択情報は、イントラ予測部１１４または動き予測・補償部１１５に供給される。最適イントラ予測モードの予測画像が選択された場合、イントラ予測部１１４は、最適イントラ予測モードを示す情報（すなわち、イントラ予測モード情報）を、可逆符号化部１０６に供給する。

最適インター予測モードの予測画像が選択された場合、動き予測・補償部１１５は、最適インター予測モードを示す情報と、さらに、必要に応じて、最適インター予測モードに応じた情報を可逆符号化部１０６に出力する。最適インター予測モードに応じた情報としては、動きベクトル情報や参照フレーム情報などがあげられる。

ステップＳ５０６において、演算部１０３は、ステップＳ５０２で並び替えられた画像と、ステップＳ５０５で選択された予測画像との差分を演算する。予測画像は、インター予測する場合は動き予測・補償部１１５から、イントラ予測する場合はイントラ予測部１１４から、それぞれ選択部１１６を介して演算部１０３に供給される。

差分データは元の画像データに較べてデータ量が小さくなっている。したがって、画像をそのまま符号化する場合に較べて、データ量を圧縮することができる。

ステップＳ５０７において、直交変換部１０４は演算部１０３から供給された差分情報を直交変換する。具体的には、離散コサイン変換、カルーネン・レーベ変換等の直交変換が行われ、変換係数が出力される。

ステップＳ５０８において、量子化部１０５は変換係数を量子化する。この量子化に際しては、後述するステップＳ５１７の処理で説明されるように、レートが制御される。

以上のようにして量子化された差分情報は、次のようにして局部的に復号される。すなわち、ステップＳ５０９において、逆量子化部１０８は量子化部１０５により量子化された変換係数を量子化部１０５の特性に対応する特性で逆量子化する。ステップＳ５１０において、逆直交変換部１０９は逆量子化部１０８により逆量子化された変換係数を直交変換部１０４の特性に対応する特性で逆直交変換する。

ステップＳ５１１において、演算部１１０は、選択部１１６を介して入力される予測画像を局部的に復号された差分情報に加算し、局部的に復号された画像（演算部１０３への入力に対応する画像）を生成する。

ステップＳ５１２においてデブロックフィルタ１１１は、演算部１１０より出力された画像に対して、デブロックフィルタ処理を行う。これによりブロック歪みが除去される。デブロックフィルタ１１１からの復号画像は、適応ループフィルタ５０２に出力される。

ステップＳ５１３において、フィルタ制御部５０１および適応ループフィルタ５０２は、適応ループフィルタ処理を行い、ステップＳ５１２においてデブロックフィルタ処理された画像に対し、適宜、適応ループフィルタ処理を行う。適応ループフィルタ処理の詳細については、後述する。

ステップＳ５１４においてフレームメモリ１１２は、ステップＳ５１３の処理により適宜フィルタリングされた画像を記憶する。なお、フレームメモリ１１２にはデブロックフィルタ１１１と適応ループフィルタ５０２によりフィルタ処理されていない画像も演算部１１０から供給され、記憶される。

一方、上述したステップＳ５０８において量子化された変換係数は、可逆符号化部１０６にも供給される。ステップＳ５１５において、可逆符号化部１０６は量子化部１０５より出力された量子化された変換係数を符号化する。すなわち、差分画像が可変長符号化、算術符号化等の可逆符号化され、圧縮される。

また、可逆符号化部１０６は、入力されたON/OFFフラグや適応フィルタ係数、並びに、イントラ予測モード情報、または、最適インター予測モードに応じた情報なども符号化され、ヘッダ情報に付加される。

例えば、インター予測モードを示す情報は、マクロブロック毎に符号化される。動きベクトル情報や参照フレーム情報は、対象となるブロック毎に符号化される。フィルタ係数やON/OFFフラグは、スライス毎あるいはピクチャパラメータセット毎に符号化される。

ステップＳ５１６において蓄積バッファ１０７は、差分画像を圧縮画像として蓄積する。蓄積バッファ１０７に蓄積された圧縮画像は、適宜読み出され、図示せぬ伝送路を介して復号側に伝送される。

ステップＳ５１７において、レート制御部１１７は、蓄積バッファ１０７に蓄積された圧縮画像に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。

［適応ループフィルタ処理の流れ］
次に、図１９のフローチャートを参照して、図１８のステップＳ５１３において実行される適応ループフィルタ処理の詳細な流れの例を説明する。

適応ループフィルタ処理が開始されると、フィルタ制御部５０１は、ステップＳ５３１において、適応ループフィルタ処理対象の画像のタイプを判定する。ステップＳ５３２において、フィルタ制御部５０１は、適応ループフィルタ処理対象の画像が参照されるか否かを判定する。ステップＳ５３１のタイプ判定結果に基づいて、参照される絵であると判定された場合、フィルタ制御部５０１は、処理をステップＳ５３３に進める。

ステップＳ５３３において、ON/OFF部５１１は、ON/OFFフラグをONに設定する。ステップＳ５３４において、フィルタ係数算出部５１２は、デブロックフィルタ処理された画像および入力画像に基づいて、適切なフィルタ係数を算出する。ステップＳ５３５において、フィルタリング部５１３は、ステップＳ５３４において算出されたフィルタ係数を用いて、デブロックフィルタ処理された画像に対して適応ループフィルタ処理を行う。

ステップＳ５３６において、フィルタリング部５１３は、以上のように使用されたON/OFFフラグおよびフィルタ係数を可逆符号化部１０６に供給し、符号化させる。

ステップＳ５３６の処理を終了すると、適応ループフィルタ５０２は、適応ループフィルタ処理を終了し、処理を図１８のステップＳ５１３に戻し、ステップＳ５１４以降の処理を実行させる。

また、図１９のステップＳ５３２において、適応ループフィルタ処理対象の画像が参照される絵ではないと判定された場合、フィルタ制御部５０１は、処理をステップＳ５３７に進める。

ステップＳ５３７において、ON/OFF部５１１は、ON/OFFフラグをOffに設定する。ステップＳ５３８において、フィルタリング部５１３は、以上のように設定されたON/OFFフラグを可逆符号化部１０６に供給し、符号化させる。

ステップＳ５３８の処理を終了すると、適応ループフィルタ５０２は、適応ループフィルタ処理を終了し、処理を図１８のステップＳ５１３に戻し、ステップＳ５１４以降の処理を実行させる。

以上のように、フィルタ制御部５０１は、適応ループフィルタ５０２の動作を容易に制御することができる。また、そのフィルタ制御部５０１が、適応ループフィルタ５０２の動作を画像のタイプに応じて制御することにより、画像符号化装置５００は、復号画像の画質劣化を抑制しながら、符号化処理の負荷を低減させることができる。

なお、以上のように画像符号化装置５００により生成され、出力された符号化データは、従来の画像復号装置（例えば、図９を参照して説明した、非特許文献１において提案される画像復号装置４００）により、従来と同様に（画像符号化装置３００により生成された符号化データを復号する場合と同様に）復号することができる。

つまり、ループフィルタ４０１は、例えば符号化データに付加された、適応ループフィルタフラグ（adaptive_loop_filtar_flag）やフィルタ係数等の情報を用いて、デブロックフィルタ２０６によりデブロックフィルタ処理された画像に対して、適宜、適応ループフィルタ処理を行う。このようにすることにより、画像復号装置４００は、復号画像の画質劣化を抑制することができる。

＜２．第２の実施の形態＞
［画像符号化装置の他の例］
なお、以上においては、画像のタイプに応じて適応ループフィルタのON/OFFが制御されるように説明したが、これに限らず、例えば、画像のタイプに応じて適応ループフィルタのタップ数が制御されるようにしてもよい。

つまり、適応ループフィルタ処理において、そのタップ長（tap長）が、ピクチャタイプやスライスタイプ等の画像のタイプに応じて切り替えられるようにしてもよい。例えば、適応ループフィルタ処理において、参照されるピクチャには、より長いtap長が適用され、参照されないピクチャに対してはより短いtap長が適用されるようにしてもよい。

非特許文献１に記載の方法の場合、例えば、５tap、７tap、および９tap等のように、予め用意された複数のタップ長の全てについて適応ループフィルタ処理が行われ、各処理結果のコストに応じて、最適なタップ長のフィルタ処理結果が選択される。

その際に、各係数群の一部をゼロとしてフィルタ処理を行うことにより、タップ長を短くするようにしてもよい。例えば、９tapのフィルタ処理において、その第１の係数と第９の係数（両端の係数）をゼロ（０）とすることで、実質的にタップ長を短くする（７tapとする）。同様にして、５tapのフィルタ処理や７tapのフィルタ処理においてもタップ長を短くすることができる。もちろん、ゼロにする係数の数は任意である。また、何番目の係数をゼロにするかも任意である。

このように、参照されない画像に対する適応ループフィルタ処理のタップ長を短くすることにより、その演算量を低減させることができる。この場合、タップ長は短くされるものの、フィルタ処理は行われるので、復号画像の画質に与える影響を、第１の実施の形態の場合よりも少なくすることができる。つまり、復号画像の画質劣化を、第１の実施の形態の場合よりも抑制することができる。

図２０は、その場合のフィルタ制御部および適応ループフィルタの構成例を示すブロック図である。

図２０に示されるように、この場合、画像符号化装置５００は、フィルタ制御部５０１の代わりにフィルタ制御部６０１を有し、適応ループフィルタ５０２の代わりに適応ループフィルタ６０２を有する。

フィルタ制御部５０１が適応ループフィルタ処理対象の画像のタイプに応じて適応ループフィルタ５０２による適応ループフィルタ処理のオン／オフを制御するのに対して、フィルタ制御部６０１は、適応ループフィルタ処理対象の画像のタイプに応じて適応ループフィルタ６０２による適応ループフィルタ処理のタップ長を制御する。

より具体的には、フィルタ制御部６０１は、画面並べ替えバッファ１０２から供給されるピクチャタイプ（若しくはスライスタイプ）を示す情報に基づいて、適応ループフィルタ処理対象の画像が「参照される画像」であるか否かを識別し、「参照される画像」でない場合、タップ長を短くするように適応ループフィルタ６０２の動作を制御する。

フィルタ制御部６０１は、タップ長を指定するタップ長情報を適応ループフィルタ６０２のタップ長設定部６１１に供給する。

適応ループフィルタ６０２は、フィルタ制御部６０１に制御されて、フィルタ処理を施す画像のタイプに応じて設定したタップ長で適応ループフィルタ処理を行う。

適応ループフィルタ６０２は、タップ長設定部６１１、フィルタ係数算出部６１２、およびフィルタリング部５１３を有する。

タップ長設定部６１１は、フィルタ制御部６０１から供給されるタップ長情報により指定されるタップ長のフィルタ係数を算出するように指示する制御情報である係数制御情報を生成し、それをフィルタ係数算出部６１２に供給する。

つまり、タップ長設定部６１１は、上述したように、適応ループフィルタ処理対象の画像が「参照される画像」でない場合、タップ長が短くなるように設定する係数制御情報を生成し、それをフィルタ係数算出部６１２に供給する。換言するに、タップ長設定部６１１は、適応ループフィルタ処理対象の画像が「参照される画像」である場合、タップ長が長くなるように設定する係数制御情報を生成し、それをフィルタ係数算出部６１２に供給する。

タップ長設定部６１１は、ゼロ係数設定部６２１を有する。ゼロ係数設定部６２１は、フィルタ係数算出部６１２が算出するフィルタ係数の一部の係数の値をゼロに設定する。つまり、タップ長設定部６１１は、フィルタ係数算出部６１２が算出するフィルタ係数の一部の係数の値をゼロに指定する係数制御情報を生成する。この場合、一部の係数がゼロとされることにより、所望のタップ長が実現される。

例えば、フィルタ係数算出部６１２が９tapのフィルタ係数を算出する場合、ゼロ係数設定部６２１は、その９tapのうち第１の係数と第９の係数をゼロに設定する。この場合、係数制御情報は、７tapを指定することになる。フィルタ係数算出部６１２は、このような係数制御情報により指定された係数の値をゼロとし、それ以外の係数を算出する。結果としてフィルタ係数算出部６１２は、実質的に７tapのフィルタ係数を算出することになる。

フィルタ係数算出部６１２は、算出したフィルタ係数をフィルタリング部５１３に供給する。また、この場合、フィルタ係数算出部６１２は、値がONのON/OFFフラグを生成し、フィルタリング部５１３に供給する。

フィルタリング部５１３は、フィルタ係数算出部６１２から供給されたフィルタ係数を用いて、デブロックフィルタ１１１から供給されるデブロックフィルタ処理後の画像に対して適応ループフィルタ処理を行う。

この場合も、フィルタリング部５１３は、適応ループフィルタ処理後の画像をフレームメモリ１１２に供給して蓄積させる。フィルタ係数算出部６１２は、算出したフィルタ係数や値がONのON/OFFフラグを可逆符号化部１０６に供給し、符号化させる。

この場合の符号化処理は図１８のフローチャートを参照して説明した場合と同様に行われる。

［適応ループフィルタ処理の流れ］
この場合の適応ループフィルタ処理の流れの例を図２１のフローチャートを参照して説明する。このフローチャートは、図１９のフローチャートに対応する。

適応ループフィルタ処理が開始されると、フィルタ制御部６０１は、ステップＳ６３１において、適応ループフィルタ処理対象の画像のタイプを判定する。

ステップＳ６３２において、フィルタ制御部６０１は、適応ループフィルタ処理対象の画像が参照されるか否かを判定する。ステップＳ６３１のタイプ判定結果に基づいて、参照される絵であると判定された場合、フィルタ制御部６０１は、処理をステップＳ６３３に進める。ステップＳ６３３において、タップ長設定部６１１は、フィルタ係数のタップ長を長くするように制御し、ステップＳ６３５に処理を進める。

また、ステップＳ６３２において、適応ループフィルタ処理対象が参照される絵でないと判定された場合、フィルタ制御部６０１は、処理をステップＳ６３４に進める。ステップＳ６３４において、タップ長設定部６１１は、フィルタ係数のタップ長を短くするように制御し、ステップＳ６３５に処理を進める。

ステップＳ６３５において、フィルタ係数算出部６１２は、デブロックフィルタ処理された画像および入力画像に基づいて、適切なフィルタ係数を算出する。また、フィルタ係数算出部６１２は、値がオンのON/OFFフラグを生成する。ステップＳ６３６において、フィルタリング部５１３は、ステップＳ６３５において算出されたフィルタ係数を用いて、デブロックフィルタ処理された画像に対して適応ループフィルタ処理を行う。

ステップＳ６３７において、フィルタリング部５１３は、以上のように使用されたON/OFFフラグおよびフィルタ係数を可逆符号化部１０６に供給し、符号化させる。

ステップＳ６３７の処理を終了すると、適応ループフィルタ６０２は、適応ループフィルタ処理を終了し、処理を図１８のステップＳ５１３に戻し、ステップＳ５１４以降の処理を実行させる。

以上のように、フィルタ制御部６０１は、適応ループフィルタ６０２の動作を容易に制御することができる。また、そのフィルタ制御部６０１が、適応ループフィルタ６０２のフィルタ処理のタップ長を画像のタイプに応じて制御することにより、画像符号化装置５００は、復号画像の画質劣化を抑制しながら、符号化処理の負荷を低減させることができる。

なお、この場合も、以上のように画像符号化装置５００により生成され、出力された符号化データは、従来の画像復号装置（例えば、図９を参照して説明した、非特許文献１において提案される画像復号装置４００）により、従来と同様に（画像符号化装置３００により生成された符号化データを復号する場合と同様に）復号することができる。

［拡張マクロブロックの例］
また、H．264/AVC方式において、マクロブロックサイズは１６×１６画素である。しかしながら、マクロブロックサイズを１６画素×１６画素とするのは、次世代符号化方式の対象となるような、UHD（Ultra High Definition；４０００画素×２０００画素）といった大きな画枠に対しては、最適ではない。画像符号化装置５００においては、図２２に示されるように、マクロブロックサイズを、例えば、３２画素×３２画素、６４×６４画素といった大きさにすることが採用される場合がある。

図２２は、拡張マクロブロックのサイズの例を示す図である。図３２に示される例の場合、マクロブロックサイズは３２×３２画素に拡張されている。

図２２の上段には、左から、３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロック（パーティション）に分割された３２×３２画素で構成されるマクロブロックが順に示されている。図２２の中段には、左から、１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックに分割された１６×１６画素で構成されるブロックが順に示されている。また、図２２の下段には、左から、８×８画素、８×４画素、４×８画素、および４×４画素のブロックに分割された８×８画素のブロックが順に示されている。

すなわち、３２×３２画素のマクロブロックは、図２２の上段に示される３２×３２画素、３２×１６画素、１６×３２画素、および１６×１６画素のブロックでの処理が可能である。

上段の右側に示される１６×１６画素のブロックは、H．264/AVC方式と同様に、中段に示される１６×１６画素、１６×８画素、８×１６画素、および８×８画素のブロックでの処理が可能である。

中段の右側に示される８×８画素のブロックは、H．264/AVC方式と同様に、下段に示される８×８画素、８×４画素、４×８画素、および４×４画素のブロックでの処理が可能である。

これらのブロックは、以下の３階層に分類することができる。すなわち、図２２の上段に示される３２×３２画素、３２×１６画素、および１６×３２画素のブロックを第１階層と称する。上段の右側に示される１６×１６画素のブロック、並びに、中段に示される１６×１６画素、１６×８画素、および８×１６画素のブロックを、第２階層と称する。中段の右側に示される８×８画素のブロック、並びに、下段に示される８×８画素、８×４画素、４×８画素、および４×４画素のブロックを、第３階層と称する。

図２２のような、階層構造を採用することにより、１６×１６画素ブロック以下に関しては、現在のH．264/AVC方式におけるマクロブロックと互換性を保ちながら、そのスーパーセットとして、より大きなブロックが定義されている。

もちろん、マクロブロックのサイズは任意であり、例えば、６４×６４画素以上のような、さらに大きなマクロブロックが定義されるようにしてもよい。

＜３．第３の実施の形態＞
［パーソナルコンピュータ］
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。この場合、例えば、図２３に示されるようなパーソナルコンピュータとして構成されるようにしてもよい。

図２３において、パーソナルコンピュータ７００のCPU（Central Processing Unit）７０１は、ROM（Read Only Memory）７０２に記憶されているプログラム、または記憶部７１３からRAM（Random Access Memory）７０３にロードされたプログラムに従って各種の処理を実行する。RAM７０３にはまた、CPU７０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

CPU７０１、ROM７０２、およびRAM７０３は、バス７０４を介して相互に接続されている。このバス７０４にはまた、入出力インタフェース７１０も接続されている。

入出力インタフェース７１０には、キーボード、マウスなどよりなる入力部７１１、CRT（Cathode Ray Tube）やLCD（Liquid Crystal Display）などよりなるディスプレイ、並びにスピーカなどよりなる出力部７１２、ハードディスクなどより構成される記憶部７１３、モデムなどより構成される通信部７１４が接続されている。通信部７１４は、インターネットを含むネットワークを介しての通信処理を行う。

入出力インタフェース７１０にはまた、必要に応じてドライブ７１５が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア７２１が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部７１３にインストールされる。

上述した一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、ネットワークや記録媒体からインストールされる。

この記録媒体は、例えば、図２３に示されるように、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM（Compact Disc - Read Only Memory）,DVD（Digital Versatile Disc）を含む）、光磁気ディスク（MD（Mini Disc）を含む）、若しくは半導体メモリなどよりなるリムーバブルメディア７２１により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM７０２や、記憶部７１３に含まれるハードディスクなどで構成される。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数のデバイス（装置）により構成される装置全体を表すものである。

また、以上において、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。つまり、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、上述した画像符号化装置や画像復号装置は、任意の電子機器に適用することができる。以下にその例について説明する。

＜４．第４の実施の形態＞
［テレビジョン受像機］
図２４は、本発明を適用した画像復号装置２００を用いるテレビジョン受像機の主な構成例を示すブロック図である。

図２４に示されるテレビジョン受像機１０００は、地上波チューナ１０１３、ビデオデコーダ１０１５、映像信号処理回路１０１８、グラフィック生成回路１０１９、パネル駆動回路１０２０、および表示パネル１０２１を有する。

地上波チューナ１０１３は、地上アナログ放送の放送波信号を、アンテナを介して受信し、復調し、映像信号を取得し、それをビデオデコーダ１０１５に供給する。ビデオデコーダ１０１５は、地上波チューナ１０１３から供給された映像信号に対してデコード処理を施し、得られたデジタルのコンポーネント信号を映像信号処理回路１０１８に供給する。

映像信号処理回路１０１８は、ビデオデコーダ１０１５から供給された映像データに対してノイズ除去などの所定の処理を施し、得られた映像データをグラフィック生成回路１０１９に供給する。

グラフィック生成回路１０１９は、表示パネル１０２１に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成し、生成した映像データや画像データをパネル駆動回路１０２０に供給する。また、グラフィック生成回路１０１９は、項目の選択などにユーザにより利用される画面を表示するための映像データ（グラフィック）を生成し、それを番組の映像データに重畳したりすることによって得られた映像データをパネル駆動回路１０２０に供給するといった処理も適宜行う。

パネル駆動回路１０２０は、グラフィック生成回路１０１９から供給されたデータに基づいて表示パネル１０２１を駆動し、番組の映像や上述した各種の画面を表示パネル１０２１に表示させる。

表示パネル１０２１はLCD（Liquid Crystal Display）などよりなり、パネル駆動回路１０２０による制御に従って番組の映像などを表示させる。

また、テレビジョン受像機１０００は、音声A/D（Analog/Digital)変換回路１０１４、音声信号処理回路１０２２、エコーキャンセル／音声合成回路１０２３、音声増幅回路１０２４、およびスピーカ１０２５も有する。

地上波チューナ１０１３は、受信した放送波信号を復調することにより、映像信号だけでなく音声信号も取得する。地上波チューナ１０１３は、取得した音声信号を音声A/D変換回路１０１４に供給する。

音声A/D変換回路１０１４は、地上波チューナ１０１３から供給された音声信号に対してA/D変換処理を施し、得られたデジタルの音声信号を音声信号処理回路１０２２に供給する。

音声信号処理回路１０２２は、音声A/D変換回路１０１４から供給された音声データに対してノイズ除去などの所定の処理を施し、得られた音声データをエコーキャンセル／音声合成回路１０２３に供給する。

エコーキャンセル／音声合成回路１０２３は、音声信号処理回路１０２２から供給された音声データを音声増幅回路１０２４に供給する。

音声増幅回路１０２４は、エコーキャンセル／音声合成回路１０２３から供給された音声データに対してD/A変換処理、増幅処理を施し、所定の音量に調整した後、音声をスピーカ１０２５から出力させる。

さらに、テレビジョン受像機１０００は、デジタルチューナ１０１６およびMPEGデコーダ１０１７も有する。

デジタルチューナ１０１６は、デジタル放送（地上デジタル放送、BS（Broadcasting Satellite）／CS（Communications Satellite）デジタル放送）の放送波信号を、アンテナを介して受信し、復調し、MPEG-TS（Moving Picture Experts Group-Transport Stream）を取得し、それをMPEGデコーダ１０１７に供給する。

MPEGデコーダ１０１７は、デジタルチューナ１０１６から供給されたMPEG-TSに施されているスクランブルを解除し、再生対象（視聴対象）になっている番組のデータを含むストリームを抽出する。MPEGデコーダ１０１７は、抽出したストリームを構成する音声パケットをデコードし、得られた音声データを音声信号処理回路１０２２に供給するとともに、ストリームを構成する映像パケットをデコードし、得られた映像データを映像信号処理回路１０１８に供給する。また、MPEGデコーダ１０１７は、MPEG-TSから抽出したEPG（Electronic Program Guide)データを図示せぬ経路を介してCPU１０３２に供給する。

テレビジョン受像機１０００は、このように映像パケットをデコードするMPEGデコーダ１０１７として、上述した画像復号装置２００を用いる。なお、放送局等より送信されるMPEG-TSは、画像符号化装置１００によって符号化されている。

MPEGデコーダ１０１７は、画像復号装置２００の場合と同様に、放送局（画像符号化装置１００）より供給されるsubmb_qp_delta等の量子化パラメータを用いて、サブマクロブロック毎に量子化値を算出し、逆量子化を行う。したがって、MPEGデコーダ１０１７は、画像の内容により適した逆量子化処理を行うことができ、復号画像の主観画質の劣化を抑制させることができる。

MPEGデコーダ１０１７から供給された映像データは、ビデオデコーダ１０１５から供給された映像データの場合と同様に、映像信号処理回路１０１８において所定の処理が施され、グラフィック生成回路１０１９において、生成された映像データ等が適宜重畳され、パネル駆動回路１０２０を介して表示パネル１０２１に供給され、その画像が表示される。

MPEGデコーダ１０１７から供給された音声データは、音声A/D変換回路１０１４から供給された音声データの場合と同様に、音声信号処理回路１０２２において所定の処理が施され、エコーキャンセル／音声合成回路１０２３を介して音声増幅回路１０２４に供給され、D/A変換処理や増幅処理が施される。その結果、所定の音量に調整された音声がスピーカ１０２５から出力される。

また、テレビジョン受像機１０００は、マイクロホン１０２６、およびA/D変換回路１０２７も有する。

A/D変換回路１０２７は、音声会話用のものとしてテレビジョン受像機１０００に設けられるマイクロホン１０２６により取り込まれたユーザの音声の信号を受信し、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データをエコーキャンセル／音声合成回路１０２３に供給する。

エコーキャンセル／音声合成回路１０２３は、テレビジョン受像機１０００のユーザ（ユーザＡ）の音声のデータがA/D変換回路１０２７から供給されている場合、ユーザＡの音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路１０２４を介してスピーカ１０２５より出力させる。

さらに、テレビジョン受像機１０００は、音声コーデック１０２８、内部バス１０２９、SDRAM（Synchronous Dynamic Random Access Memory)１０３０、フラッシュメモリ１０３１、CPU１０３２、USB（Universal Serial Bus) I/F１０３３、およびネットワークI/F１０３４も有する。

A/D変換回路１０２７は、音声会話用のものとしてテレビジョン受像機１０００に設けられるマイクロホン１０２６により取り込まれたユーザの音声の信号を受信し、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データを音声コーデック１０２８に供給する。

音声コーデック１０２８は、A/D変換回路１０２７から供給された音声データを、ネットワーク経由で送信するための所定のフォーマットのデータに変換し、内部バス１０２９を介してネットワークI/F１０３４に供給する。

ネットワークI/F１０３４は、ネットワーク端子１０３５に装着されたケーブルを介してネットワークに接続される。ネットワークI/F１０３４は、例えば、そのネットワークに接続される他の装置に対して、音声コーデック１０２８から供給された音声データを送信する。また、ネットワークI/F１０３４は、例えば、ネットワークを介して接続される他の装置から送信される音声データを、ネットワーク端子１０３５を介して受信し、それを、内部バス１０２９を介して音声コーデック１０２８に供給する。

音声コーデック１０２８は、ネットワークI/F１０３４から供給された音声データを所定のフォーマットのデータに変換し、それをエコーキャンセル／音声合成回路１０２３に供給する。

エコーキャンセル／音声合成回路１０２３は、音声コーデック１０２８から供給される音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路１０２４を介してスピーカ１０２５より出力させる。

SDRAM１０３０は、CPU１０３２が処理を行う上で必要な各種のデータを記憶する。

フラッシュメモリ１０３１は、CPU１０３２により実行されるプログラムを記憶する。フラッシュメモリ１０３１に記憶されているプログラムは、テレビジョン受像機１０００の起動時などの所定のタイミングでCPU１０３２により読み出される。フラッシュメモリ１０３１には、デジタル放送を介して取得されたEPGデータ、ネットワークを介して所定のサーバから取得されたデータなども記憶される。

例えば、フラッシュメモリ１０３１には、CPU１０３２の制御によりネットワークを介して所定のサーバから取得されたコンテンツデータを含むMPEG-TSが記憶される。フラッシュメモリ１０３１は、例えばCPU１０３２の制御により、そのMPEG-TSを、内部バス１０２９を介してMPEGデコーダ１０１７に供給する。

MPEGデコーダ１０１７は、デジタルチューナ１０１６から供給されたMPEG-TSの場合と同様に、そのMPEG-TSを処理する。このようにテレビジョン受像機１０００は、映像や音声等よりなるコンテンツデータを、ネットワークを介して受信し、MPEGデコーダ１０１７を用いてデコードし、その映像を表示させたり、音声を出力させたりすることができる。

また、テレビジョン受像機１０００は、リモートコントローラ１０５１から送信される赤外線信号を受光する受光部１０３７も有する。

受光部１０３７は、リモートコントローラ１０５１からの赤外線を受光し、復調して得られたユーザ操作の内容を表す制御コードをCPU１０３２に出力する。

CPU１０３２は、フラッシュメモリ１０３１に記憶されているプログラムを実行し、受光部１０３７から供給される制御コードなどに応じてテレビジョン受像機１０００の全体の動作を制御する。CPU１０３２とテレビジョン受像機１０００の各部は、図示せぬ経路を介して接続されている。

USB I/F１０３３は、USB端子１０３６に装着されたUSBケーブルを介して接続される、テレビジョン受像機１０００の外部の機器との間でデータの送受信を行う。ネットワークI/F１０３４は、ネットワーク端子１０３５に装着されたケーブルを介してネットワークに接続し、ネットワークに接続される各種の装置と音声データ以外のデータの送受信も行う。

テレビジョン受像機１０００は、MPEGデコーダ１０１７として画像復号装置２００を用いることにより、アンテナを介して受信する放送波信号や、ネットワークを介して取得するコンテンツデータに対して、画像の内容により適した逆量子化処理を行うことができ、復号画像の主観画質の劣化を抑制させることができる。

＜５．第５の実施の形態＞
［携帯電話機］
図２５は、本発明を適用した画像符号化装置１００および画像復号装置２００を用いる携帯電話機の主な構成例を示すブロック図である。

図２５に示される携帯電話機１１００は、各部を統括的に制御するようになされた主制御部１１５０、電源回路部１１５１、操作入力制御部１１５２、画像エンコーダ１１５３、カメラI/F部１１５４、LCD制御部１１５５、画像デコーダ１１５６、多重分離部１１５７、記録再生部１１６２、変復調回路部１１５８、および音声コーデック１１５９を有する。これらは、バス１１６０を介して互いに接続されている。

また、携帯電話機１１００は、操作キー１１１９、CCD（Charge Coupled Devices）カメラ１１１６、液晶ディスプレイ１１１８、記憶部１１２３、送受信回路部１１６３、アンテナ１１１４、マイクロホン（マイク）１１２１、およびスピーカ１１１７を有する。

電源回路部１１５１は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話機１１００を動作可能な状態に起動する。

携帯電話機１１００は、CPU、ROMおよびRAM等でなる主制御部１１５０の制御に基づいて、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

例えば、音声通話モードにおいて、携帯電話機１１００は、マイクロホン（マイク）１１２１で集音した音声信号を、音声コーデック１１５９によってデジタル音声データに変換し、これを変復調回路部１１５８でスペクトラム拡散処理し、送受信回路部１１６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機１１００は、その変換処理により得られた送信用信号を、アンテナ１１１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（音声信号）は、公衆電話回線網を介して通話相手の携帯電話機に供給される。

また、例えば、音声通話モードにおいて、携帯電話機１１００は、アンテナ１１１４で受信した受信信号を送受信回路部１１６３で増幅し、さらに周波数変換処理およびアナログデジタル変換処理し、変復調回路部１１５８でスペクトラム逆拡散処理し、音声コーデック１１５９によってアナログ音声信号に変換する。携帯電話機１１００は、その変換して得られたアナログ音声信号をスピーカ１１１７から出力する。

更に、例えば、データ通信モードにおいて電子メールを送信する場合、携帯電話機１１００は、操作キー１１１９の操作によって入力された電子メールのテキストデータを、操作入力制御部１１５２において受け付ける。携帯電話機１１００は、そのテキストデータを主制御部１１５０において処理し、LCD制御部１１５５を介して、画像として液晶ディスプレイ１１１８に表示させる。

また、携帯電話機１１００は、主制御部１１５０において、操作入力制御部１１５２が受け付けたテキストデータやユーザ指示等に基づいて電子メールデータを生成する。携帯電話機１１００は、その電子メールデータを、変復調回路部１１５８でスペクトラム拡散処理し、送受信回路部１１６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機１１００は、その変換処理により得られた送信用信号を、アンテナ１１１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（電子メール）は、ネットワークおよびメールサーバ等を介して、所定のあて先に供給される。

また、例えば、データ通信モードにおいて電子メールを受信する場合、携帯電話機１１００は、基地局から送信された信号を、アンテナ１１１４を介して送受信回路部１１６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機１１００は、その受信信号を変復調回路部１１５８でスペクトラム逆拡散処理して元の電子メールデータを復元する。携帯電話機１１００は、復元された電子メールデータを、LCD制御部１１５５を介して液晶ディスプレイ１１１８に表示する。

なお、携帯電話機１１００は、受信した電子メールデータを、記録再生部１１６２を介して、記憶部１１２３に記録する（記憶させる）ことも可能である。

この記憶部１１２３は、書き換え可能な任意の記憶媒体である。記憶部１１２３は、例えば、RAMや内蔵型フラッシュメモリ等の半導体メモリであってもよいし、ハードディスクであってもよいし、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアであってもよい。もちろん、これら以外のものであってもよい。

さらに、例えば、データ通信モードにおいて画像データを送信する場合、携帯電話機１１００は、撮像によりCCDカメラ１１１６で画像データを生成する。CCDカメラ１１１６は、レンズや絞り等の光学デバイスと光電変換素子としてのCCDを有し、被写体を撮像し、受光した光の強度を電気信号に変換し、被写体の画像の画像データを生成する。CCDカメラ１１１６は、その画像データを、カメラI/F部１１５４を介して、画像エンコーダ１１５３で符号化し、符号化画像データに変換する。

携帯電話機１１００は、このような処理を行う画像エンコーダ１１５３として、上述した画像符号化装置１００を用いる。画像エンコーダ１１５３は、画像符号化装置１００の場合と同様に、サブマクロブロック毎に画像の複雑さを示す指標を算出し、その指標に基づいてサブマクロブロック毎に量子化値を算出し、そのサブマクロブロック毎の量子化値を用いて直交変換係数の量子化を行う。このようにすることにより、画像エンコーダ１１５３は、画像の内容により適した量子化処理を行うことができ、復号画像の主観画質の劣化を抑制させるように符号化データを生成することができる。

なお、携帯電話機１１００は、このとき同時に、CCDカメラ１１１６で撮像中にマイクロホン（マイク）１１２１で集音した音声を、音声コーデック１１５９においてアナログデジタル変換し、さらに符号化する。

携帯電話機１１００は、多重分離部１１５７において、画像エンコーダ１１５３から供給された符号化画像データと、音声コーデック１１５９から供給されたデジタル音声データとを、所定の方式で多重化する。携帯電話機１１００は、その結果得られる多重化データを、変復調回路部１１５８でスペクトラム拡散処理し、送受信回路部１１６３でデジタルアナログ変換処理および周波数変換処理する。携帯電話機１１００は、その変換処理により得られた送信用信号を、アンテナ１１１４を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号（画像データ）は、ネットワーク等を介して、通信相手に供給される。

なお、画像データを送信しない場合、携帯電話機１１００は、CCDカメラ１１１６で生成した画像データを、画像エンコーダ１１５３を介さずに、LCD制御部１１５５を介して液晶ディスプレイ１１１８に表示させることもできる。

また、例えば、データ通信モードにおいて、簡易ホームページ等にリンクされた動画像ファイルのデータを受信する場合、携帯電話機１１００は、基地局から送信された信号を、アンテナ１１１４を介して送受信回路部１１６３で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機１１００は、その受信信号を変復調回路部１１５８でスペクトラム逆拡散処理して元の多重化データを復元する。携帯電話機１１００は、多重分離部１１５７において、その多重化データを分離して、符号化画像データと音声データとに分ける。

携帯電話機１１００は、画像デコーダ１１５６において符号化画像データをデコードすることにより、再生動画像データを生成し、これを、LCD制御部１１５５を介して液晶ディスプレイ１１１８に表示させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる動画データが液晶ディスプレイ１１１８に表示される。

携帯電話機１１００は、このような処理を行う画像デコーダ１１５６として、上述した画像復号装置２００を用いる。つまり、画像デコーダ１１５６は、画像復号装置２００の場合と同様に、符号化側（画像符号化装置１００）より供給されるsubmb_qp_delta等の量子化パラメータを用いて、サブマクロブロック毎に量子化値を算出し、逆量子化を行う。したがって、画像デコーダ１１５６は、画像の内容により適した逆量子化処理を行うことができ、復号画像の主観画質の劣化を抑制させることができる。

このとき、携帯電話機１１００は、同時に、音声コーデック１１５９において、デジタルの音声データをアナログ音声信号に変換し、これをスピーカ１１１７より出力させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる音声データが再生される。

なお、電子メールの場合と同様に、携帯電話機１１００は、受信した簡易ホームページ等にリンクされたデータを、記録再生部１１６２を介して、記憶部１１２３に記録する（記憶させる）ことも可能である。

また、携帯電話機１１００は、主制御部１１５０において、撮像されてCCDカメラ１１１６で得られた２次元コードを解析し、２次元コードに記録された情報を取得することができる。

さらに、携帯電話機１１００は、赤外線通信部１１８１で赤外線により外部の機器と通信することができる。

携帯電話機１１００は、画像エンコーダ１１５３として画像符号化装置１００を用いることにより、例えばCCDカメラ１１１６において生成された画像データを符号化して伝送する際に、画像の内容により適した量子化処理を行うことができ、復号画像の主観画質の劣化を抑制させるように符号化データを生成することができる。

また、携帯電話機１１００は、画像デコーダ１１５６として画像復号装置２００を用いることにより、例えば、簡易ホームページ等にリンクされた動画像ファイルのデータ（符号化データ）を復号する際に、画像の内容により適した逆量子化処理を行うことができ、復号画像の主観画質の劣化を抑制させることができる。

なお、以上において、携帯電話機１１００が、CCDカメラ１１１６を用いるように説明したが、このCCDカメラ１１１６の代わりに、CMOS（Complementary Metal Oxide Semiconductor）を用いたイメージセンサ（CMOSイメージセンサ）を用いるようにしてもよい。この場合も、携帯電話機１１００は、CCDカメラ１１１６を用いる場合と同様に、被写体を撮像し、被写体の画像の画像データを生成することができる。

また、以上においては携帯電話機１１００として説明したが、例えば、PDA（Personal Digital Assistants）、スマートフォン、UMPC（Ultra Mobile Personal Computer）、ネットブック、ノート型パーソナルコンピュータ等、この携帯電話機１１００と同様の撮像機能や通信機能を有する装置であれば、どのような装置であっても携帯電話機１１００の場合と同様に、本発明を適用した画像符号化装置および画像復号装置を適用することができる。

＜６．第６の実施の形態＞
［ハードディスクレコーダ］
図２６は、本発明を適用した画像符号化装置および画像復号装置を用いるハードディスクレコーダの主な構成例を示すブロック図である。

図２６に示されるハードディスクレコーダ（HDDレコーダ）１２００は、チューナにより受信された、衛星や地上のアンテナ等より送信される放送波信号（テレビジョン信号）に含まれる放送番組のオーディオデータとビデオデータを、内蔵するハードディスクに保存し、その保存したデータをユーザの指示に応じたタイミングでユーザに提供する装置である。

ハードディスクレコーダ１２００は、例えば、放送波信号よりオーディオデータとビデオデータを抽出し、それらを適宜復号し、内蔵するハードディスクに記憶させることができる。また、ハードディスクレコーダ１２００は、例えば、ネットワークを介して他の装置からオーディオデータやビデオデータを取得し、それらを適宜復号し、内蔵するハードディスクに記憶させることもできる。

さらに、ハードディスクレコーダ１２００は、例えば、内蔵するハードディスクに記録されているオーディオデータやビデオデータを復号してモニタ１２６０に供給し、モニタ１２６０の画面にその画像を表示させ、モニタ１２６０のスピーカよりその音声を出力させることができる。また、ハードディスクレコーダ１２００は、例えば、チューナを介して取得された放送波信号より抽出されたオーディオデータとビデオデータ、または、ネットワークを介して他の装置から取得したオーディオデータやビデオデータを復号してモニタ１２６０に供給し、モニタ１２６０の画面にその画像を表示させ、モニタ１２６０のスピーカよりその音声を出力させることもできる。

もちろん、この他の動作も可能である。

図２６に示されるように、ハードディスクレコーダ１２００は、受信部１２２１、復調部１２２２、デマルチプレクサ１２２３、オーディオデコーダ１２２４、ビデオデコーダ１２２５、およびレコーダ制御部１２２６を有する。ハードディスクレコーダ１２００は、さらに、EPGデータメモリ１２２７、プログラムメモリ１２２８、ワークメモリ１２２９、ディスプレイコンバータ１２３０、OSD（On Screen Display）制御部１２３１、ディスプレイ制御部１２３２、記録再生部１２３３、D/Aコンバータ１２３４、および通信部１２３５を有する。

また、ディスプレイコンバータ１２３０は、ビデオエンコーダ１２４１を有する。記録再生部１２３３は、エンコーダ１２５１およびデコーダ１２５２を有する。

受信部１２２１は、リモートコントローラ（図示せず）からの赤外線信号を受信し、電気信号に変換してレコーダ制御部１２２６に出力する。レコーダ制御部１２２６は、例えば、マイクロプロセッサなどにより構成され、プログラムメモリ１２２８に記憶されているプログラムに従って、各種の処理を実行する。レコーダ制御部１２２６は、このとき、ワークメモリ１２２９を必要に応じて使用する。

通信部１２３５は、ネットワークに接続され、ネットワークを介して他の装置との通信処理を行う。例えば、通信部１２３５は、レコーダ制御部１２２６により制御され、チューナ（図示せず）と通信し、主にチューナに対して選局制御信号を出力する。

復調部１２２２は、チューナより供給された信号を、復調し、デマルチプレクサ１２２３に出力する。デマルチプレクサ１２２３は、復調部１２２２より供給されたデータを、オーディオデータ、ビデオデータ、およびEPGデータに分離し、それぞれ、オーディオデコーダ１２２４、ビデオデコーダ１２２５、またはレコーダ制御部１２２６に出力する。

オーディオデコーダ１２２４は、入力されたオーディオデータをデコードし、記録再生部１２３３に出力する。ビデオデコーダ１２２５は、入力されたビデオデータをデコードし、ディスプレイコンバータ１２３０に出力する。レコーダ制御部１２２６は、入力されたEPGデータをEPGデータメモリ１２２７に供給し、記憶させる。

ディスプレイコンバータ１２３０は、ビデオデコーダ１２２５またはレコーダ制御部１２２６より供給されたビデオデータを、ビデオエンコーダ１２４１により、例えばNTSC（National Television Standards Committee）方式のビデオデータにエンコードし、記録再生部１２３３に出力する。また、ディスプレイコンバータ１２３０は、ビデオデコーダ１２２５またはレコーダ制御部１２２６より供給されるビデオデータの画面のサイズを、モニタ１２６０のサイズに対応するサイズに変換し、ビデオエンコーダ１２４１によってNTSC方式のビデオデータに変換し、アナログ信号に変換し、ディスプレイ制御部１２３２に出力する。

ディスプレイ制御部１２３２は、レコーダ制御部１２２６の制御のもと、OSD（On Screen Display）制御部１２３１が出力したOSD信号を、ディスプレイコンバータ１２３０より入力されたビデオ信号に重畳し、モニタ１２６０のディスプレイに出力し、表示させる。

モニタ１２６０にはまた、オーディオデコーダ１２２４が出力したオーディオデータが、D/Aコンバータ１２３４によりアナログ信号に変換されて供給されている。モニタ１２６０は、このオーディオ信号を内蔵するスピーカから出力する。

記録再生部１２３３は、ビデオデータやオーディオデータ等を記録する記憶媒体としてハードディスクを有する。

記録再生部１２３３は、例えば、オーディオデコーダ１２２４より供給されるオーディオデータを、エンコーダ１２５１によりエンコードする。また、記録再生部１２３３は、ディスプレイコンバータ１２３０のビデオエンコーダ１２４１より供給されるビデオデータを、エンコーダ１２５１によりエンコードする。記録再生部１２３３は、そのオーディオデータの符号化データとビデオデータの符号化データとをマルチプレクサにより合成する。記録再生部１２３３は、その合成データをチャネルコーディングして増幅し、そのデータを、記録ヘッドを介してハードディスクに書き込む。

記録再生部１２３３は、再生ヘッドを介してハードディスクに記録されているデータを再生し、増幅し、デマルチプレクサによりオーディオデータとビデオデータに分離する。記録再生部１２３３は、デコーダ１２５２によりオーディオデータおよびビデオデータをデコードする。記録再生部１２３３は、復号したオーディオデータをD/A変換し、モニタ１２６０のスピーカに出力する。また、記録再生部１２３３は、復号したビデオデータをD/A変換し、モニタ１２６０のディスプレイに出力する。

レコーダ制御部１２２６は、受信部１２２１を介して受信されるリモートコントローラからの赤外線信号により示されるユーザ指示に基づいて、EPGデータメモリ１２２７から最新のEPGデータを読み出し、それをOSD制御部１２３１に供給する。OSD制御部１２３１は、入力されたEPGデータに対応する画像データを発生し、ディスプレイ制御部１２３２に出力する。ディスプレイ制御部１２３２は、OSD制御部１２３１より入力されたビデオデータをモニタ１２６０のディスプレイに出力し、表示させる。これにより、モニタ１２６０のディスプレイには、EPG（電子番組ガイド）が表示される。

また、ハードディスクレコーダ１２００は、インターネット等のネットワークを介して他の装置から供給されるビデオデータ、オーディオデータ、またはEPGデータ等の各種データを取得することができる。

通信部１２３５は、レコーダ制御部１２２６に制御され、ネットワークを介して他の装置から送信されるビデオデータ、オーディオデータ、およびEPGデータ等の符号化データを取得し、それをレコーダ制御部１２２６に供給する。レコーダ制御部１２２６は、例えば、取得したビデオデータやオーディオデータの符号化データを記録再生部１２３３に供給し、ハードディスクに記憶させる。このとき、レコーダ制御部１２２６および記録再生部１２３３が、必要に応じて再エンコード等の処理を行うようにしてもよい。

また、レコーダ制御部１２２６は、取得したビデオデータやオーディオデータの符号化データを復号し、得られるビデオデータをディスプレイコンバータ１２３０に供給する。ディスプレイコンバータ１２３０は、ビデオデコーダ１２２５から供給されるビデオデータと同様に、レコーダ制御部１２２６から供給されるビデオデータを処理し、ディスプレイ制御部１２３２を介してモニタ１２６０に供給し、その画像を表示させる。

また、この画像表示に合わせて、レコーダ制御部１２２６が、復号したオーディオデータを、D/Aコンバータ１２３４を介してモニタ１２６０に供給し、その音声をスピーカから出力させるようにしてもよい。

さらに、レコーダ制御部１２２６は、取得したEPGデータの符号化データを復号し、復号したEPGデータをEPGデータメモリ１２２７に供給する。

以上のようなハードディスクレコーダ１２００は、ビデオデコーダ１２２５、デコーダ１２５２、およびレコーダ制御部１２２６に内蔵されるデコーダとして画像復号装置２００を用いる。つまり、ビデオデコーダ１２２５、デコーダ１２５２、およびレコーダ制御部１２２６に内蔵されるデコーダは、画像復号装置２００の場合と同様に、符号化側（画像符号化装置１００）より供給されるsubmb_qp_delta等の量子化パラメータを用いて、サブマクロブロック毎に量子化値を算出し、逆量子化を行う。したがって、ビデオデコーダ１２２５、デコーダ１２５２、およびレコーダ制御部１２２６に内蔵されるデコーダは、画像の内容により適した逆量子化処理を行うことができ、主観画質の劣化を抑制させることができる。

したがって、ハードディスクレコーダ１２００は、例えば、チューナや通信部１２３５が受信するビデオデータ（符号化データ）や、記録再生部１２３３が再生するビデオデータ（符号化データ）に対して、画像の内容により適した逆量子化処理を行うことができ、主観画質の劣化を抑制させることができる。

また、ハードディスクレコーダ１２００は、エンコーダ１２５１として画像符号化装置１００を用いる。したがって、エンコーダ１２５１は、画像符号化装置１００の場合と同様に、サブマクロブロック毎に画像の複雑さを示す指標を算出し、その指標に基づいてサブマクロブロック毎に量子化値を算出し、そのサブマクロブロック毎の量子化値を用いて直交変換係数の量子化を行う。このようにすることにより、エンコーダ１２５１は、画像の内容により適した量子化処理を行うことができ、主観画質の劣化を抑制させることができる。

したがって、ハードディスクレコーダ１２００は、例えば、ハードディスクに記録する符号化データを生成する際に、画像の内容により適した量子化処理を行うことができ、復号画像の主観画質の劣化を抑制させるように符号化データを生成することができる。

なお、以上においては、ビデオデータやオーディオデータをハードディスクに記録するハードディスクレコーダ１２００について説明したが、もちろん、記録媒体はどのようなものであってもよい。例えばフラッシュメモリ、光ディスク、またはビデオテープ等、ハードディスク以外の記録媒体を適用するレコーダであっても、上述したハードディスクレコーダ１２００の場合と同様に、本発明を適用した画像符号化装置１００および画像復号装置２００を適用することができる。

＜７．第７の実施の形態＞
［カメラ］
図２７は、本発明を適用した画像符号化装置および画像復号装置を用いるカメラの主な構成例を示すブロック図である。

図２７に示されるカメラ１３００は、被写体を撮像し、被写体の画像をLCD１３１６に表示させたり、それを画像データとして、記録メディア１３３３に記録したりする。

レンズブロック１３１１は、光（すなわち、被写体の映像）を、CCD/CMOS１３１２に入射させる。CCD/CMOS１３１２は、CCDまたはCMOSを用いたイメージセンサであり、受光した光の強度を電気信号に変換し、カメラ信号処理部１３１３に供給する。

カメラ信号処理部１３１３は、CCD/CMOS１３１２から供給された電気信号を、Ｙ，Ｃｒ，Ｃｂの色差信号に変換し、画像信号処理部１３１４に供給する。画像信号処理部１３１４は、コントローラ１３２１の制御の下、カメラ信号処理部１３１３から供給された画像信号に対して所定の画像処理を施したり、その画像信号をエンコーダ１３４１で符号化したりする。画像信号処理部１３１４は、画像信号を符号化して生成した符号化データを、デコーダ１３１５に供給する。さらに、画像信号処理部１３１４は、オンスクリーンディスプレイ（OSD）１３２０において生成された表示用データを取得し、それをデコーダ１３１５に供給する。

以上の処理において、カメラ信号処理部１３１３は、バス１３１７を介して接続されるDRAM（Dynamic Random Access Memory）１３１８を適宜利用し、必要に応じて画像データや、その画像データが符号化された符号化データ等をそのDRAM１３１８に保持させる。

デコーダ１３１５は、画像信号処理部１３１４から供給された符号化データを復号し、得られた画像データ（復号画像データ）をLCD１３１６に供給する。また、デコーダ１３１５は、画像信号処理部１３１４から供給された表示用データをLCD１３１６に供給する。LCD１３１６は、デコーダ１３１５から供給された復号画像データの画像と表示用データの画像を適宜合成し、その合成画像を表示する。

オンスクリーンディスプレイ１３２０は、コントローラ１３２１の制御の下、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを、バス１３１７を介して画像信号処理部１３１４に出力する。

コントローラ１３２１は、ユーザが操作部１３２２を用いて指令した内容を示す信号に基づいて、各種処理を実行するとともに、バス１３１７を介して、画像信号処理部１３１４、DRAM１３１８、外部インタフェース１３１９、オンスクリーンディスプレイ１３２０、およびメディアドライブ１３２３等を制御する。FLASH ROM１３２４には、コントローラ１３２１が各種処理を実行する上で必要なプログラムやデータ等が格納される。

例えば、コントローラ１３２１は、画像信号処理部１３１４やデコーダ１３１５に代わって、DRAM１３１８に記憶されている画像データを符号化したり、DRAM１３１８に記憶されている符号化データを復号したりすることができる。このとき、コントローラ１３２１は、画像信号処理部１３１４やデコーダ１３１５の符号化・復号方式と同様の方式によって符号化・復号処理を行うようにしてもよいし、画像信号処理部１３１４やデコーダ１３１５が対応していない方式により符号化・復号処理を行うようにしてもよい。

また、例えば、操作部１３２２から画像印刷の開始が指示された場合、コントローラ１３２１は、DRAM１３１８から画像データを読み出し、それを、バス１３１７を介して外部インタフェース１３１９に接続されるプリンタ１３３４に供給して印刷させる。

さらに、例えば、操作部１３２２から画像記録が指示された場合、コントローラ１３２１は、DRAM１３１８から符号化データを読み出し、それを、バス１３１７を介してメディアドライブ１３２３に装着される記録メディア１３３３に供給して記憶させる。

記録メディア１３３３は、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアである。記録メディア１３３３は、もちろん、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であっても良い。

また、メディアドライブ１３２３と記録メディア１３３３を一体化し、例えば、内蔵型ハードディスクドライブやSSD（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

外部インタフェース１３１９は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタ１３３４と接続される。また、外部インタフェース１３１９には、必要に応じてドライブ１３３１が接続され、磁気ディスク、光ディスク、あるいは光磁気ディスクなどのリムーバブルメディア１３３２が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、FLASH ROM１３２４にインストールされる。

さらに、外部インタフェース１３１９は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。コントローラ１３２１は、例えば、操作部１３２２からの指示に従って、DRAM１３１８から符号化データを読み出し、それを外部インタフェース１３１９から、ネットワークを介して接続される他の装置に供給させることができる。また、コントローラ１３２１は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース１３１９を介して取得し、それをDRAM１３１８に保持させたり、画像信号処理部１３１４に供給したりすることができる。

以上のようなカメラ１３００は、デコーダ１３１５として画像復号装置２００を用いる。つまり、デコーダ１３１５は、画像復号装置２００の場合と同様に、符号化側（画像符号化装置１００）より供給されるsubmb_qp_delta等の量子化パラメータを用いて、サブマクロブロック毎に量子化値を算出し、逆量子化を行う。したがって、デコーダ１３１５は、画像の内容により適した逆量子化処理を行うことができ、主観画質の劣化を抑制させることができる。

したがって、カメラ１３００は、例えば、CCD/CMOS１３１２において生成される画像データや、DRAM１３１８または記録メディア１３３３から読み出すビデオデータの符号化データや、ネットワークを介して取得するビデオデータの符号化データに対して、画像の内容により適した逆量子化処理を行うことができ、主観画質の劣化を抑制させることができる。

また、カメラ１３００は、エンコーダ１３４１として画像符号化装置１００を用いる。エンコーダ１３４１は、画像符号化装置１００の場合と同様に、サブマクロブロック毎に画像の複雑さを示す指標を算出し、その指標に基づいてサブマクロブロック毎に量子化値を算出し、そのサブマクロブロック毎の量子化値を用いて直交変換係数の量子化を行う。このようにすることにより、エンコーダ１３４１は、画像の内容により適した量子化処理を行うことができ、主観画質の劣化を抑制させることができる。

したがって、カメラ１３００は、例えば、DRAM１３１８や記録メディア１３３３に記録する符号化データや、他の装置に提供する符号化データを生成する際に、画像の内容により適した量子化処理を行うことができ、復号画像の主観画質の劣化を抑制させるように符号化データを生成することができる。

なお、コントローラ１３２１が行う復号処理に画像復号装置２００の復号方法を適用するようにしてもよい。同様に、コントローラ１３２１が行う符号化処理に画像符号化装置１００の符号化方法を適用するようにしてもよい。

また、カメラ１３００が撮像する画像データは動画像であってもよいし、静止画像であってもよい。

もちろん、本発明を適用した画像符号化装置および画像復号装置は、上述した装置以外の装置やシステムにも適用可能である。

５００画像符号化装置，５０１フィルタ制御部，５０２適応ループフィルタ，５１１ ON/OFF部，５１２フィルタ係数算出部，５１３フィルタリング部，６０１フィルタ制御部，６０２適応ループフィルタ，６１１タップ長設定部，６１２フィルタ係数算出部，６２１ゼロ係数設定部

Claims

画像データに対して行われる適応フィルタ処理の動作を、前記画像データが他の画像データから参照されるか否かに応じて制御するフィルタ制御手段と、
動き補償ループ内において、前記フィルタ制御手段により制御されて、前記画像データに対して前記適応フィルタ処理を行うフィルタ処理手段と
を備える画像処理装置。
前記フィルタ制御手段は、
前記画像データの符号化処理において、前記適応フィルタ処理の対象となる前記画像データが前記他の画像データから参照される場合、前記適応フィルタ処理が行われるように制御し、
前記画像データの符号化処理において、前記適応フィルタ処理の対象となる前記画像データが前記他の画像データから参照されない場合、前記適応フィルタ処理が行われないように制御する
請求項１に記載の画像処理装置。
前記画像データはピクチャ単位のデータであり、
前記フィルタ制御手段は、前記ピクチャのタイプに応じて、前記画像データに対する前記適応フィルタ処理の動作を制御する
請求項１に記載の画像処理装置。
前記フィルタ制御手段は、前記画像データがＩピクチャである場合、前記適応フィルタ処理が行われるように制御し、前記画像データがＰピクチャおよびＢピクチャである場合、前記適応フィルタ処理が行われないように制御する
請求項３に記載の画像処理装置。
前記フィルタ制御手段は、前記画像データがＩピクチャもしくはＰピクチャである場合、前記適応フィルタ処理が行われるように制御し、前記画像データがＢピクチャである場合、前記適応フィルタ処理が行われないように制御する
請求項３に記載の画像処理装置。
前記フィルタ制御手段は、前記画像データが、階層Ｂピクチャを含む画像データのＩピクチャ、Ｐピクチャ、若しくは、参照されるＢピクチャである場合、前記適応フィルタ処理が行われるように制御し、前記画像データが、階層Ｂピクチャを含む画像データの参照されないＢピクチャである場合、前記適応フィルタ処理が行われないように制御する
請求項３に記載の画像処理装置。
前記画像データはスライス単位のデータであり、
前記フィルタ制御手段は、前記スライスのタイプに応じて、前記画像データに対する前記適応フィルタ処理の動作を制御する
請求項１に記載の画像処理装置。
前記フィルタ制御手段は、前記画像データがＩスライスである場合、前記適応フィルタ処理が行われるように制御し、前記画像データがＰスライスおよびＢスライスである場合、前記適応フィルタ処理が行われないように制御する
請求項７に記載の画像処理装置。
前記フィルタ制御手段は、前記画像データがＩスライスもしくはＰスライスである場合、前記適応フィルタ処理が行われるように制御し、前記画像データがＢピクチャである場合、前記適応フィルタ処理が行われないように制御する
請求項７に記載の画像処理装置。
前記フィルタ制御手段は、前記画像データが、階層Ｂスライスを含む画像データのＩスライス、Ｐスライス、若しくは、参照されるＢスライスである場合、前記適応フィルタ処理が行われるように制御し、前記画像データが、階層Ｂピクチャを含む画像データの参照されないＢスライスである場合、前記適応フィルタ処理が行われないように制御する
請求項７に記載の画像処理装置。
前記適応フィルタ処理された画像データを符号化する符号化手段をさらに備え、
前記符号化手段は、前記適応フィルタ処理のフィルタ係数および前記適応フィルタ処理を行う否かを示すフラグ情報を符号化し、前記画像データの符号化データに付加する
請求項１に記載の画像処理装置。
前記フィルタ制御手段は、前記画像データが他の画像データから参照されるか否かに応じて、前記適応フィルタ処理のフィルタ係数のタップ長を制御し、
前記フィルタ処理手段は、前記フィルタ制御手段により制御されたタップ長のフィルタ係数を用いて、前記画像データに対して前記適応フィルタ処理を行う
請求項１に記載の画像処理装置。
前記フィルタ制御手段は、
前記画像データの符号化処理において、前記適応フィルタ処理の対象となる前記画像データが前記他の画像データから参照される場合、前記タップ長を長くするように制御し、
前記画像データの符号化処理において、前記適応フィルタ処理の対象となる前記画像データが前記他の画像データから参照されない場合、前記タップ長を短くするように制御する
請求項１２に記載の画像処理装置。
画像処理装置のフィルタ制御手段が、画像データに対して行われる適応フィルタ処理の動作を、前記画像データが他の画像データから参照されるか否かに応じて制御し、
前記画像処理装置のフィルタ処理手段が、動き補償ループ内において、前記画像データに対して前記適応フィルタ処理を行う
画像処理方法。
コンピュータを、
画像データに対して行われる適応フィルタ処理の動作を、前記画像データが他の画像データから参照されるか否かに応じて制御するフィルタ制御手段、
動き補償ループ内において、前記フィルタ制御手段により制御されて、前記画像データに対して前記適応フィルタ処理を行うフィルタ処理手段
として機能させるためのプログラム。