WO2019065261A1

WO2019065261A1 - 符号化装置、符号化方法、復号装置、及び、復号方法

Info

Publication number: WO2019065261A1
Application number: PCT/JP2018/033918
Authority: WO
Inventors: 健治近藤
Original assignee: ソニー株式会社
Priority date: 2017-09-27
Filing date: 2018-09-13
Publication date: 2019-04-04
Also published as: CN111133757A; US20200273209A1; CN111133757B; US11423578B2

Abstract

本技術は、符号化効率を改善することができるようにする符号化装置、符号化方法、復号装置、及び、復号方法に関する。符号化装置及び復号装置は、予測符号化の残差と予測画像とを加算することにより得られる復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行い、復号途中画像と、復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められるクラスごとのタップ係数のうちの、注目画素のクラスのタップ係数を用いて、復号途中画像とのフィルタ演算を行う。本技術は、画像の符号化や復号を行う場合に適用することができる。

Description

符号化装置、符号化方法、復号装置、及び、復号方法

　本技術は、符号化装置、符号化方法、復号装置、及び、復号方法に関し、特に、例えば、画像の符号化効率を改善することができるようにする符号化装置、符号化方法、復号装置、及び、復号方法に関する。

　予測符号化方式の１つである、例えば、HEVC(High Efficiency Video Coding)で提案されたILF(In Loop Filter)としては、ブロックノイズを低減するためのDF(Deblocking Filter)、リンギングを低減するためのSAO(Sample Adaptive Offset)、符号化誤差（復号画像の、元画像に対する誤差）を最小化するためのALF(Adaptive Loop Filter)がある。

　ALFについては、特許文献１に記載され、SAOについては、特許文献２に記載されている。

特許第5485983号公報特表2014-523183号公報

　近年、符号化効率をより改善することができるILFの提案が要請されている。

　本技術は、このような状況に鑑みてなされたものであり、符号化効率を改善することができるようにするものである。

　本技術の復号装置は、予測符号化の残差と予測画像とを加算することにより得られる復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められるクラスごとのタップ係数を復号する復号部と、前記復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うクラス分類部と、前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行う演算部とを備える復号装置である。

　本技術の復号方法は、復号装置が、予測符号化の残差と予測画像とを加算することにより得られる復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められるクラスごとのタップ係数を復号することと、前記復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うことと、前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行うこととを含む復号方法である。

　本技術の復号装置及び復号方法においては、予測符号化の残差と予測画像とを加算することにより得られる復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められるクラスごとのタップ係数が復号される。また、前記復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類が行われ、前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算が行われる。

　本技術の符号化装置は、予測符号化の残差と予測画像とを加算することにより得られる復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うクラス分類部と、前記復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められる前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行う演算部と、前記タップ係数を符号化する符号化部とを備える符号化装置である。

　本技術の符号化方法は、符号化装置が、予測符号化の残差と予測画像とを加算することにより得られる復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うことと、前記復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められる前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行うことと、前記タップ係数を符号化することとを含む符号化方法である。

　本技術の符号化装置及び符号化方法においては、予測符号化の残差と予測画像とを加算することにより得られる復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類が行われ、前記復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められる前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算が行われる。また、前記タップ係数が符号化される。

　なお、符号化装置や復号装置は、独立した装置であっても良いし、１つの装置を構成している内部ブロックであっても良い。

　また、符号化装置や復号装置は、コンピュータにプログラムを実行させることにより実現することができる。プログラムは、伝送媒体を介して、伝送することにより、又は、記録媒体に記録して、提供することができる。

　本技術によれば、符号化効率を改善することができる。

　なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

本技術を適用した画像処理システムの一実施の形態の構成例を示す図である。 ALFのうちの、フィルタをかけるALF処理を行うALF処理部２０の構成例を示すブロック図である。係数取得部２３に記憶されるタップ係数の学習を行う学習部５０の構成例を示すブロック図である。画像符号化装置１００の構成例を示すブロック図である。 ALF１１０の構成例を示すブロック図である。学習部１３２の構成例を示すブロック図である。クラス分類部１６２で行われるクラス分類に用いられる注目画素の特徴量を求めるのに用いられるクラスブロックを説明する図である。クラスブロックを構成する画素の画素値の例を示す図である。注目画素の特徴量としてのTVノルムの算出方法の例を説明する図である。画像の周波数特性の例を示す図である。注目画素の特徴量としての最大差分絶対値の算出方法の例を説明する図である。注目画素の特徴量としての傾斜特徴量の概要を説明する図である。接線ベクトルを求める方法の例を説明する図である。注目画素のクラスブロックの画素の接線ベクトルt(x,y)の代表ベクトルt*を説明する図である。注目画素のクラスブロックの各画素(x,y)の接線ベクトルt(x,y)を代表する代表ベクトルt*を説明する図である。評価関数J(θ)を説明する図である。クラスブロックの各画素(x,y)の接線ベクトルt(x,y)と、方向θの単位ベクトルe(θ)との例を示す図である。評価関数J(θ)の計算を説明する図である。接線ベクトルt_iの例を示す図である。 tan^-1の計算結果を得るのに用いるLUTの例を説明する図である。注目画素の特徴量としての傾斜特徴量θ*の信頼度を説明する図である。画像の周波数特性の例を示す図である。傾斜特徴量θ*及び信頼度trを用いたクラス分類の例を説明する図である。傾斜特徴量θ*及び信頼度trと、他の特徴量とを用いたクラス分類の例を説明する図である。画像の周波数特性の例を示す図である。クラス分類部１６２の構成例を示すブロック図である。 ALF処理部１３３の構成例を示すブロック図である。クラス分類部１８２の構成例を示すブロック図である。画像符号化装置１００の符号化処理の例を説明するフローチャートである。 ALF処理の例を説明するフローチャートである。画像復号装置２００の構成例を示すブロック図である。 ALF２０７の構成例を示すブロック図である。 ALF処理部２３１の構成例を示すブロック図である。クラス分類部２４２の構成例を示すブロック図である。画像復号装置２００の復号処理の例を説明するフローチャートである。 ALF処理の例を説明するフローチャートである。傾斜特徴量を用いたクラス分類が行われる場合に、クラスごとのタップ係数を効率的に符号化する符号化方法を説明する図である。クラスに応じたタップ構造の変更を説明する図である。クラスに応じたタップ構造の変更をさらに説明する図である。クラス分類パラメータの生成の例を説明する図である。コンピュータのハードウエアの構成例を示すブロック図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。ビデオセットの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の他の例を示すブロック図である。ネットワークシステムの概略的な構成の一例を示すブロック図である。

　＜本技術を適用した画像処理システム＞

　図１は、本技術を適用した画像処理システムの一実施の形態の構成例を示す図である。

　図１において、画像処理システムは、画像符号化装置１００及び画像復号装置２００を有する。

　画像符号化装置１００には、符号化対象の元画像が供給される。

　画像符号化装置１００は、例えば、HEVCやAVC(Advanced Video Coding)等のような予測符号化により、元画像を符号化する。

　画像符号化装置１００の予測符号化では、元画像の予測画像が生成され、元画像と予測画像との残差が符号化される。

　さらに、画像符号化装置１００の予測符号化では、予測符号化の残差と予測画像とを加算することにより得られる復号途中画像に、ALFをかけるALF処理を行うことで、予測画像の予測に用いられる参照画像が生成される。

　ここで、ALF処理としてのフィルタ処理（フィルタリング）が、復号途中画像に施されることにより得られる画像を、フィルタ後画像ともいう。

　画像符号化装置１００は、予測符号化を行う他、必要に応じて、復号途中画像とその復号途中画像に対応する元画像とを用いて学習等を行うことにより、フィルタ後画像が、なるべく元画像に近くなるようなALF処理としてのフィルタ処理に関する情報を、フィルタ情報として求めることができる。

　画像符号化装置１００のALF処理は、学習により得られるフィルタ情報を用いて行うことができる。

　ここで、フィルタ情報を求める学習は、例えば、元画像の１又は複数のシーケンスごとや、元画像の１又は複数のシーン（シーンチェンジから、次のシーンチェンジまでのフレーム）ごと、元画像の１又は複数のフレーム（ピクチャ）ごと、元画像の１又は複数のスライスごと、ピクチャの符号化の単位のブロックの１又は複数ラインごと、その他任意の単位で行うことができる。また、フィルタ情報を求める学習は、例えば、残差やRDコストが閾値以上になった場合に行うことができる。

　画像符号化装置１００は、元画像の予測符号化により得られる符号化データを、伝送媒体１１を介して伝送し、又は、記録媒体１２に伝送して記録させる。

　また、画像符号化装置１００は、学習により得られるフィルタ情報を、伝送媒体１１を介して伝送し、又は、記録媒体１２に伝送して記録させることができる。

　なお、フィルタ情報を求める学習は、画像符号化装置１００とは別の装置で行うことができる。

　また、フィルタ情報は、符号化データとは別に伝送することもできるし、符号化データに含めて伝送することもできる。

　さらに、フィルタ情報を求める学習は、元画像そのもの（及び元画像から得られる復号途中画像）を用いて行う他、画像特徴量が元画像と類似する、元画像とは別個の画像を用いて行うことができる。

　画像復号装置２００は、画像符号化装置１００から伝送される符号化データ及び必要なフィルタ情報を、伝送媒体１１や記録媒体１２を介して受け取り（受信し）（取得し）、符号化データを、画像符号化装置１００の予測符号化に対応する方式で復号する。

　すなわち、画像復号装置２００は、画像符号化装置１００からの符号化データを処理することで、予測符号化の残差を求める。さらに、画像復号装置２００は、残差と予測画像とを加算することにより、画像符号化装置１００で得られるのと同様の復号途中画像を求める。そして、画像復号装置２００は、復号途中画像に、画像符号化装置１００からのフィルタ情報を必要に応じて用いたALF処理としてのフィルタ処理を施し、フィルタ後画像を求める。

　画像復号装置２００において、フィルタ後画像は、元画像の復号画像として出力されるとともに、必要に応じて、予測画像の予測に用いられる参照画像として一時記憶される。

　以下、ALFの概要を説明する。

　＜ALFの概要＞

　図２は、ALFのうちの、画像にフィルタをかけるALF処理を行うALF処理部２０の構成例を示すブロック図である。

　ここで、ALF処理では、第１の画像と、第２の画像とを用いた誤差を最小にする学習により求められるクラスごとのタップ係数を用いて、第１の画像とのフィルタ演算が行われ、第２の画像（の予測値）が求められる。

　図２において、ALF処理部２０は、タップ選択部２１、クラス分類部２２、係数取得部２３、及び、フィルタ演算部２４を有する。

　ALF処理部２０には、第１の画像が供給される。ALF処理部２０に供給される第１の画像は、タップ選択部２１及びクラス分類部２２に供給される。

　タップ選択部２１は、第１の画像を構成する画素を、順次、注目画素に選択する。さらに、タップ選択部２１は、注目画素に対応する第２の画像の対応画素（の画素値）を予測するのに用いる第１の画像を構成する画素（の画素値）の幾つかを、予測タップとして選択する。

　具体的には、タップ選択部２１は、注目画素の時空間の位置から空間的（や時間的）に近い位置にある第１の画像の複数の画素を、予測タップとして選択することにより、予測タップを構成し、フィルタ演算部２４に供給する。

　クラス分類部２２は、一定の規則に従って、注目画素を、幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行い、その結果得られる注目画素のクラス（を表すクラスコード）を、係数取得部２３に供給する。

　すなわち、クラス分類部２２は、例えば、注目画素の周辺領域を、その注目画素のクラス分類に用いるクラスブロックに設定し、そのクラスブロック（内）の画素を用いて、注目画素をクラス分類する。

　例えば、クラス分類部２２は、クラスブロックを用いて、注目画素の特徴量を求める。さらに、クラス分類部２２は、注目画素の特徴量を用いて、注目画素をクラス分類し、注目画素のクラスを求める。

　係数取得部２３は、後述する学習によって求められたクラスごとのタップ係数を記憶し、さらに、その記憶したタップ係数から、クラス分類部２２から供給される注目画素のクラスのタップ係数を取得する。そして、係数取得部２３は、注目画素のクラスのタップ係数を、フィルタ演算部２４に供給する。

　ここで、タップ係数とは、ディジタルフィルタにおける、いわゆるタップにおいて入力データと乗算される係数に相当する。ここでは、タップ係数と乗算される入力データが予測タップである。

　また、注目画素の予測タップを構成する画素の配置（注目画素と予測タップを構成する画素との位置関係）を、タップ構造ともいう。予測タップを構成する画素の位置に、その画素と乗算されるタップ係数を配置した状態を考えると、タップ構造は、タップ係数の配置であるということもできる。そこで、タップ構造とは、注目画素の予測タップを構成する画素の配置、及び、予測タップを構成する画素の位置に、その画素と乗算されるタップ係数を配置した状態でのタップ係数の配置のいずれをも意味することとする。

　フィルタ演算部２４は、係数取得部２３から供給される注目画素のクラスのタップ係数を用いて、第１の画像とのフィルタ演算を行い、注目画素に対応する第２の画像の画素（対応画素）の画素値の予測値を求める。

　すなわち、フィルタ演算部２４は、タップ選択部２１が出力する注目画素の予測タップと、係数取得部２３からの注目画素のクラスのタップ係数とを用いて、所定の演算であるフィルタ演算を行い、注目画素に対応する第２の画像の対応画素の画素値の予測値を求めて出力する。

　図３は、係数取得部２３に記憶されるタップ係数の学習を行う学習部５０の構成例を示すブロック図である。

　ここで、例えば、符号化の対象の元画像を第２の画像とするとともに、その元画像の予測符号化を行い、その予測符号化の残差と予測画像とを加算することにより得られる復号途中画像を第１の画像として、第１の画像から予測タップを選択し、その予測タップとタップ係数を用いて、第２の画像である元画像の画素の画素値（の予測値）を、所定のフィルタ演算によって求めることとする。

　所定のフィルタ演算として、例えば、積和演算を採用することとすると、第１の画像の注目画素に対応する第２の画像（元画像）の対応画素の画素値yは、次の線形１次式によって求められる。

　　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（１）

　但し、式（１）において、x_nは、注目画素の予測タップを構成するn番目の、第１の画像の画素（以下、適宜、第１の画素という）の画素値を表し、w_nは、予測タップを構成するn番目の第１の画素（の画素値）と乗算されるn番目のタップ係数を表す。なお、式（１）では、予測タップが、N個の第１の画素（の画素値）x₁，x₂，・・・，x_Nで構成される。

　ここで、対応画素の画素値yは、式（１）に示した線形１次式ではなく、２次以上の高次の式によって求めるようにすることも可能である。

　いま、第ｋサンプルの対応画素の画素値の真値をy_kと表すとともに、式（１）によって得られるその真値y_kの予測値をy_k’と表すと、その予測誤差e_kは、次式で表される。

　　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（２）

　いま、式（２）の予測値y_k’は、式（１）にしたがって求められるため、式（２）のy_k’を、式（１）にしたがって置き換えると、次式が得られる。

　　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（３）

　但し、式（３）において、x_n,kは、第kサンプルの対応画素に対する（注目画素の）予測タップを構成するn番目の第１の画素を表す。

　式（３）（又は式（２））の予測誤差e_kを０とするタップ係数w_nが、対応画素を予測するのに最適なものとなるが、すべての対応画素について、そのようなタップ係数w_nを求めることは、一般には困難である。

　そこで、タップ係数w_nが最適なものであることを表す規範として、例えば、最小自乗法を採用することとすると、最適なタップ係数w_nは、次式で表される自乗誤差の総和E（統計的な誤差）を最小にすることで求めることができる。

　　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（４）

　但し、式（４）において、Kは、対応画素としての対応画素y_kと、その対応画素y_kに対する予測タップを構成する第１の画素x_1,k，x_2,k，・・・，x_N,kとのセットのサンプル数（学習用のサンプルの数）を表す。

　式（４）の自乗誤差の総和Eの最小値（極小値）は、式（５）に示すように、総和Eをタップ係数w_nで偏微分したものを０とするw_nによって与えられる。

　　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（５）

　そこで、上述の式（３）をタップ係数w_nで偏微分すると、次式が得られる。

　　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（６）

　式（５）と（６）から、次式が得られる。

　　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（７）

　式（７）のe_kに、式（３）を代入することにより、式（７）は、式（８）に示す正規方程式で表すことができる。

　　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（８）

　式（８）の正規方程式は、例えば、掃き出し法（Gauss-Jordanの消去法）等を用いることにより、タップ係数w_nについて解くことができる。

　式（８）の正規方程式を、クラスごとにたてて解くことにより、最適なタップ係数（ここでは、自乗誤差の総和Eを最小にするタップ係数）w_nを、クラスごとに求めることができる。

　図３は、式（８）の正規方程式をたてて解くことによりタップ係数w_nを求める学習を行う学習部５０の構成例を示すブロック図である。

　学習部５０では、タップ係数w_nの学習の教師（真値）となる教師画像、及び、タップ係数w_nの学習の生徒（フィルタ演算の入力）となる生徒画像を用いて、タップ係数w_nを求める学習であるタップ係数学習が行われる。

　タップ係数w_nの学習の教師（真値）となる教師画像とは、式（１）のフィルタ演算によって予測値を求める画像であり、教師画像としては、第２の画像（又は第２の画像に相当する画像（第２の画像と同様の特徴量を有する画像））が用いられる。また、タップ係数w_nの学習の生徒となる生徒画像とは、式（１）のタップ係数w_nとのフィルタ演算の対象となる画像であり、生徒画像としては、第１の画像（又は第１の画像に相当する画像（第１の画像と同様の特徴量を有する画像））が用いられる。

　タップ係数学習では、生徒画像を構成する画素を、順次、注目画素とし、その注目画素について、図２のタップ選択部２１が選択するのと同一のタップ構造の画素を、生徒画像から予測タップとして選択する。さらに、タップ係数学習では、注目画素に対応する教師画像を構成する対応画素と、注目画素の予測タップとを用い、クラスごとに、式（８）の正規方程式をたてて解くことにより、クラスごとのタップ係数w_nが求められる。

　図３において、学習部５０は、タップ選択部５１、クラス分類部５２、足し込み部５３、及び、係数算出部５４を有する。

　学習部５０には、生徒画像としての第１の画像、及び、教師画像としての第２の画像が供給される。

　生徒画像は、タップ選択部５１及びクラス分類部５２に供給され、教師画像は、足し込み部５３に供給される。

　タップ選択部５１は、生徒画像を構成する画素を、順次、注目画素として選択し、その注目画素を表す情報を、必要なブロックに供給する。

　さらに、タップ選択部５１は、注目画素について、生徒画像を構成する画素から、図２のタップ選択部２１が選択するのと同一の画素を予測タップに選択し、これにより、タップ選択部２１で得られるのと同一のタップ構造の予測タップを得て、足し込み部５３に供給する。

　クラス分類部５２は、生徒画像を用いて、注目画素について、図２のクラス分類部２２と同一のクラス分類を行い、その結果得られる注目画素のクラスを、足し込み部５３に出力する。

　すなわち、クラス分類部５２は、図２のクラス分類部２２と同様に、注目画素の周辺領域を、その注目画素のクラス分類に用いるクラスブロックに設定し、そのクラスブロックの画素を用いて、注目画素をクラス分類する。

　例えば、クラス分類部５２は、クラスブロックを用いて、注目画素の特徴量を求める。さらに、クラス分類部２２は、注目画素の特徴量を用いて、注目画素をクラス分類し、注目画素のクラスを求める。

　足し込み部５３は、教師画像を構成する画素から、注目画素に対応する対応画素（の画素値）を取得し、対応画素と、タップ選択部５１から供給される注目画素の予測タップを構成する生徒画像の画素（の画素値）とを対象とした足し込みを、クラス分類部５２から供給されるクラスごとに行う。

　すなわち、足し込み部５３には、教師画像の対応画素y_k、生徒画像としての注目画素の予測タップx_n,k、注目画素のクラスが供給される。

　足し込み部５３は、注目画素のクラスごとに、予測タップ（生徒画像）x_n,kを用い、式（８）の左辺の行列における予測タップとしての画素（の画素値）どうしの乗算（x_n,kx_n',k）と、サメーション（Σ）に相当する演算を行う。

　さらに、足し込み部５３は、やはり、注目画素のクラスごとに、予測タップ（生徒画像）x_n,kと対応画素y_kを用い、式（８）の右辺のベクトルにおける予測タップとしての画素x_n,k及び対応画素（の画素値）y_kの乗算（x_n,ky_k）と、サメーション（Σ）に相当する演算を行う。

　すなわち、足し込み部５３は、前回、教師画像の、注目画素に対応する対応画素y_kについて求められた式（８）における左辺の行列のコンポーネント（Σx_n,kx_n',k）と、右辺のベクトルのコンポーネント（Σx_n,ky_k）を、その内蔵するメモリ（図示せず）に記憶しており、その行列のコンポーネント（Σx_n,kx_n',k）又はベクトルのコンポーネント（Σx_n,ky_k）に対して、新たな注目画素に対応する対応画素となった教師画像の画素y_k+1について、その画素y_k+1及び予測タップとしての画素x_n,k+1を用いて計算される、対応するコンポーネントx_n,k+1x_n',k+1又はx_n,k+1y_k+1を足し込む（式（８）のサメーションで表される加算を行う）。

　そして、足し込み部５３は、例えば、生徒画像の画素すべてを注目画素として、上述の足し込みを行うことにより、各クラスについて、式（８）に示した正規方程式をたて、その正規方程式を、係数算出部５４に供給する。

　係数算出部５４は、足し込み部５３から供給される各クラスについての正規方程式を解くことにより、各クラスについて、最適なタップ係数w_nを求めて出力する。

　図２のALF処理部２０における係数取得部２３には、以上のようにして求められたクラスごとのタップ係数w_nが記憶される。

　＜画像符号化装置１００の構成例＞

　図４は、図１の画像符号化装置１００の構成例を示すブロック図である。

　図４において、画像符号化装置１００は、演算部１０１、直交変換部１０２、量子化部１０３、可逆符号化部１０４、逆量子化部１０５、逆直交変換部１０６、演算部１０７、DF１０８、SAO１０９、ALF１１０、DPB(Decoded Picture Buffer)１１１、及び、予測部１１２を有する。

　画像符号化装置１００には、予測符号化の対象となる元画像が供給される。元画像は、演算部１０１、ALF１１０、及び、予測部１１２に供給される。

　演算部１０１は、元画像から、予測部１１２から供給される予測画像を減算し、その減算により得られる残差（予測残差）を、直交変換部１０２に供給する。

　直交変換部１０２は、演算部１０１から供給される残差に対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。なお、この直交変換の方法は任意である。直交変換部１０２は、直交交換により得られる変換係数を、量子化部１０３に供給する。

　量子化部１０３は、直交変換部１０２から供給される変換係数を量子化する。なお、この量子化の方法は任意である。量子化部１０３は、量子化された変換係数を、可逆符号化部１０４に供給する。

　可逆符号化部１０４は、量子化部１０３において量子化された変換係数を所定の可逆符号化方式で符号化（エントロピー符号化）し、符号化データを生成する。

　また、可逆符号化部１０４は、ALF１１０から、そのALF１１０で行われるALF処理に関するフィルタ情報を取得する。フィルタ情報には、クラスごとのタップ係数や、クラス分類に用いられる後述するクラス分類パラメータが含まれる。

　さらに、可逆符号化部１０４は、画像符号化装置１００での予測符号化に関する符号化情報のうちの、必要な符号化情報を、各ブロックから取得する。符号化情報としては、例えば、イントラ予測やインター予測の予測モード、動きベクトル等の動きに関する情報、量子化パラメータQP、ピクチャタイプ(I,P,B)の情報等がある。

　可逆符号化部１０４は、符号化情報及びフィルタ情報を、所定の可逆符号化方式で符号化し、符号化データのヘッダ情報の一部に多重化する。したがって、可逆符号化部１０４は、フィルタ情報（に含まれるタップ係数やクラス分類パラメータ）を符号化する符号化部として機能する。

　可逆符号化部１０４は、以上のようにして得られる符号化データを伝送する。したがって、可逆符号化部１０４は、符号化データ、ひいては、符号化データに含まれるフィルタ情報を伝送する伝送部としても機能する。

　可逆符号化部１０４の可逆符号化方式としては、例えば、可変長符号化又は算術符号化等を採用することができる。可変長符号化としては、例えば、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）等がある。算術符号化としては、例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）等がある。

　量子化部１０３において量子化された変換係数は、可逆符号化部１０４に供給される他、逆量子化部１０５にも供給される。逆量子化部１０５は、量子化された変換係数を、量子化部１０３による量子化に対応する方法で逆量子化する。この逆量子化の方法は、量子化部１０３による量子化処理に対応する方法であればどのような方法であってもよい。逆量子化部１０５は、逆量子化により得られる変換係数を、逆直交変換部１０６に供給する。

　逆直交変換部１０６は、逆量子化部１０５から供給される変換係数を、直交変換部１０２による直交変換処理に対応する方法で逆直交変換する。この逆直交変換の方法は、直交変換部１０２による直交変換処理に対応する方法であればどのようなものであってもよい。逆直交変換部１０６での変換係数の逆直交変換により、残差が求められ、その残差は、演算部１０７に供給される。

　演算部１０７は、逆直交変換部１０６から供給される逆直交変換の結果である残差に、予測部１１２から供給される予測画像を加算し、その加算結果を、復号途中の復号途中画像として出力する。

　演算部１０７が出力する復号途中画像は、DF１０８に供給される。

　DF１０８は、演算部１０７からの復号途中画像にDFのフィルタ処理を行い、そのフィルタ処理後の復号途中画像を、SAO１０９に供給する。

　SAO１０９は、DF１０８からの復号途中画像に、SAOのフィルタ処理を行い、そのフィルタ処理後の復号途中画像を、ALF１１０に供給する。

　ALF１１０は、SAO１０９からの復号途中画像に、ALFのフィルタ処理、すなわち、ALF処理を行い、そのALF処理によって得られるフィルタ後画像を、DPB１１１に供給する。

　すなわち、ALF１１０は、SAO１０９からの復号途中画像を生徒画像として用いるとともに、元画像を教師画像として用い、タップ係数学習を行って、クラスごとのタップ係数を求める。クラスごとのタップ係数は、フィルタ情報として、ALF１１０から可逆符号化部１０４に供給される。

　さらに、ALF１１０は、SAO１０９からの復号途中画像を第１の画像として、クラスごとのタップ係数を用いたALF処理を用いて行うことで、第１の画像としての復号途中画像を、元画像（第２の画像）の予測値、すなわち、元画像に近い画像（理想的には、元画像に一致する画像）としてのフィルタ後画像に変換して（フィルタ後画像を生成して）出力する。

　ALF１１０が出力するフィルタ後画像は、DPB１１１に供給される。

　DPB１１１は、ALF１１０から供給されるフィルタ後画像を、局所復号された復号画像として一時記憶する。DPB１１１に記憶された復号画像は、必要なタイミングで読み出され、予測画像の生成に用いられる参照画像として、予測部１１２に供給される。

　予測部１１２は、元画像と、DPB１１１から供給される参照画像とを用いて、例えば、PU(Prediction Unit)を処理単位として、イントラ予測（画面内予測）及びインター予測を行い、元画像の予測画像を生成する。

　予測部１１２は、所定のコスト関数（例えば、RD(Rate-Distortion)コスト）に基づいて、予測画像の生成を行ったイントラ予測及びインター予測の予測モードの中から、最適な予測モードを選択し、その最適な予測モードで生成された予測画像を、演算部１０１及び１０７に供給する。

　なお、図４では、HEVCに合わせて、画像符号化装置１００に、DF１０８及びSAO１０９を設けたが、画像符号化装置１００は、DF１０８及びSAO１０９のうちの一方又は両方を設けずに構成することができる。

　画像符号化装置１００を、DF１０８を設けずに構成する場合には、演算部１０７が出力する復号途中画像が、SAO１０９でSAOのフィルタ処理が施されてから、ALF１１０に供給される。また、画像符号化装置１００を、SAO１０９を設けずに構成する場合には、演算部１０７が出力する復号途中画像が、DF１０８でDFのフィルタ処理が施されてから、ALF１１０に供給される。さらに、画像符号化装置１００を、DF１０８及びSAO１０９を設けずに構成する場合には、演算部１０７が出力する復号途中画像そのものが、ALF１１０に供給される。

　また、ALF１１０の前段や後段には、DF１０８やSAO１０９以外のフィルタを設けることができる。

　さらに、画像符号化装置１００では、元画像のピクチャを、すべてIピクチャとして符号化することができる。この場合、予測部１１２では、インター予測は行われず、イントラ予測だけが行われる。

　＜ALF１１０の構成例＞

　図５は、図４のALF１１０の構成例を示すブロック図である。

　図５において、ALF１１０は、クラス分類パラメータ生成部１３１、学習部１３２、及び、ALF処理部１３３を有する。

　クラス分類パラメータ生成部１３１には、教師画像としての元画像が供給される。クラス分類パラメータ生成部１３１は、教師画像としての元画像を用いて、学習部１３２やALF処理部１３３で行われるクラス分類に用いるクラス分類パラメータを生成して出力する。クラス分類パラメータ生成部１３１が出力するクラス分類パラメータは、学習部１３２、及び、ALF処理部１３３に供給される。さらに、クラス分類パラメータ生成部１３１が出力するクラス分類パラメータは、学習部１３２が出力するタップ係数とともに、フィルタ情報に含められ、可逆符号化部１０４（図４）に供給される。

　なお、ここでは、クラス分類パラメータ生成部１３１は、教師画像としての元画像を用いて、クラス分類パラメータを生成するが、クラス分類パラメータは、元画像に代えて、図中、点線で示すように、生徒画像としての復号途中画像を用いて生成することができる。

　学習部１３２には、クラス分類パラメータ生成部１３１からクラス分類パラメータが供給される他、元画像が供給されるとともに、SAO１０９（図４）から復号途中画像が供給される。

　学習部１３２は、復号途中画像を生徒画像として用いるとともに、元画像を教師画像として用いて、タップ係数学習を行い、そのタップ係数学習により得られるクラスごとのタップ係数を出力する。学習部１３２が出力するタップ係数は、上述したように、フィルタ情報に含められ、可逆符号化部１０４に供給される他、ALF処理部１３３に供給される。

　ここで、学習部１３２では、タップ係数学習のクラス分類が、クラス分類パラメータ生成部１３１から供給されるクラス分類パラメータを用いて行われる。

　ALF処理部１３３には、クラス分類パラメータ生成部１３１からクラス分類パラメータが供給されるとともに、学習部１３２からクラスごとのタップ係数が供給される他、SAO１０９（図４）から復号途中画像が供給される。

　ALF処理部１３３は、例えば、復号途中画像を第１の画像として、その第１の画像に、学習部１３２からのクラスごとのタップ係数を用いたALF処理を施すことで、第１の画像としての復号途中画像を、元画像である第２の画像の予測値としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、DPB１１１（図４）に供給する。

　ALF処理部１３３は、ALF処理において、学習部１３２と同様に、クラス分類を、クラス分類パラメータ生成部１３１から供給されるクラス分類パラメータを用いて行う。

　なお、ALF１１０では、学習部１３２において、タップ係数学習が適宜行われ、クラスごとのタップ係数が更新される。そして、更新後のクラスごとのタップ係数が、ALF処理部１３３に供給されるとともに、フィルタ情報に含められ、画像符号化装置１００から画像復号装置２００に伝送される。

　タップ係数の更新を行う更新単位としては、例えば、複数のピクチャ（フレーム）、１ピクチャ、CUその他のブロック等の、任意のシーケンスを採用し、その更新単位を最小単位とするタイミングで、タップ係数を更新することができる。

　＜学習部１３２の構成例＞

　図６は、図５の学習部１３２の構成例を示すブロック図である。

　学習部１３２は、タップ選択部１６１、クラス分類部１６２、足し込み部１６３、及び、係数算出部１６４を有する。

　タップ選択部１６１ないし係数算出部１６４は、図３の学習部５０を構成するタップ選択部５１ないし係数算出部５４とそれぞれ同様の処理を行う。

　但し、クラス分類部１６２は、図３のクラス分類部５２と同様に、注目画素の周辺領域であるクラスブロックの画素を用いて、注目画素の特徴量を求め、その特徴量を用いて、注目画素のクラス分類を行うが、注目画素の特徴量を求めるにあたっては、元画像の符号化の符号化効率の改善に資する特徴量を求める。

　すなわち、クラス分類部１６２は、例えば、注目画素のクラスブロックの画素の画素値（例えば、輝度）の平均値や、分散、注目画素の画素値の等高線の接線方向を表す傾斜特徴量、傾斜特徴量の信頼度、TV(Total variation)ノルム、最大差分絶対値等を、注目画素の特徴量として求める。ここで、傾斜特徴量、傾斜特徴量の信頼度、TVノルム、最大差分絶対値の詳細については、後述する。

　そして、クラス分類部１６２は、クラス分類パラメータ生成部１３１からのクラス分類パラメータを用いるとともに、注目画素の特徴量を用いて（特徴量に応じて）、注目画素のクラス分類を行い、その結果得られる注目画素のクラスを、足し込み部１６３に供給する。

　クラス分類部１６２のクラス分類では、例えば、注目画素の特徴量が、クラス分類パラメータによって規定される所定の式、すなわち、例えば、クラス分類パラメータを閾値とする式を満たすかどうかによって、注目画素が、所定の式を満たすことに対応するクラス、又は、所定の式を満たさないことに対応するクラスに分類される。

　また、クラス分類部１６２のクラス分類では、例えば、注目画素の特徴量が、クラス分類パラメータによって規定される線形識別器に入力され、その線形識別器の出力に応じて、注目画素が、線形識別器の出力に対応するクラスに分類される。

　なお、クラス分類部１６２で得られる注目画素のクラスは、足し込み部１６３の他、タップ選択部１６１にも供給することができる。この場合、タップ選択部１６１では、クラス分類部１６２からの注目画素のクラスに応じて、予測タップのタップ構造を変更することができる。

　すなわち、予測タップのタップ構造としては、注目画素のクラスによって異なるタップ構造を採用することができる。例えば、あるクラスについては、注目画素、並びに注目画素の上に隣接する2画素、下に隣接する2画素、左に隣接する2画素、及び、右に隣接する2画素の合計で9画素の十字形状のタップ構造を採用し、他のクラスについては、注目画素を中心とする横×縦が3×3画素の合計で9画素の正方形状のタップ構造を採用することができる。

　なお、上述の9画素の十字形状のタップ構造と、9画素の正方形状のタップ構造とは、予測タップを構成する画素の数（予測タップと乗算されるタップ係数の数も同様）が同一であるが、異なるタップ構造には、予測タップを構成する画素の数が異なるタップ構造が含まれる。

　クラスに応じて、予測タップのタップ構造が変更される場合、すなわち、クラスごとに、予測タップのタップ構造が異なる場合、その予測タップとしての画素（の画素値）とのフィルタ演算に用いられるタップ係数のタップ構造も、クラスに応じて異なる。

　ここで、クラス分類部１６２では、注目画素の特徴量の他、注目画素の予測符号化に関する符号化情報、すなわち、例えば、注目画素のQP(quantization parameter)やCBF(Coded Block Flag)等をも用いて、クラス分類を行うことができる。

　また、学習部１３２において、タップ係数学習は、例えば、更新単位の復号途中画像及び元画像を、生徒画像及び教師画像として用いて行われる。

　＜クラス分類＞

　図７は、図６のクラス分類部１６２（ひいては、ALF１１０）で行われるクラス分類に用いられる注目画素の特徴量を求めるのに用いられるクラスブロックを説明する図である。

　注目画素のクラスブロックとしては、復号途中画像において、注目画素を含む、注目画素の周辺の画素で構成されるブロック（局所領域）を採用することができる。

　また、注目画素のクラスブロックとしては、注目画素を含むCUやPU等の所定のブロックを採用することができる。この場合、CUやPU等の所定のブロックを構成する画素については、同一のクラスブロックが採用されるので、クラスも同一になる。

　図８は、クラスブロックを構成する画素の画素値の例を示す図である。

　なお、以下では、特に断らない限り、復号途中画像等の画像の左から右方向を、x方向（x軸）とするとともに、上から下方向を、y方向（y軸）とする。

　いま、I(x,y)が、座標(x,y)の位置の画素の画素値を表すこととすると、図８において、I(x,Y)は、y=Yの行のクラスブロック内の画素の画素値を示しており、I(X,y)は、x=Xの列のクラスブロック内の画素の画素値を示している。

　クラス分類部１６２は、注目画素のクラスブロックの画素を用い、例えば、そのクラスブロックの画素の画素値の平均値や、分散、注目画素の画素値の等高線の接線方向を表す傾斜特徴量、傾斜特徴量の信頼度、TVノルム、最大差分絶対値等を、注目画素の特徴量として求める。

　図９は、注目画素の特徴量としてのTVノルムの算出方法の例を説明する図である。

　すなわち、図９は、図８と同様に、クラスブロックを構成する画素の画素値の例を示している。

　クラス分類部１６２は、注目画素のクラスブロックの画素のうちの、隣接する画素どうしの画素値の差（図９において、矢印で示す部分）の絶対値の総和TVxyを、TVノルムとして、式（９）に従って求める。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（９）

　ここで、式（９）において、TVxは、クラスブロックの画素のうちの、x方向に隣接する画素どうしの画素値の差I(x,y)-I(x+1,y)の絶対値の総和を表し、TVyは、クラスブロックの画素のうちの、y方向に隣接する画素どうしの画素値の差I(x,y)-I(x,y+1)の絶対値の総和を表す。また、Sは、クラスブロック（としての領域）を表し、x,y∈Sは、x,yがクラスブロックS内の画素の位置の座標であることを表す。

　式（９）によれば、総和TVxとTVyとの和が、TVノルムTVxyとして求められる。

　TVノルムTVxyは、注目画素の周辺における画像の周波数成分のうちの高周波成分の程度（量、多さ）を表す。

　図１０は、画像の周波数特性の例を示す図である。

　図１０において、横軸は周波数を表し、縦軸は周波数成分の強度を表す。

　画像は、図１０に示すように、低周波数成分が多く、高周波数成分が高域になるほど少なくなる傾向の周波数特性を有する。

　図１０において、グラフL11は、高周波数成分が比較的多い画像の周波数特性を示しており、グラフL12は、高周波数成分が比較的少ない画像の周波数特性を示している。

　グラフL11で示される周波数特性を有するような高周波数成分が比較的多い画像と、グラフL12で示される周波数特性を有するような高周波数成分が比較的少ない画像とでは、ALF処理に適切なタップ係数が異なることが予想される。

　ここで、適切なタップ係数とは、ALF処理によって得られるフィルタ後画像として、元画像により近い画像が得られるタップ係数（式（４）の自乗誤差の総和Eをより小にするタップ係数）を意味する。

　TVノルムTVxyは、クラスブロック内の画素の画素値の変化が激しい場合に大になるので、高周波数成分が多い画像のTVノルムTVxyは大になる傾向がある。

　TVノルムTVxyは、クラスブロック内の高周波数成分を表すということができる。したがって、TVノルムTVxyによれば、注目画素の周辺の高周波数成分の程度を把握することができ、かかるTVノルムTVxyを用いてクラス分類を行うことで、注目画素の周辺の高周波数成分の程度に応じて、クラスを分けてタップ係数の学習を行い、ALF処理に用いるタップ係数を分けることができる。

　図１１は、注目画素の特徴量としての最大差分絶対値の算出方法の例を説明する図である。

　すなわち、図１１は、図８と同様に、クラスブロックを構成する画素の画素値の例を示している。

　クラス分類部１６２は、注目画素のクラスブロックの画素のうちの、隣接する画素どうしの画素値の差（図１１において、矢印で示す部分）の絶対値のうちの最大値を、最大差分絶対値として、式（１０）に従って求める。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（１０）

　ここで、式（１０）において、max(A)は、Aの中の最大値を表す。したがって、式（１０）において、Mxは、クラスブロックの画素のうちの、x方向に隣接する画素どうしの画素値の差I(x,y)-I(x+1,y)の絶対値のうちの最大値を表し、Myは、クラスブロックの画素のうちの、y方向に隣接する画素どうしの画素値の差I(x,y)-I(x,y+1)の絶対値のうちの最大値を表す。

　式（１０）によれば、最大値MxとMyとの和が、最大差分絶対値Mxyとして求められる。

　なお、最大差分絶対値Mxyとしては、最大値MxとMyとの和の他、最大値Mx及びMyのうちの大きい方を採用することもできる。

　最大差分絶対値Mxyは、クラスブロック内の画素の画素値の変化が激しい場合に大になるので、より高域の高周波数成分が多い画像の最大差分絶対値Mxyは大になる傾向がある。

　最大差分絶対値Mxyは、クラスブロック内の高周波数成分を表すということができる。したがって、最大差分絶対値Mxyによれば、注目画素の周辺の高周波数成分の程度を把握することができ、かかる最大差分絶対値Mxyを用いてクラス分類を行うことで、注目画素の周辺の高周波数成分の程度に応じて、クラスを分けてタップ係数の学習を行い、ALF処理に用いるタップ係数を分けることができる。

　図１２は、注目画素の特徴量としての傾斜特徴量の概要を説明する図である。

　すなわち、図１２は、画像（復号途中画像）の各位置（座標）(x,y)の画素の画素値（輝度）の例を示している。

　注目画素の傾斜特徴量は、注目画素の画素値の等高線の接線方向を表す。したがって、注目画素の傾斜特徴量は、注目画素（の位置）から、画素値が変化しない方向を表す。

　ここで、ある画素において、その画素の画素値の等高線の接線方向を向いたベクトルを、接線ベクトルともいう。

　注目画素の傾斜特徴量としては、注目画素について、接線ベクトルの方向（接線方向）が求められる。

　図１３は、接線ベクトルを求める方法の例を説明する図である。

　すなわち、図１３は、図１２と同様に、復号途中画像の各位置(x,y)の画素の画素値の例を示している。

　クラス分類部１６２は、まず、位置(x,y)の画素（以下、画素(x,y)とも記載する）の画素値I(x,y)の勾配(gradient)g(x,y)（としてのベクトル）を、式（１１）に従って求める。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（１１）

　式（１１）において、∂／∂x及び∂／∂yは、ソーベルフィルタであり、例えば、式（１２）で表される。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（１２）

　画素(x,y)の接線ベクトルt(x,y)は、画素(x,y)の勾配g(x,y)に垂直な方向のベクトルであり、式（１３）に従い、勾配g(x,y)をπ/2（ラジアン）だけ回転させることにより求めることができる。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（１３）

　式（１３）において、gx及びgyは、勾配g(x,y)のx成分及びy成分を、それぞれ表す。

　図１４は、注目画素のクラスブロックの各画素の接線ベクトルt(x,y)の代表ベクトルt*を説明する図である。

　すなわち、図１４は、図１２と同様に、復号途中画像の各画素(x,y)の画素値の例を示している。

　接線ベクトルt(x,y)は、復号途中画像の各画素について求めることができるが、本実施の形態では、ロバスト性の確保等のために、注目画素(x,y)の接線ベクトルt(x,y)の方向を、そのまま、傾斜特徴量として採用するのではなく、注目画素のクラスブロックの各画素(x,y)の接線ベクトルt(x,y)を代表する代表ベクトルt*の方向θ*を、傾斜特徴量として採用する。

　図１５は、注目画素のクラスブロックの各画素(x,y)の接線ベクトルt(x,y)を代表する代表ベクトルt*を説明する図である。

　本実施の形態では、ある方向θ、すなわち、例えば、x軸との角度がθの方向の単位ベクトルe(θ)が、注目画素のクラスブロックの各画素(x,y)の接線ベクトルt(x,y)を代表する代表ベクトルt*であることの適切さを評価する評価関数J(θ)を定義し、その評価関数J(θ)を最大化するθの方向の単位ベクトルe(θ)を、代表ベクトルt*とする。

　図１５では、注目画素を中心とする横×縦が3×3画素のブロックをクラスブロックとして、そのクラスブロックを構成する3×3画素の接線ベクトルt(x,y)と、その3×3画素の接線ベクトルt(x,y)を代表する代表ベクトルt*とが示されている。

　評価関数J(θ)としては、例えば、式（１４）を採用することができる。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（１４）

　式（１４）において、<A,B>は、ベクトルA及びBの内積を表す。単位ベクトルe(θ)は、角度θの方向を向いた、ノルムが1のベクトルである。

　傾斜特徴量としての代表ベクトルt*の方向θ*としては、式（１５）に従い、評価関数J(θ)を最大にするθが求められる。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（１５）

　式（１５）において、argmax(A)は、Aを最大にするθを表す。

　図１６は、評価関数J(θ)を説明する図である。

　すなわち、図１６は、図１２と同様に、復号途中画像の各画素(x,y)の画素値の例を示している。

　図１６では、復号途中画像の画素値が、y方向に見てsin波の形状になっている。そして、復号途中画像の画素値を、x軸の正の方向に見て、ある画素(x(a),y(a))における画素値の勾配g(a)は、上りの勾配（正の勾配）になっており、他の画素(x(b),y(b))における画素値の勾配g(b)は、下りの勾配（負の勾配）になっている。

　いま、勾配g(a)が表す画素値の変化（傾斜）と、勾配g(b)が表す画素値の変化とが、方向が逆で、大きさが同一の変化であるとすると、画素(x(a),y(a))の接線ベクトルt(x(a),y(a))と、画素(x(b),y(b))の接線ベクトルt(x(b),y(b))とは、方向が逆で、大きさが同一のベクトルとなる。

　式（１４）の評価関数J(θ)によれば、単位ベクトルe(θ)と接線ベクトルt(x,y)との内積<e(θ)，t(x,y)>の自乗がとられるため、評価関数J(θ)において、方向が逆で、大きさが同一の接線ベクトルt(x(a),y(a))とt(x(b),y(b))とは、同様に扱われる（区別されない）。

　図１７は、クラスブロックの各画素(x,y)の接線ベクトルt(x,y)と、方向θの単位ベクトルe(θ)との例を示す図である。

　なお、図１７では、図が煩雑になるのを避けるため、クラスブロックの各画素(x,y)の接線ベクトルt(x,y)としては、3個の画素(x1,y1)，(x2,y2)，(x3,y3)の接線ベクトルt(x1,y1)，t(x2,y2)，t(x3,y3)だけを図示してある。

　評価関数J(θ)は、単位ベクトルe(θ)の方向θ（又は方向θの逆方向（θ＋πの方向））の成分が大きい接線ベクトルt(x,y)が多いほど、大になる。

　図１８は、評価関数J(θ)の計算を説明する図である。

　すなわち、図１８は、クラスブロックのi番目の画素の接線ベクトルt_iと、単位ベクトルe(θ)との例を示している。

　図１８において、φ_iは、接線ベクトルt_iの方向（角度）を表し、a_i及びb_iは、接線ベクトルt_iのx成分及びy成分を、それぞれ表す。

　式（１４）の評価関数J(θ)は、式（１６）に従って計算することができる。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（１６）

　式（１６）において、iのサメーション（Σ）は、クラスブロックの全画素についてサメーションをとることを表す。

　式（１６）によれば、接線ベクトルt_iの、単位ベクトルe(θ)の方向θの成分の大きさ|t_i|cos(θ－φ_i)（図１８において点線の矢印で示す部分）が大であるほど、評価関数J(θ)は大になる。

　評価関数J(θ)を最大にするθである式（１５）のθ*は、評価関数J(θ)のθの微分値dJ(θ)／dθを0にするθである。微分値dJ(θ)／dθは、式（１７）に示すように計算することができる。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（１７）

　式（１７）において、T及びφは、式（１８）で表される。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（１８）

　式（１７）の微分値dJ(θ)／dθが0になる場合としては、T=0の場合と、θ＝φの場合とがある。

　T=0になる場合としては、|t_i|=0の場合があるが、この場合、接線ベクトルt_iは、大きさが0のベクトルとなり、方向φ_iを持たないので、式（１５）のθ*を求めるにあたり、|t_i|=0の場合は、適切な場合ではない。

　また、θ＝φの場合、式（１８）のφを、θ*に置き換えた式（１９）により、式（１５）のθ*を求めることができる。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（１９）

　式（１９）は、式（２０）に示すように変形することができる。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（２０）

　図１９は、接線ベクトルt_iの例を示す図である。

　図１９に示すような、方向がφ_iで、x成分及びy成分がそれぞれa_i及びb_iの接線ベクトルt_iについては、sin(φ_i)及びcos(φ_i)は、式（２１）で表すことができる。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（２１）

　式（２１）を、式（２０）に代入することにより、θ*は、式（２２）に従って求めることができる。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（２２）

　式（２２）において、σ₁及びσ₂は、式（２３）で表される。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（２３）

　クラス分類部１６２は、式（２２）及び式（２３）に従い、θ*を、傾斜特徴量として求める。

　式（２２）及び式（２３）によれば、傾斜特徴量θ*は、クラスブロックの各画素の接線ベクトルt_iのx成分a_i及びy成分b_iから求められるσ₁並びにσ₂を用いた除算と、tan^-1(arctan)の計算とにより求めることができる。

　ここで、傾斜特徴量θ*は、クラスブロックの各画素(x,y)の接線ベクトルt(x,y)を代表する代表ベクトルt*の方向であるから、クラスブロックの各画素の画素値の等高線の接線方向を代表する代表値であるということができる。

　tan^-1の計算結果は、tan^-1の計算を実際に行う他、LUTを用いて得ることができる。

　図２０は、tan^-1の計算結果を得るのに用いるLUTの例を説明する図である。

　すなわち、図２０は、tanαのグラフを示している。なお、図２０において、横軸は角度αを表し、縦軸はtanαを表す。

　tan^-1の計算結果を得るLUTとしては、縦軸のtanαを入力とするとともに、横軸の角度αを出力とするLUTを採用することができる。

　この場合、式（２３）のσ₁及びσ₂を用いた除算値σ₁／σ₂を、LUTに入力することにより、角度α＝tan^-1(σ₁／σ₂)が、LUTから出力される。

　なお、tanαは、原点に対して点対称であり、かつ、周期的な関数であるため、LUTとして記憶するtanαは、α＝－πないし＋πの１周期分の範囲ではなく、例えば、図中、矩形で囲むα＝0ないしπ/2の範囲（以下、基本範囲ともいう）だけでよい。

　tanαのうちの、α＝－π/2ないし－πの範囲、α＝－π/2ないし０の範囲、及び、α＝π/2ないしπの範囲については、tanαの基本範囲を、原点に対して点対称に移動することや、αの方向に平行移動することにより求めることができる。

　すなわち、実際の実装では、角度α＝tan^-1(σ₁／σ₂)は、σ₁／σ₂から符号をとった｜σ₁｜／｜σ₂｜を、基本範囲が記憶されたLUTの入力として得られる、そのLUTの出力を、σ₁及びσ₂の符号に応じて変換することにより求めることができる。

　ここで、σ₁及びσ₂の符号を、（σ₂，σ₁）＝（＋，＋）のように表すこととする。

　（σ₂，σ₁）＝（＋，＋）の場合、角度α＝tan^-1(σ₁／σ₂)は、α＝０ないしπ/2の範囲の値であり、LUTの出力を、そのまま採用することにより得ることができる。

　（σ₂，σ₁）＝（＋，－）の場合、角度α＝tan^-1(σ₁／σ₂)は、α＝－π/2ないし０の範囲の値であり、LUTの出力を、原点に対して点対称に移動することにより得ることができる。

　（σ₂，σ₁）＝（－，－）の場合、角度α＝tan^-1(σ₁／σ₂)は、α＝－π/2ないし－πの範囲の値であり、LUTの出力を、角度αの方向に、－πだけ移動することにより得ることができる。

　（σ₂，σ₁）＝（－，＋）の場合、角度α＝tan^-1(σ₁／σ₂)は、α＝π/2ないしπの範囲の値であり、LUTの出力を、原点に対して点対称に移動し、かつ、角度αの方向に、＋πだけ移動することにより得ることができる。

　なお、ここでは、除算値σ₁／σ₂を入力とし、その除算値σ₁／σ₂の入力に対して、角度α＝tan^-1(σ₁／σ₂)を出力するLUTを採用することとしたが、その他、例えば、σ₁及びσ₂を入力とし、そのσ₁及びσ₂の入力に対して、式（２２）の計算を行って得られる傾斜特徴量θ*を出力するLUTを採用することができる。

　また、例えば、σ₁及びσ₂を入力とし、そのσ₁及びσ₂の入力に対して、式（２２）の傾斜特徴量θ*を計算し、さらに、傾斜特徴量θ*を用いてクラス分類を行うことにより得られるクラスを出力するLUTを採用することができる。

　図２１は、注目画素の特徴量としての傾斜特徴量θ*の信頼度を説明する図である。

　すなわち、図２１は、クラスブロックの例を示している。

　図２１のクラスブロックは、木目調の明るい領域と、木目調の暗い領域とを有する。木目調の明るい領域は、水平方向のエッジ（水平方向に延びるエッジ）が支配的になっており、木目調の暗い領域は、垂直方向のエッジが支配的になっている。そこで、木目調の明るい領域を、水平エッジ領域ともいい、木目調の暗い領域を、垂直エッジ領域ともいう。

　図２１では、クラスブロックのうちの左下の一部の領域が、垂直エッジ領域になっており、他の領域が、水平エッジ領域になっている。

　したがって、図２１のクラスブロックにおいては、水平エッジ領域が、垂直エッジ領域の4倍を超える面積を占めている。

　注目画素の傾斜特徴量θ*の信頼度trは、例えば、式（２４）に従って求められる。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（２４）

　式（２４）によれば、信頼度trは、クラスブロックの各画素の接線ベクトルt_iが、傾斜特徴量θ*が得られる評価関数J(θ*)、ひいては、代表ベクトルt*=e(θ*)に寄与する程度を指標として求められる。

　式（２４）の信頼度trは、クラスブロックの画素の接線ベクトルt_iの中に、傾斜特徴量θ*が表す方向θ*と異なる方向の接線ベクトルt_iがない程度（クラスブロックの画素の接線ベクトルt_iの中に、傾斜特徴量θ*が表す方向θ*と同様の方向の接線ベクトルt_iがある程度）を表す。

　したがって、信頼度trが大であることは、クラスブロックの画素の接線ベクトルt_iの中に、傾斜特徴量θ*が表す方向θ*と同様の方向の接線ベクトルt_iが多くあることを表す。

　上述したように、図２１のクラスブロックにおいては、水平エッジ領域が、垂直エッジ領域の4倍を超える面積を占めているので、水平エッジが延びる水平方向に近い方向が、傾斜特徴量θ*として求められる。

　すなわち、式（１５）によれば、仮に、クラスブロック全体が水平エッジ領域であれば、水平方向が傾斜特徴量θ*として求められ、クラスブロック全体が垂直エッジ領域であれば、垂直方向が傾斜特徴量θ*として求められる。しかしながら、図２１に示したように、クラスブロックに、水平エッジ領域と垂直エッジ領域とが混在しているからといって、傾斜特徴量θ*は、水平方向と垂直方向がいわば平均化された斜め方向にはならない。すなわち、図２１に示したように、水平エッジ領域と垂直エッジ領域とが混在している場合、傾斜特徴量θ*は、水平エッジ領域及び垂直エッジ領域のうちの、クラスブロック内で支配的な領域である水平エッジ領域の水平エッジが延びる水平方向になる。

　但し、図２１のクラスブロックにおいては、水平エッジ領域の他に、垂直エッジ領域が存在するため、水平エッジ領域のみのクラスブロックに比較して、垂直エッジ領域の分だけ値が低下した信頼度trが求められる。

　クラス分類部１６２（図６）において、注目画素の傾斜特徴量θ*を用いて、注目画素のクラス分類を行うことにより、注目画素の周辺の高周波数成分がある方向（に直交する方向）に応じて、クラスを分けてタップ係数の学習を行い、ALF処理に用いるタップ係数を分けることができる。

　さらに、クラス分類部１６２において、注目画素の傾斜特徴量θ*の信頼度trを用いて、注目画素のクラス分類を行うことにより、信頼度trに応じて、クラスを分けてタップ係数の学習を行い、ALF処理に用いるタップ係数を分けることができる。

　その結果、ALF処理において、元画像に対する誤差が小さいフィルタ後画像を得ることができ、これにより、残差が小さくなって、符号化効率を改善することができる。

　図２２は、画像の周波数特性の例を示す図である。

　図２２において、横軸は水平方向の周波数f_Hを表し、縦軸は垂直方向の周波数f_Vを表す。図２２は、水平方向の周波数f_H及び垂直方向の周波数f_Vを軸として、画像の周波数成分の分布を表す。

　図２２において、縦長の楕円形状の周波数特性f1は、垂直方向の高周波数成分が多く、水平方向の高周波数成分が少ない画像、すなわち、例えば、水平方向のエッジが支配的な水平エッジ領域が多い画像の周波数特性である。また、横長の楕円形状の周波数特性f2は、垂直方向の高周波数成分が少なく、水平方向の高周波数成分が多い画像、すなわち、例えば、垂直方向のエッジが支配的な垂直エッジ領域が多い画像の周波数特性である。

　傾斜特徴量θ*を用いたクラス分類によれば、注目画素のクラスブロックが、同程度の高周波数成分を有する画像であっても、周波数特性f1の画像のような、水平エッジ領域の画像になっている場合と、周波数特性f2の画像のような、垂直エッジ領域の画像になっている場合とで、注目画素を、異なるクラスに分類することができる。

　図２３は、傾斜特徴量θ*及び信頼度trを用いたクラス分類の例を説明する図である。

　図２３において、横軸は傾斜特徴量θ*を表し、縦軸は信頼度trを表す。

　クラス分類部１６２（図６）は、注目画素の傾斜特徴量θ*の信頼度trを、クラス分類パラメータの一種である信頼度trの閾値THtrと比較する。

　そして、注目画素の傾斜特徴量θ*の信頼度trが、閾値THtr以上でない場合、クラス分類部１６２は、注目画素を、傾斜特徴量θ*に依存しないクラスc0に分類する。

　一方、注目画素の傾斜特徴量θ*の信頼度trが、閾値THtr以上である場合、クラス分類部１６２は、注目画素を、注目画素の傾斜特徴量θ*に応じて、傾斜特徴量θ*に依存するクラスc1ないしクラスc#M-1のうちのいずれかのクラスに分類する。

　ここで、図２３では、クラスの総数がM個になっている。また、図２３では、傾斜特徴量θ*に依存するクラスc1ないしクラスc#M-1は、傾斜特徴量θ*に対応するクラスになっている。

　すなわち、図２３では、傾斜特徴量θ*としての方向（角度）がとり得る範囲である－πないし＋πの範囲が、傾斜特徴量θ*に依存するM-1個のクラスc1ないしクラスc#M-1で等分されるように分割されている。そして、－πないし＋πの範囲を分割して得られるM-1個の分割範囲が、M-1個のクラスc1ないしクラスc#M-1に、それぞれ割り当てられている。

　図２３では、－πないし＋πの範囲が、M-1個の分割範囲に等分されているので、1個の分割範囲の幅、及び、ある分割範囲とその分割範囲に隣接する分割範囲との中心どうしの距離は、いずれも、2π/(M-1)である。

　また、－πないし＋πの範囲で表される方向については、－πの方向と＋πの方向とは一致するので、図２３では、－πの方向及び＋πの方向を中心とする幅2π/(M-1)の分割範囲が、同一のクラスc1に割り当てられている。

　図２３において、クラスc#mには（ここでは、m=0,1,...,M-1のうちの、m=1,2,...,M-1）、－π＋(m-1)×2π/(M-1)の方向を中心とする2π/(M-1)の角度の範囲内の方向の傾斜特徴量θ*の画素が分類される。

　したがって、クラスc#mには、注目画素のクラスブロックに、－π＋(m-1)×2π/(M-1)の方向やその方向に近い方向の接線ベクトルt_iの画素が多い場合（－π＋(m-1)×2π/(M-1)の方向やその方向に近い方向に直交する方向の高周波数成分が多い場合）に、注目画素は、クラスc#mに分類される。

　かかるクラスc#mを、－π＋(m-1)×2π/(M-1)の方向のクラスともいう。

　以上のような傾斜特徴量θ*及び信頼度trを用いたクラス分類によれば、注目画素の傾斜特徴量θ*の信頼度trが閾値THtr以上でない場合、注目画素は、クラスc0に分類される。

　例えば、注目画素のクラスブロックが、水平方向の周波数f_H及び垂直方向の周波数f_Vを軸とする平面において図２２に示した楕円形状になる周波数特性f1やf2ではなく、円形状になる周波数特性の画像である場合、注目画素のクラスブロックは、特定の方向の高周波数成分が、他の方向の高周波数成分よりも多く存在する画像ではないので、注目画素の傾斜特徴量θ*の信頼度trは小になり、注目画素は、クラスc0に分類される。

　また、注目画素の傾斜特徴量θ*の信頼度trが閾値THtr以上である場合、注目画素は、傾斜特徴量θ*に応じて、クラスc1ないしクラスc#M-1のうちのいずれかのクラスに分類される。ここで、クラスc1ないしクラスc#M-1を、傾斜特徴量θ*が表す方向のクラスともいう。

　例えば、注目画素のクラスブロックが、水平方向の周波数f_H及び垂直方向の周波数f_Vを軸とする平面において図２２に示した楕円形状になる周波数特性f1やf2の画像である場合、注目画素のクラスブロックは、特定の方向の高周波数成分が、他の方向の高周波数成分よりも多く存在する画像であるので、注目画素の傾斜特徴量θ*としては、特定の方向に直交する方向が求められ、さらに、信頼度trは大になる。

　その結果、注目画素は、クラスc1ないしクラスc#M-1のうちの、注目画素の傾斜特徴量θ*が表す方向（高周波数成分の方向に直交する方向）のクラスに分類される。

　なお、図２３では、－πないし＋πの範囲が等分されているので、クラスc1ないしクラスc#M-1が割り当てられるM-1個の分割範囲それぞれの幅は、同一であるが、分割範囲の幅としては、分割範囲ごとに異なる幅を採用することができる。

　また、図２３では、注目画素の傾斜特徴量θ*の信頼度trが閾値THtr以上でない場合には、注目画素の傾斜特徴量θ*に関係なく、注目画素を、クラスc0に分類することとしたが、注目画素の傾斜特徴量θ*の信頼度trが閾値THtr以上でない場合でも、注目画素の傾斜特徴量θ*の信頼度trが閾値THtr以上である場合と同様に、注目画素を、傾斜特徴量θ*に応じて、複数のクラスのうちのいずれかのクラスにクラス分類することができる。

　図２４は、傾斜特徴量θ*及び信頼度trと、他の特徴量とを用いたクラス分類の例を説明する図である。

　図２４において、横軸は傾斜特徴量θ*及び信頼度trを用いたクラス分類により得られるクラスc#mを表し、縦軸は他の特徴量を表す。

　ここで、傾斜特徴量θ*及び信頼度trを用いたクラス分類により得られるクラスc#mを、傾斜／信頼度クラスc#mともいう。

　他の特徴量としては、上述した平均値や、分散、TVノルムTVxy、最大差分絶対値Mxy等を採用することができる。ここでは、例えば、注目画素（のクラスブロック）の高周波数成分を表すTVノルムTVxy（又は最大差分絶対値Mxy）を、他の特徴量として用いてクラス分類を行うこととする。

　クラス分類部１６２（図６）は、注目画素を、傾斜／信頼度クラスc#mにクラス分類した後、注目画素の他の特徴量としてのTVノルムTVxyに応じて、傾斜／信頼度クラスc#mの注目画素を、最終的なクラスである最終クラスc#m#jに分類する。

　すなわち、図２４では、傾斜／信頼度クラスc#mに対して、その傾斜／信頼度クラスc#mの注目画素の他の特徴量としてのTVノルムTVxyの閾値（以下、傾斜／信頼度クラスc#mの閾値ともいう）として、2個の閾値TH(c#m,0)及びTH(c#m,1)が設定されている。

　傾斜／信頼度クラスc#mの閾値TH(c#m,0)及びTH(c#m,1)は、クラス分類パラメータの他の一種である。

　クラス分類部１６２は、傾斜／信頼度クラスc#mの注目画素のTVノルムTVxyを、その傾斜／信頼度クラスc#mの閾値TH(c#m,0)及びTH(c#m,1)と比較し、その比較結果に応じて、傾斜／信頼度クラスc#mの注目画素を、最終クラスc#m#jに分類する。

　すなわち、傾斜／信頼度クラスc#mの閾値TH(c#m,0)及びTH(c#m,1)が、式TH(c#m,0)<TH(c#m,1)を満たすこととする。

　この場合、傾斜／信頼度クラスc#mの注目画素のTVノルムTVxyが、式TVxy<TH(c#m,0)を満たすときには、注目画素は、最終クラスc#m0に分類される。

　また、傾斜／信頼度クラスc#mの注目画素のTVノルムTVxyが、式TH(c#m,0)<=TVxy<TH(c#m,1)を満たすときには、注目画素は、最終クラスc#m1に分類される。

　さらに、傾斜／信頼度クラスc#mの注目画素のTVノルムTVxyが、式TH(c#m,1)<=TVxyを満たすときには、注目画素は、最終クラスc#m2に分類される。

　図２３で説明したように、傾斜特徴量θ*及び信頼度trを用いたクラス分類によれば、注目画素は、その注目画素の傾斜特徴量θ*が表す方向の傾斜／信頼度クラスc#mに分類される。

　そして、傾斜／信頼度クラスc#mの注目画素を、他の特徴量としてのTVノルムTVxyを用いてクラス分類することにより、注目画素を、その注目画素の傾斜特徴量θ*が表す方向に直交する方向の高周波数成分の程度によって、最終クラスc#m#jに分類することができる。

　なお、図２４では、各傾斜／信頼度クラスc#mに対して、2個の閾値TH(c#m,0)及びTH(c#m,1)が設けられているが、各傾斜／信頼度クラスc#mに対して設ける閾値は、2個に限定されるものではない。

　さらに、ある傾斜／信頼度クラスc#mと、他の傾斜／信頼度クラスc#m'とに対しては、異なる数の閾値を設けることができる。

　J個の閾値TH(c#m,0),TH(c#m,1),...,TH(c#m,J)が設けられた傾斜／信頼度クラスc#mの注目画素は、その注目画素のTVノルムTVxyに応じて、J+1個の最終クラスc#m0,c#m1,...,c#m#J+1のうちのいずれかの最終クラスに分類される。

　図２５は、画像の周波数特性の例を示す図である。

　すなわち、図２５のＡは、図２２と同様に、水平方向の周波数f_Hを横軸とするとともに、垂直方向の周波数f_Vを縦軸とした画像の周波数成分の分布を示している。図２５のＢは、図１０と同様に、（水平方向又は垂直方向の）周波数を横軸とするとともに、周波数成分の強度を縦軸とした画像の周波数特性を示している。

　図２５のＡにおいて、縦長の楕円形状の周波数特性f11，f12，f13は、垂直方向の高周波数成分が多く、水平方向の高周波数成分が少ない画像、すなわち、例えば、水平方向のエッジが支配的な水平エッジ領域が多い画像の周波数特性である。

　但し、周波数特性f11，f12，f13は、f13，f12，f11の順で、より高域の周波数成分が多い周波数特性になっている。

　周波数特性f11，f12，f13をそれぞれ有する画像は、いずれも、水平エッジ領域が多く、垂直方向の高周波数成分を有する。但し、周波数特性f12を有する画像は、周波数特性f11を有する画像よりも、より高域の垂直方向の高周波数成分を有し、周波数特性f13を有する画像は、周波数特性f12を有する画像よりも、より高域の垂直方向の高周波数成分を有している。

　傾斜／信頼度クラスc#mの注目画素を、TVノルムTVxyを用いて、最終クラスc#m#jに分類することにより、同一方向の高周波数成分を有する画像であっても、その画像が有する高周波数成分の周波数によって、注目画素を、異なるクラスに分類することができる。

　その結果、画像が同一方向の高周波数成分を有する場合でも、その高周波数成分の周波数が異なるごとに、クラスを分けてタップ係数の学習を行い、ALF処理に用いるタップ係数を分けることができる。

　図２６は、図６のクラス分類部１６２の構成例を示すブロック図である。

　図２６において、クラス分類部１６２は、クラスブロック抽出部１７１、傾斜特徴量／信頼度算出部１７２、第１クラス分類部１７３、特徴量算出部１７４、及び、第２クラス分類部１７５を有する。

　クラスブロック抽出部１７１には、SAO１０９（図４）からの復号途中画像が供給される。クラスブロック抽出部１７１は、SAO１０９からの復号途中画像から、注目画素のクラスブロック（となる画素）を抽出し、傾斜特徴量／信頼度算出部１７２及び特徴量算出部１７４に供給する。

　傾斜特徴量／信頼度算出部１７２は、クラスブロック抽出部１７１からの注目画素のクラスブロックを用いて、注目画素の（画像）特徴量としての傾斜特徴量θ*、及び、その傾斜特徴量θ*の信頼度trを算出し、第１クラス分類部１７３に供給する。

　第１クラス分類部１７３は、例えば、線形識別器等で構成される。第１クラス分類部１７３は、傾斜特徴量／信頼度算出部１７２からの注目画素の傾斜特徴量θ*、及び、その傾斜特徴量θ*の信頼度trを用いて、注目画素のクラス分類を行い、そのクラス分類の結果得られる注目画素の傾斜／信頼度クラスを、第２クラス分類部１７５に供給する。

　なお、第１クラス分類部１７３には、クラス分類パラメータ生成部１３１から、クラス分類パラメータとしての信頼度trの閾値THtr（図２３）が供給される。第１クラス分類部１７３は、例えば、図２３で説明したように、信頼度trを、その信頼度trの閾値THtrと比較することにより、注目画素のクラス分類を行う。

　特徴量算出部１７４は、クラスブロック抽出部１７１からの注目画素のクラスブロックを用いて、注目画素の他の特徴量としての、例えば、TVノルムTVxyを算出し、第２クラス分類部１７５に供給する。

　第２クラス分類部１７５は、例えば、線形識別器等で構成される。第２クラス分類部１７５は、特徴量算出部１７４から供給される注目画素のTVノルムTVxyを用いて、第１クラス分類部１７３から供給される傾斜／信頼度クラスの注目画素のクラス分類を行い、そのクラス分類の結果得られる注目画素の最終クラスを（足し込み部１６３（図６））に出力する。

　なお、第２クラス分類部１７５には、クラス分類パラメータ生成部１３１から、クラス分類パラメータとしての傾斜／信頼度クラスc#mの閾値TH(c#m,j)（図２４）が供給される。第２クラス分類部１７５は、例えば、図２４で説明したように、注目画素のTVノルムTVxyを、注目画素の傾斜／信頼度クラスc#mの閾値TH(c#m,j)と比較することにより、傾斜／信頼度クラスc#mの注目画素のクラス分類を行う。

　ここで、クラス分類は、注目画素の（画像）特徴量の他、注目画素の符号化情報、例えば、注目画素のQPやCBF等をも用いて行うことができる。

　＜ALF処理部１３３の構成例＞

　図２７は、図５のALF処理部１３３の構成例を示すブロック図である。

　図２７において、ALF処理部１３３は、タップ選択部１８１、クラス分類部１８２、係数取得部１８３、及び、フィルタ演算部１８４を有する。

　タップ選択部１８１ないしフィルタ演算部１８４は、図２のALF処理部２０のタップ選択部２１ないしフィルタ演算部２４とそれぞれ同様の処理を行う。

　すなわち、ALF処理部１３３には、学習部１３２（図５）に供給されるのと同様の第１の画像としての復号途中画像が供給される。ALF処理部１３３は、第１の画像としての復号途中画像を用いて、図２のALF処理部２０と同様のALF処理を行い、元画像に相当する第２の画像（の予測値）としてのフィルタ後画像を求める。

　但し、ALF処理部１３３には、クラス分類パラメータ生成部１３１（図５）からクラス分類パラメータが供給されるとともに、学習部１３２から、クラス（最終クラス）ごとのタップ係数が供給される。

　ALF処理部１３３では、タップ選択部１８１が、復号途中画像から注目画素を選択する。さらに、タップ選択部１８１は、注目画素について、復号途中画像から予測タップとなる画素を選択することにより、学習部１３２（図６）のタップ選択部１６１の場合と同一のタップ構造の予測タップを構成し、係数取得部１８３に供給する。

　クラス分類部１８２は、注目画素について、復号途中画像、及び、クラス分類パラメータ生成部１３１からのクラス分類パラメータを用いて、学習部１３２（図６）のクラス分類部１６２の場合と同一のクラス分類を行い、そのクラス分類の結果得られる注目画素の最終クラスを、係数取得部１８３に供給する。

　係数取得部１８３は、学習部１３２（図５）から供給されるタップ係数を記憶し、そのタップ係数から、クラス分類部１８２から供給される注目画素の最終クラスのタップ係数を取得して（読み出して）、フィルタ演算部１８４に供給する。

　フィルタ演算部１８４は、図２のフィルタ演算部２４と同様に、タップ選択部１８１から供給される注目画素の予測タップと、係数取得部１８３から供給される注目画素のクラスのタップ係数とを用いて、式（１）のフィルタ演算を行い、フィルタ後画像の対応画素の画素値（注目画素に対応する元画像の画素の画素値の予測値）を求めて出力する。

　なお、図６で説明したように、学習部１３２において、クラス分類部１６２で得られる注目画素のクラスを、タップ選択部１６１に供給し、タップ選択部１６１において、注目画素のクラスに応じて、予測タップのタップ構造を変更する場合には、ALF処理部１３３でも、図２７において点線で示すように、クラス分類部１８２からタップ選択部１８１に、注目画素のクラス（最終クラス）が供給され、タップ選択部１８１において、注目画素のクラスに応じて、予測タップのタップ構造が変更される。クラスに応じて、予測タップのタップ構造が変更される場合、すなわち、クラスごとに、予測タップのタップ構造が異なる場合、その予測タップとしての画素（の画素値）とのフィルタ演算に用いられるタップ係数のタップ構造も、クラスに応じて異なる。

　図２８は、図２７のクラス分類部１８２の構成例を示すブロック図である。

　図２８において、クラス分類部１８２は、クラスブロック抽出部１９１、傾斜特徴量／信頼度算出部１９２、第１クラス分類部１９３、特徴量算出部１９４、及び、第２クラス分類部１９５を有する。

　クラス分類部１８２において、クラスブロック抽出部１９１ないし第２クラス分類部１９５は、図２６のクラス分類部１６２のクラスブロック抽出部１７１ないし第２クラス分類部１７５と同様に構成される。したがって、クラス分類部１８２は、注目画素について、図２６のクラス分類部１６２と同様のクラス分類を行う。

　＜符号化処理＞

　図２９は、図４の画像符号化装置１００の符号化処理の例を説明するフローチャートである。

　なお、図２９に示す符号化処理の各ステップの順番は、説明の便宜上の順番であり、実際の符号化処理の各ステップは、適宜、並列的に、必要な順番で行われる。

　画像符号化装置１００において、ALF１１０のクラス分類パラメータ生成部１３１（図５）は、タップ係数学習やALF処理のクラス分類に用いられるクラス分類パラメータの生成を、随時行っている。同様に、ALF１１０の学習部１３２（図５）は、そこに供給される復号途中画像のうちの、例えば、複数のフレーム、１フレーム、ブロック等の更新単位の復号途中画像を生徒画像とするとともに、その復号途中画像に対応する元画像を教師画像として、随時、タップ係数学習を行っている。なお、学習部１３２でのタップ係数学習のクラス分類は、クラス分類パラメータ生成部１３１が生成した最新のクラス分類パラメータを用いて行われる。

　学習部１３２は、ステップＳ４１において、現在のタイミングが、タップ係数を更新する所定のタイミングとしての更新タイミングであるかどうか、すなわち、例えば、複数のフレーム、１フレーム、ブロック等の更新単位の終点又は始点のタイミングであるかどうかを判定する。

　ステップＳ４１において、タップ係数の更新タイミングでないと判定された場合、処理は、ステップＳ４２ないしＳ４４をスキップして、ステップＳ４５に進む。

　また、ステップＳ４１において、タップ係数の更新タイミングであると判定された場合、処理は、ステップＳ４２に進む。

　ステップＳ４２では、ALF１１０は、クラス分類パラメータ生成部１３１が生成した最新のクラス分類パラメータと、学習部１３２が最新のタップ係数学習により生成したクラス（最終クラス）ごとのタップ係数とを含むフィルタ情報を生成し、可逆符号化部１０４（図４）に供給して、処理は、ステップＳ４３に進む。

　なお、ALF１１０では、元画像の時間方向の相関を検出し、その相関が低い場合（閾値以下の場合）にのみ、更新タイミングで、ステップＳ４２のフィルタ情報の生成を行い、かつ、後述するステップＳ４３及びＳ４４の処理を行うことができる。

　ステップＳ４３では、ALF処理部１３３（図５）は、クラス分類パラメータ生成部１３１が生成した最新のクラス分類パラメータによって、クラス分類部１８２（図２７）がクラス分類に用いるクラス分類パラメータを更新する。さらに、ALF処理部１３３は、学習部１３２が最新のタップ係数学習により生成したタップ係数によって、係数取得部１８３（図２７）に記憶されたクラス（最終クラス）ごとのタップ係数を更新し、処理は、ステップＳ４３からステップＳ４４に進む。

　ステップＳ４４では、可逆符号化部１０４は、ALF１１０から直前のステップＳ４２で供給されるフィルタ情報を、伝送対象に設定して、処理は、ステップＳ４５に進む。伝送対象に設定されたフィルタ情報は、後述するステップＳ５７において符号化され、符号化データに含められて伝送される。

　ステップＳ４５以降では、元画像の予測符号化処理が行われる。

　すなわち、ステップＳ４５において、予測部１１２は、イントラ予測モードのイントラ予測処理を行い、処理は、ステップＳ４６に進む。ステップＳ４６において、予測部１１２は、インター予測モードでの動き予測や動き補償を行うインター動き予測処理を行い、処理は、ステップＳ４７に進む。

　予測部１１２のイントラ予測処理、及び、予測部１１２のインター動き予測処理では、各種の予測モードのコスト関数が演算されるとともに、予測画像が生成される。

　ステップＳ４７では、予測部１１２は、コスト関数に基づいて、最適な予測モードを決定する。そして、予測部１１２は、最適な予測モードの予測画像を選択して出力し、処理は、ステップＳ４７からステップＳ４８に進む。

　ステップＳ４８では、演算部１０１は、符号化対象の画像である元画像と、予測部１１２が出力する予測画像との残差を演算し、直交変換部１０２に供給して、処理は、ステップＳ４９に進む。

　ステップＳ４９では、直交変換部１０２は、演算部１０１からの残差を直交変換し、その結果得られる変換係数を、量子化部１０３に供給して、処理は、ステップＳ５０に進む。

　ステップＳ５０では、量子化部１０３は、直交変換部１０２からの変換係数を量子化し、その量子化により得られる量子化係数を、可逆符号化部１０４及び逆量子化部１０５に供給して、処理は、ステップＳ５１に進む。

　ステップＳ５１では、逆量子化部１０５は、量子化部１０３からの量子化係数を逆量子化し、その結果得られる変換係数を、逆直交変換部１０６に供給して、処理は、ステップＳ５２に進む。ステップＳ５２では、逆直交変換部１０６は、逆量子化部１０５からの変換係数を逆直交変換し、その結果得られる残差を、演算部１０７に供給して、処理は、ステップＳ５３に進む。

　ステップＳ５３では、演算部１０７は、逆直交変換部１０６からの残差と、予測部１１２が出力する予測画像とを加算し、演算部１０１での残差の演算の対象となった元画像に対応する復号途中画像を生成する。演算部１０７は、復号途中画像を、DF１０８に供給し、処理は、ステップＳ５３からステップＳ５４に進む。

　ステップＳ５４において、DF１０８は、演算部１０７からの復号途中画像に、DFのフィルタ処理を施し、SAO１０９に供給する。さらに、ステップＳ５４では、SAO１０９は、DF１０８からの復号途中画像に、SAOのフィルタ処理を施し、ALF１１０に供給して、処理は、ステップＳ５５に進む。

　ステップＳ５５において、ALF１１０は、SAO１０９からの復号途中画像に、ALF処理を施し、そのALF処理により得られるフィルタ後画像を、DPB１１１に供給して、処理は、ステップＳ５５からステップＳ５６に進む。

　ステップＳ５６では、DPB１１１は、ALF１１０から供給されるフィルタ後画像を、復号画像として記憶し、処理は、ステップＳ５７に進む。DPB１１１に記憶された復号画像は、必要に応じて、その後に行われるステップＳ４５やＳ４６で、予測画像を生成する元となる参照画像として使用される。

　ステップＳ５７では、可逆符号化部１０４は、量子化部１０３からの量子化係数を符号化する。さらに、可逆符号化部１０４は、量子化部１０３での量子化に用いられた量子化パラメータQPや、予測部１１２でのイントラ予測処理で得られた予測モード、予測部１１２でのインター動き予測処理で得られた予測モードや動き情報等の符号化情報を必要に応じて符号化し、符号化データに含める。

　また、可逆符号化部１０４は、ステップＳ４４で伝送対象に設定されたフィルタ情報を符号化し、符号化データに含め、処理は、ステップＳ５７からステップＳ５８に進む。

　ステップＳ５８において、可逆符号化部１０４は、符号化データを伝送し、符号化処理は終了する。

　図３０は、図２９のステップＳ５５で行われるALF処理の例を説明するフローチャートである。

　ALF１１０のALF処理部１３３（図２７）では、ステップＳ７１において、タップ選択部１８１が、SAO１０９（図４）から供給される復号途中画像（としてのブロック）の画素のうちの、まだ、注目画素とされていない画素の１つを、注目画素として選択し、処理は、ステップＳ７２に進む。

　ステップＳ７２において、タップ選択部１８１が、SAO１０９から供給される復号途中画像から、注目画素についての予測タップとする画素を選択し、予測タップを構成する。そして、タップ選択部１８１は、予測タップを、フィルタ演算部１８４に供給して、処理は、ステップＳ７３に進む。

　ステップＳ７３では、クラス分類部１８２が、注目画素について、傾斜特徴量及び傾斜特徴量の信頼度、並びに、他の特徴量としての、例えば、TVノルム等を求める。さらに、クラス分類部１８２は、注目画素の傾斜特徴量及び傾斜特徴量の信頼度、並びに、TVノルム等と、クラス分類パラメータ生成部１３１（図５）からのクラス分類パラメータとを用いて、注目画素のクラス分類を行う。クラス分類部１８２は、クラス分類により得られる注目画素のクラス（最終クラス）を、係数取得部１８３に供給して、処理は、ステップＳ７３からステップＳ７４に進む。

　ここで、ステップＳ７３のクラス分類に用いられるクラス分類パラメータは、図２９の最新のステップＳ４３で更新されたクラス分類パラメータである。

　ステップＳ７４では、係数取得部１８３は、記憶しているクラスごとのタップ係数から、クラス分類部１８２からの注目画素のクラスのタップ係数を取得し、フィルタ演算部１８４に供給して、処理は、ステップＳ７５に進む。

　ここで、係数取得部１８３は、図２９の最新のステップＳ４３で更新されたクラスごとのタップ係数を記憶している。

　ステップＳ７５では、フィルタ演算部１８４は、タップ選択部１８１からの予測タップと、係数取得部１８３からのタップ係数とを用いて、式（１）フィルタ演算を行う。これにより、フィルタ演算部１８４は、注目画素に対応する元画像の対応画素の画素値の予測値を、フィルタ後画像の画素値として求め、処理は、ステップＳ７６に進む。

　ステップＳ７６では、タップ選択部１８１が、SAO１０９からの復号途中画像の画素の中に、まだ、注目画素としていない画素があるかどうかを判定する。ステップＳ７６において、まだ、注目画素としていない画素があると判定された場合、処理は、ステップＳ７１に戻り、以下、同様の処理が繰り返される。

　また、ステップＳ７６において、まだ、注目画素とされていない画素がないと判定された場合、処理は、ステップＳ７７に進み、フィルタ演算部１８４は、SAO１０９からの復号途中画像に対して得られた画素値で構成されるフィルタ後画像を、DPB１１１（図４）に供給する。そして、ALF処理は終了され、処理はリターンする。

　以上のように画像符号化装置１００では、復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行い、クラスごとのタップ係数のうちの、注目画素のクラスのタップ係数を用いて、復号途中画像とのフィルタ演算を行う。したがって、注目画素が、高周波成分の方向（どの方向の高周波数成分があるか）によってクラス分類されるので、注目画素の高周波成分の方向に適したタップ係数を用いたフィルタ演算を行うことができる。さらに、かかるフィルタ演算により、元画像に対する誤差が小さいフィルタ後画像を得ることができ、これにより、符号化効率を改善することができる。

　＜画像復号装置２００の構成例＞

　図３１は、図１の画像復号装置２００の構成例を示すブロック図である。

　図３１において、画像復号装置２００は、可逆復号部２０１、逆量子化部２０２、逆直交変換部２０３、演算部２０４、DF２０５、SAO２０６、ALF２０７、DPB２０８、及び、予測部２０９を有する。

　可逆復号部２０１は、画像符号化装置１００から伝送されてくる符号化データを受信することにより取得する。したがって、可逆復号部２０１は、画像符号化装置１００から伝送されてくる符号化データ、ひいては、符号化データに含まれるフィルタ情報としてのクラスごとのタップ係数やクラス分類パラメータを受け取る受け取り部として機能する。

　可逆復号部２０１は、符号化データを、図４の可逆符号化部１０４の符号化方式に対応する方式で復号する。

　そして、可逆復号部２０１は、符号化データの復号により得られる量子化係数を、逆量子化部２０２に供給する。

　また、可逆復号部２０１は、符号化データの復号により、符号化情報やフィルタ情報が得られた場合には、必要な符号化情報を、予測部２０９その他の必要なブロックに供給する。

　さらに、可逆復号部２０１は、フィルタ情報を、ALF２０７に供給する。

　逆量子化部２０２は、可逆復号部２０１からの量子化係数を、図４の量子化部１０３の量子化方式に対応する方式で逆量子化し、その逆量子化により得られる変換係数を、逆直交変換部２０３に供給する。

　逆直交変換部２０３は、逆量子化部２０２から供給される変換係数を、図４の直交変換部１０２の直交変換方式に対応する方式で逆直交変換し、その結果得られる残差を、演算部２０４に供給する。

　演算部２０４には、逆直交変換部２０３から残差が供給される他、予測部２０９から予測画像が供給される。

　演算部２０４は、逆直交変換部２０３からの残差と、予測部２０９からの予測画像とを加算し、復号途中画像を生成して、DF２０５に供給する。

　DF２０５は、演算部２０４からの復号途中画像に、DF１０８（図４）と同様のフィルタ処理を行い、そのフィルタ処理後の復号途中画像を、SAO２０６に供給する。

　SAO２０６は、DF２０５からの復号途中画像に、SAO１０９（図４）と同様のフィルタ処理を行い、ALF２０７に供給する。

　ALF２０７は、SAO２０６からの復号途中画像を第１の画像として、可逆復号部２０１からのフィルタ情報に含まれるクラスごとのタップ係数を用いた、ALF１１０（図４）と同様のALF処理を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像（の予測値）としてのフィルタ後画像に変換して（フィルタ後画像を生成して）出力する。

　ここで、ALF２０７が行うALF処理のクラス分類は、可逆復号部２０１からのフィルタ情報に含まれるクラス分類パラメータを用いて行われる。

　ALF２０７が出力するフィルタ後画像は、ALF１１０が出力するフィルタ後画像と同様の画像であり、復号画像として出力されるとともに、DPB２０８に供給される。

　DPB２０８は、ALF２０７から供給されるフィルタ後画像を、復号画像として一時記憶する。さらに、DPB２０８は、復号画像を、予測画像の生成に用いる参照画像として、予測部２０９に供給する。

　予測部２０９は、可逆復号部２０１から供給される符号化情報に含まれる予測モードに従い、図４の予測部１１２において用いられたイントラ予測モードで、DPB２０８から供給される参照画像を用いてイントラ予測を行う。

　また、予測部２０９は、可逆復号部２０１から供給される符号化情報に含まれる予測モードに従い、図４の予測部１１２において用いられたインター予測モードで、DPB２０８から供給される参照画像を用いてインター予測を行う。インター予測は、可逆復号部２０１から供給される符号化情報に含まれる動き情報等を必要に応じて用いて行われる。

　予測部２０９は、イントラ予測又はインター予測により得られる予測画像を、演算部２０４に供給する。

　＜ALF２０７の構成例＞

　図３２は、図３１のALF２０７の構成例を示すブロック図である。

　図３２において、ALF２０７は、ALF処理部２３１を有する。

　ALF処理部２３１には、SAO２０６（図３１）から復号途中画像が供給されるとともに、可逆復号部２０１からフィルタ情報が供給される。

　ALF処理部２３１は、図５のALF処理部１３３と同様のALF処理を行う。

　すなわち、ALF処理部２３１は、復号途中画像を第１の画像として、ALF処理部１３３で行われるのと同一のクラス分類を、フィルタ情報に含まれるクラス分類パラメータを用いて行う。さらに、ALF処理部２３１は、フィルタ情報に含まれるクラスごとのタップ係数のうちの、クラス分類の結果得られるクラスのタップ係数を用いたフィルタ演算を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像（の予測値）としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、復号画像として出力するとともに、DPB２０８（図３１）に供給する。

　＜ALF処理部２３１の構成例＞

　図３３は、図３２のALF処理部２３１の構成例を示すブロック図である。

　図３３において、ALF処理部２３１は、タップ選択部２４１、クラス分類部２４２、係数取得部２４３、及び、フィルタ演算部２４４を有する。

　タップ選択部２４１ないしフィルタ演算部２４４は、ALF処理部１３３（図２７）を構成するタップ選択部１８１ないしフィルタ演算部１８４とそれぞれ同様に構成される。

　すなわち、タップ選択部２４１には、SAO２０６（図３１）から復号途中画像が供給される。

　タップ選択部２４１は、SAO２０６からの復号途中画像を第１の画像として、その第１の画像としての復号途中画像の画素を、順次、注目画素に選択する。

　さらに、タップ選択部２４１は、注目画素について、復号途中画像から、図２７のタップ選択部１８１で選択される予測タップと同一構造の予測タップを選択し、フィルタ演算部２４４に供給する。

　クラス分類部２４２には、可逆復号部２０１（図３１）からフィルタ情報が供給されるとともに、SAO２０６から復号途中画像が供給される。

　クラス分類部２４２は、注目画素について、可逆復号部２０１からのフィルタ情報に含まれるクラス分類パラメータ、及び、SAO２０６からの復号途中画像（から得られる注目画素のクラスブロック）を用いて、クラス分類部１８２（図２７）と同様のクラス分類を行い、その結果得られる注目画素のクラスを、係数取得部２４３に供給する。

　係数取得部２４３は、可逆復号部２０１（図３１）からのフィルタ情報に含まれるクラス（最終クラス）ごとのタップ係数を記憶し、そのクラスごとのタップ係数から、クラス分類部２４２からの注目画素のクラスのタップ係数を取得して、フィルタ演算部２４４に供給する。

　フィルタ演算部２４４は、タップ選択部２４１からの予測タップと、係数取得部２４３からのタップ係数とを用いて、式（１）のフィルタ演算を行い、復号途中画像の注目画素に対応する元画像としての第２の画像の対応画素の画素値の予測値を、フィルタ後画像の画素の画素値として求めて出力する。

　なお、図２７で説明したように、ALF処理部１３３において、クラス分類部１８２からタップ選択部１８１に、注目画素のクラスを供給し、タップ選択部１８１において、注目画素のクラスに応じて、予測タップのタップ構造を変更する場合には、ALF処理部２３１でも、図３３において点線で示すように、クラス分類部２４２からタップ選択部２４１に、注目画素のクラスが供給され、タップ選択部２４１において、注目画素のクラスに応じて、予測タップのタップ構造が変更される。クラスに応じて、予測タップのタップ構造が変更される場合、すなわち、クラスごとに、予測タップのタップ構造が異なる場合、その予測タップとしての画素（の画素値）とのフィルタ演算に用いられるタップ係数のタップ構造も、クラスに応じて異なる。

　図３４は、図３３のクラス分類部２４２の構成例を示すブロック図である。

　図３４において、クラス分類部２４２は、クラスブロック抽出部２５１、傾斜特徴量／信頼度算出部２５２、第１クラス分類部２５３、特徴量算出部２５４、及び、第２クラス分類部２５５を有する。

　クラス分類部２４２において、クラスブロック抽出部２５１ないし第２クラス分類部２５５は、図２８のクラス分類部１８２のクラスブロック抽出部１９１ないし第２クラス分類部１９５と同様に構成される。したがって、クラス分類部２４２は、注目画素について、図２８のクラス分類部１８２と同様のクラス分類を行う。

　＜復号処理＞

　図３５は、図３１の画像復号装置２００の復号処理の例を説明するフローチャートである。

　なお、図３５に示す復号処理の各ステップの順番は、説明の便宜上の順番であり、実際の復号処理の各ステップは、適宜、並列的に、必要な順番で行われる。

　復号処理では、ステップＳ１１１において、可逆復号部２０１は、画像符号化装置１００から伝送されてくる符号化データを受信し、処理は、ステップＳ１１２に進む。

　ステップＳ１１２では、可逆復号部２０１は、符号化データを復号し、その復号により得られる量子化係数を、逆量子化部２０２に供給する。

　また、可逆復号部２０１は、符号化データの復号により、符号化情報やフィルタ情報が得られた場合、必要な符号化情報を、予測部２０９その他の必要なブロックに供給する。

　その後、処理は、ステップＳ１１２からステップＳ１１３に進み、ALF２０７は、可逆復号部２０１からフィルタ情報が供給されたかどうかを判定する。

　ステップＳ１１３において、フィルタ情報が供給されていないと判定された場合、処理は、ステップＳ１１４をスキップして、ステップＳ１１５に進む。

　また、ステップＳ１１３において、フィルタ情報が供給されたと判定された場合、処理は、ステップＳ１１４に進み、ALF２０７のALF処理部２３１（図３３）は、可逆復号部２０１からのフィルタ情報を取得し（て記憶し）、処理は、ステップＳ１１５に進む。

　ステップＳ１１５では、ALF処理部２３１は、タップ係数及びクラス分類パラメータの更新タイミングであるかどうか、すなわち、例えば、複数のフレーム、１フレーム、ブロック等の更新単位の終点又は始点のタイミングであるかどうかを判定する。

　ここで、更新単位は、例えば、フィルタ情報が配置されている（含まれている）符号化データの階層（例えば、Sequence parameter set syntaxや、Picture parameter set syntax，Slice data syntax等）から認識することができる。

　例えば、フィルタ情報が、符号化データのPicture parameter set syntaxとして配置されている場合には、更新単位は、１フレームであると認識することができる。

　また、更新単位は、画像符号化装置１００及び画像復号装置２００の間で、あらかじめ決めておくことができる。

　ステップＳ１１５において、タップ係数及びクラス分類パラメータの更新タイミングでないと判定された場合、処理は、ステップＳ１１６をスキップして、ステップＳ１１７に進む。

　また、ステップＳ１１５において、タップ係数及びクラス分類パラメータの更新タイミングであると判定された場合、処理は、ステップＳ１１６に進む。

　ステップＳ１１６では、ALF処理部２３１（図３３）は、直前のステップＳ１１４で取得したフィルタ情報に含まれるクラスごとのタップ係数によって、係数取得部２４３に記憶されたクラスごとのタップ係数を更新する。さらに、ALF処理部２３１は、直前のステップＳ１１４で取得したフィルタ情報に含まれるクラス分類パラメータによって、クラス分類部２４２がクラス分類に用いるクラス分類パラメータを更新し、処理は、ステップＳ１１６からステップＳ１１７に進む。

　ステップＳ１１７では、逆量子化部２０２は、可逆復号部２０１からの量子化係数を逆量子化し、その結果得られる変換係数を、逆直交変換部２０３に供給して、処理は、ステップＳ１１８に進む。

　ステップＳ１１８では、逆直交変換部２０３は、逆量子化部２０２からの変換係数を逆直交変換し、その結果得られる残差を、演算部２０４に供給して、処理は、ステップＳ１１９に進む。

　ステップＳ１１９では、予測部２０９が、DPB２０８から供給される参照画像、及び、可逆復号部２０１から供給される符号化情報を用いて、予測画像を生成する予測処理を行う。そして、予測部２０９は、予測処理により得られる予測画像を、演算部２０４に供給して、処理は、ステップＳ１１９からステップＳ１２０に進む。

　ステップＳ１２０では、演算部２０４は、逆直交変換部２０３からの残差と、予測部２０９からの予測画像を加算することにより、復号途中画像を生成する。そして、演算部２０４は、復号途中画像を、DF２０５に供給して、処理は、ステップＳ１２０からステップＳ１２１に進む。

　ステップＳ１２１において、DF２０５は、演算部２０４からの復号途中画像に、DFのフィルタ処理を施し、SAO２０６に供給する。さらに、ステップＳ１２１では、SAO２０６は、DF２０５からの復号途中画像に、SAOのフィルタ処理を施し、ALF２０７に供給して、処理は、ステップＳ１２２に進む。

　ステップＳ１２２において、ALF２０７は、直前のステップＳ１１６で更新されたクラスごとのタップ係数及びクラス分類パラメータを用いて、SAO２０６からの復号途中画像に、ALF処理を施し、そのALF処理により得られるフィルタ後画像を、復号画像として出力するとともに、DPB２０８に供給して、処理は、ステップＳ１２３に進む。

　ステップＳ１２３では、DPB２０８は、ALF２０７からのフィルタ後画像を、復号画像として記憶し、復号処理は終了する。DPB２０８に記憶された復号画像は、必要に応じて、その後に行われるステップＳ１１９の予測処理で、予測画像を生成する元となる参照画像として使用される。

　図３６は、図３５のステップＳ１２２で行われるALF処理の例を説明するフローチャートである。

　ALF２０７のALF処理部２３１（図３３）では、ステップＳ１４１において、タップ選択部２４１が、SAO２０６（図３１）から供給される復号途中画像の画素のうちの、まだ、注目画素とされていない画素の１つを、注目画素として選択し、処理は、ステップＳ１４２に進む。

　ステップＳ１４２において、タップ選択部２４１が、SAO２０６から供給される復号途中画像から、注目画素についての予測タップとする画素を選択し、予測タップを構成する。そして、タップ選択部２４１は、予測タップを、フィルタ演算部２４４に供給して、処理は、ステップＳ１４２からステップＳ１４３に進む。

　ステップＳ１４３では、クラス分類部２４２が、注目画素について、傾斜特徴量及び傾斜特徴量の信頼度、並びに、他の特徴量としての、例えば、TVノルム等を求める。さらに、クラス分類部２４２は、注目画素の傾斜特徴量及び傾斜特徴量の信頼度、並びに、TVノルム等と、クラス分類パラメータとを用いて、注目画素のクラス分類を行う。クラス分類部２４２は、クラス分類により得られる注目画素のクラス（最終クラス）を、係数取得部２４３に供給して、処理は、ステップＳ１４３からステップＳ１４４に進む。

　ここで、ステップＳ１４３のクラス分類に用いられるクラス分類パラメータは、図３５の最新のステップＳ１１６で更新されたクラス分類パラメータである。

　ステップＳ１４４では、係数取得部２４３は、記憶しているクラスごとのタップ係数から、クラス分類部２４２からの注目画素のクラスのタップ係数を取得し、フィルタ演算部２４４に供給して、処理は、ステップＳ１４５に進む。

　ここで、係数取得部２４３は、図３５の最新のステップＳ１１６で更新されたクラスごとのタップ係数を記憶している。

　ステップＳ１４５では、フィルタ演算部２４４は、タップ選択部２４１からの予測タップと、係数取得部２４３からのタップ係数とを用いて、式（１）フィルタ演算を行う。これにより、フィルタ演算部２４４は、注目画素に対応する元画像の対応画素の画素値の予測値を、フィルタ後画像の画素値として求め、処理は、ステップＳ１４６に進む。

　ステップＳ１４６では、タップ選択部２４１が、SAO２０６からの復号途中画像の画素の中に、まだ、注目画素としていない画素があるかどうかを判定する。ステップＳ１４６において、まだ、注目画素としていない画素があると判定された場合、処理は、ステップＳ１４１に戻り、以下、同様の処理が繰り返される。

　また、ステップＳ１４６において、まだ、注目画素とされていない画素がないと判定された場合、処理は、ステップＳ１４７に進み、フィルタ演算部２４４は、SAO２０６からの復号途中画像に対して得られた画素値で構成されるフィルタ後画像を、復号画像として出力するとともに、DPB２０８（図３１）に供給する。そして、ALF処理は終了され、処理はリターンする。

　以上のように画像復号装置２００では、画像符号化装置１００と同様に、復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行い、クラスごとのタップ係数のうちの、注目画素のクラスのタップ係数を用いて、復号途中画像とのフィルタ演算を行う。したがって、注目画素が、高周波成分の方向（どの方向の高周波数成分があるか）によってクラス分類されるので、注目画素の高周波成分の方向に適したタップ係数を用いたフィルタ演算を行うことができる。さらに、かかるフィルタ演算により、元画像に対する誤差が小さいフィルタ後画像、すなわち、S/N(Signal to Noise ratio)の良い高画質の復号画像を得ることができる。

　＜タップ係数の効率的な符号化方法＞

　図３７は、傾斜特徴量を用いたクラス分類が行われる場合に、クラスごとのタップ係数を効率的に符号化する符号化方法を説明する図である。

　画像符号化装置１００（図４）では、ALF１１０において、タップ係数学習が適宜行われる。さらに、可逆符号化部１０４において、タップ係数学習により得られるクラスごとのタップ係数（を含むフィルタ情報）が符号化され、符号化データに含められて伝送される。

　したがって、クラスごとのタップ係数は、符号化データのオーバーヘッドとなるため、クラスごとのタップ係数を効率的に符号化し、データ量を少なくすることが、符号化効率の改善に資する。

　そこで、可逆符号化部１０４は、第１の方向を表す傾斜特徴量の画素が分類される第１の方向のクラスのタップ係数と、第２の方向を表す傾斜特徴量の画素が分類される第２の方向のクラスのタップ係数との回転の対称性に応じて順序を並べ替えた第１の方向のクラスのタップ係数と、第２の方向のクラスのタップ係数との差分である差分係数を、第２の方向のクラスのタップ係数に代えて符号化することにより、クラスごとのタップ係数を効率的に符号化する。

　ここで、説明を簡単にするため、タップ係数学習（及びALF処理）のクラス分類として、画素が、その画素の傾斜特徴量に応じて、図２３及び図２４で説明した、M-1個の傾斜／信頼度クラスc1ないしc#M-1のうちのいずれかに分類されるクラス分類を採用することとする。

　図３７は、第１の方向のクラスとしての傾斜／信頼度クラスc#Hにクラス分類される画素で構成される画像の周波数特性f21と、第２の方向のクラスとしての傾斜／信頼度クラスc#Vにクラス分類される画素で構成される画像の周波数特性f22との例を模式的に示している。

　図３７において、横軸は水平方向の周波数f_Hを表し、縦軸は垂直方向の周波数f_Vを表す。図３７は、水平方向の周波数f_H及び垂直方向の周波数f_Vを軸として、画像の周波数成分の分布を表す。

　図３７において、縦長の楕円形状の周波数特性f21は、垂直方向の高周波数成分が多く、水平方向の高周波数成分が少ない画像、すなわち、例えば、水平エッジ領域が多い画像の周波数特性である。また、横長の楕円形状の周波数特性f22は、垂直方向の高周波数成分が少なく、水平方向の高周波数成分が多い画像、すなわち、例えば、垂直エッジ領域が多い画像の周波数特性である。

　周波数特性f21の画像、すなわち、水平エッジ領域が多い画像の画素については、水平方向（第１の方向）を表す傾斜特徴量が求められ、その結果、水平方向の傾斜／信頼度クラスc#H（第１の方向のクラス）に分類される。

　一方、周波数特性f22の画像、すなわち、垂直エッジ領域が多い画像の画素については、垂直方向（第２の方向）を表す傾斜特徴量が求められ、その結果、垂直方向の傾斜／信頼度クラスc#V（第２の方向のクラス）に分類される。

　水平方向の傾斜／信頼度クラスc#Hに分類される画素で構成される画像と、垂直方向の傾斜／信頼度クラスc#Vに分類される画素で構成される画像とは、π/2の回転の対称性を有する傾向が強い。

　そのため、水平方向の傾斜／信頼度クラスc#Hのタップ係数（群）と、垂直方向の傾斜／信頼度クラスc#Vのタップ係数（群）とは、π/2の回転の対称性を有する傾向のタップ係数となる。

　ここで、あるクラスのタップ係数（群）を、そのタップ係数に対応する予測タップの画素、すなわち、そのタップ係数と乗算される予測タップの画素の位置に配置した状態のタップ係数を、タップ構造状に配置したタップ係数という。

　ある傾斜／信頼度クラスのタップ係数と、他の傾斜／信頼度クラスのタップ係数とが、所定の角度の回転の対称性を有するとは、ある傾斜／信頼度クラスのタップ係数、及び、他の傾斜／信頼度クラスのタップ係数のうちの一方のタップ構造状に配置したタップ係数を、所定の角度だけ回転した場合に、その回転後のタップ係数が、他方のタップ構造状に配置したタップ係数と高い相関性を有する（値がほぼ一致する傾向にある）ことを意味する。

　なお、ある傾斜／信頼度クラスのタップ係数と、他の傾斜／信頼度クラスのタップ係数とが、所定の角度の回転の対称性を有するには、ある傾斜／信頼度クラスのタップ係数のタップ構造と、他の傾斜／信頼度クラスのタップ係数のタップ構造とが、その２つのタップ構造のうちの一方のタップ構造を所定の角度だけ回転したときに、他方のタップ構造に一致している必要がある。

　上述のように、水平方向の傾斜／信頼度クラス（以下、水平クラスともいう）c#Hのタップ係数と、垂直方向の傾斜／信頼度クラス（以下、垂直クラスともいう）c#Vのタップ係数とは、π/2の回転の対称性を有する傾向のタップ係数となるので、例えば、水平クラスc#Hのタップ構造状に配置したタップ係数をπ/2だけ回転した回転後のタップ係数は、垂直クラスc#Vのタップ構造状に配置したタップ係数に、ほぼ一致する。

　そこで、可逆符号化部１０４は、水平クラスc#Hのタップ係数w(c#H)については、そのタップ係数w(c#H)をそのまま符号化して伝送する。

　その後、可逆符号化部１０４は、垂直クラスc#Vのタップ係数w(c#V)については、水平クラスのタップ係数w(c#H)と垂直クラスc#Vのタップ係数w(c#V)との回転の対称性に応じて順序を並び替えた水平クラスc#Hのタップ係数R{w(c#H)}と、垂直クラスc#Vのタップ係数w(c#V)との差分である差分係数δw(c#H)を、垂直クラスc#Vのタップ係数w(c#V)に代えて符号化して伝送する。

　すなわち、可逆符号化部１０４は、水平クラスc#Hのタップ構造状に配置したタップ係数w(c#H)をπ/2だけ回転した回転後のタップ係数となるように、水平クラスc#Hのタップ係数w(c#H)の順序を並び替える（水平クラスc#Hのタップ係数群w(c#H)としての複数のタップ係数の順序を並び替える）。

　この順序の並び替え後の水平クラスc#Hのタップ係数w(c#H)を、タップ係数R{w(c#H)}と記載する。タップ係数R{w(c#H)}は、水平クラスc#Hのタップ係数群w(c#H)としての複数のタップ係数と同一の複数のタップ係数であるが、タップ構造（複数のタップ係数の並び）がタップ係数群w(c#H)と異なる。

　可逆符号化部１０４は、垂直クラスc#Vのタップ係数w(c#V)から、水平クラスc#Hのタップ係数w(c#H)の順序の並び替えにより得られたタップ係数R{w(c#H)}を減算することにより、差分係数δw(c#H)を求める。

　すなわち、垂直クラスc#Vのタップ係数w(c#V)は、複数のタップ係数であり、その複数のタップ係数を、先頭から順番に、V1，V2，・・・と表すこととする。また、タップ係数R{w(c#H)}も、複数のタップ係数であり、その複数のタップ係数を、先頭から順番に、R1，R2，・・・と表すこととする。

　可逆符号化部１０４は、垂直クラスc#Vのタップ係数w(c#V)としての複数のタップ係数V1，V2，・・・の各順番のタップ係数V#iから、タップ係数R{w(c#H)}としての複数のタップ係数R1，R2，・・・のうちの、対応する順番のタップ係数R#iを減算し、減算値（群）V1-R1，V2-R2，・・・を、差分係数δw(c#H)として求める。

　上述のように、水平クラスc#Hのタップ構造状に配置したタップ係数をπ/2だけ回転した回転後のタップ係数R{w(c#H)}は、垂直クラスc#Vのタップ構造状に配置したタップ係数w(c#V)に、ほぼ一致するので、差分係数δw(c#H)は、ほぼ０等の小さい値になる。

　したがって、可逆符号化部１０４において、垂直クラスc#Vのタップ係数w(c#V)に代えて、差分係数δw(c#H)を符号化することにより、クラスごとのタップ係数を効率的に符号化し、符号化効率を改善することができる。

　なお、画像符号化装置１００の可逆符号化部１０４において、上述のように、水平クラスc#Hのタップ係数w(c#H)、及び、差分係数δw(c#H)が符号化されて伝送される場合、画像復号装置２００の可逆復号部２０１では、水平クラスc#Hのタップ係数w(c#H)を復号し、さらに、差分係数δw(c#H)を復号した後、水平クラスc#Hのタップ係数w(c#H)の順序を並び替え、式（２５）に従って、順序の並び替えにより得られたタップ係数R{w(c#H)}と、差分係数δw(c#H)とを加算することにより、差分係数δw(c#H)を、垂直クラスc#Vのタップ係数w(c#V)に復号することができる。

　　　　　　　　　　　　　　　　　　　　　　　　・・・（２５）

　ここで、画像符号化装置１００（図４）において、差分係数δw(c#H)の算出は、可逆符号化部１０４ではなく、ALF１１０で行うことができる。また、画像復号装置２００（図３１）において、差分係数δw(c#H)から、垂直クラスc#Vのタップ係数w(c#V)への復号（復元）は、可逆復号部２０１ではなく、ALF２０７で行うことができる。

　さらに、上述の場合には、垂直クラスc#Vのタップ係数w(c#V)から、水平クラスc#Hのタップ係数w(c#H)の順序の並び替えにより得られたタップ係数R{w(c#H)}を減算することにより、差分係数δw(c#H)を求めることとしたが、逆に、水平クラスc#Hのタップ係数w(c#H)から、垂直クラスc#Vのタップ係数w(c#V)の順序の並び替えにより得られたタップ係数R{w(c#V)}を減算することにより、差分係数δw(c#V)を求めてもよい。

　また、回転の対称性の所定の角度は、π/2に限定されるものではない。

　＜クラスに応じたタップ構造の変更＞

　図３８は、クラスに応じたタップ構造の変更を説明する図である。

　図６、図２７、及び、図３３で説明したように、クラスに応じて、予測タップのタップ構造を変更することができる。

　すなわち、タップ係数w_nを用いて式（１）のフィルタ演算を行う対象である予測タップを構成する画素x_nは、クラスに応じて変更することができる。

　なお、ここでは、説明を簡単にするため、タップ係数学習及びALF処理のクラス分類として、画素が、その画素の傾斜特徴量及び信頼度に応じて、図２３及び図２４で説明した、M個の傾斜／信頼度クラスc0ないしc#M-1のうちのいずれかに分類されるクラス分類を採用することとする。

　図３８のＡは、画像の周波数特性を模式的に示している。

　図３８のＡにおいて、横軸は水平方向の周波数f_Hを表し、縦軸は垂直方向の周波数f_Vを表す。図３８のＡは、水平方向の周波数f_H及び垂直方向の周波数f_Vを軸として、画像の周波数成分の分布を表す。

　図３８のＡにおいて、周波数特性f31は、水平クラスc#Hにクラス分類される画素で構成される画像の周波数特性を表し、周波数特性f32は、垂直クラスc#Vにクラス分類される画素で構成される画像の周波数特性を表す。また、周波数特性f33は、傾斜／信頼度クラスc0にクラス分類される画素で構成される画像の周波数特性を表す。

　周波数特性f31は、縦長の楕円形状になっており、垂直方向の高周波数成分が多く、水平方向の高周波数成分が少ない画像、すなわち、例えば、水平エッジ領域が多い画像の周波数特性である。周波数特性f32は、横長の楕円形状になっており、垂直方向の高周波数成分が少なく、水平方向の高周波数成分が多い画像、すなわち、例えば、垂直エッジ領域が多い画像の周波数特性である。周波数特性f33は、円形状になっており、各方向の高周波数成分が同程度の画像の周波数特性である。例えば、元画像を撮影するイメージセンサのノイズが、周波数特性f33のような周波数特性を有する。

　周波数特性f31の画像、すなわち、水平エッジ領域が多い画像の画素については、水平方向を表す傾斜特徴量が求められ、その結果、水平クラスc#Hに分類される。

　周波数特性f32の画像、すなわち、垂直エッジ領域が多い画像の画素については、垂直方向を表す傾斜特徴量が求められ、その結果、垂直クラスc#Vに分類される。

　周波数特性f33の画像、すなわち、各方向の高周波数成分が同程度の画像の画素については、傾斜特徴量の信頼度trが小さくなり（閾値THtr以上でない値になり）、その結果、傾斜特徴量に依存しない傾斜／信頼度クラス（以下、無方向性クラスともいう）c0に分類される。

　図３８のＢは、無方向性クラスc0の画素に対して構成される予測タップのタップ構造の例を示している。

　例えば、画素x₁₃が注目画素であり、その注目画素x₁₃が、無方向性クラスc0に分類された場合、注目画素x₁₃を中心とする正方形状の範囲の画素x₁ないしx₂₅が、予測タップとして採用される。

　図３８のＣは、水平クラスc#Hの画素に対して構成される予測タップのタップ構造の例を示している。

　例えば、画素x₁₃が注目画素であり、その注目画素x₁₃が、水平クラスc#Hに分類された場合、注目画素x₁₃を中心とする横長の菱形状の範囲の画素x₁ないしx₂₅が、予測タップとして採用される。この場合、注目画素x₁₃に対して垂直方向に並ぶ画素よりも水平方向に並ぶ画素を多く用いて予測タップが構成される。

　注目画素x₁₃が、水平クラスc#Hに分類される場合、注目画素x₁₃の傾斜特徴量は水平方向を表している。傾斜特徴量が水平方向を表す注目画素x₁₃については、その注目画素x₁₃の傾斜特徴量が表す水平方向に並ぶ画素を多く用いて予測タップを構成することにより、タップ係数学習において、誤差（式（４）の自乗誤差の総和E）がより小さいタップ係数を求めるとともに、ALF処理において、かかるタップ係数を用いたフィルタ演算により、より元画像に近いフィルタ後画像を求めることができる。

　図３８のＤは、垂直クラスc#Vの画素に対して構成される予測タップのタップ構造の例を示している。

　例えば、画素x₁₃が注目画素であり、その注目画素x₁₃が、垂直クラスc#Vに分類された場合、注目画素x₁₃を中心とする縦長の菱形状の範囲の画素x₁ないしx₂₅が、予測タップとして採用される。この場合、注目画素x₁₃に対して水平方向に並ぶ画素よりも垂直方向に並ぶ画素を多く用いて予測タップが構成される。

　注目画素x₁₃が、垂直クラスc#Vに分類される場合、注目画素x₁₃の傾斜特徴量は垂直方向を表している。傾斜特徴量が垂直方向を表す注目画素x₁₃については、その注目画素x₁₃の傾斜特徴量が表す垂直方向に並ぶ画素を多く用いて予測タップを構成することにより、タップ係数学習において、誤差がより小さいタップ係数を求め、ALF処理において、かかるタップ係数を用いたフィルタ演算により、より元画像に近いフィルタ後画像を求めることができる。

　図３９は、クラスに応じたタップ構造の変更をさらに説明する図である。

　図３９のＡは、画像の周波数特性を模式的に示している。

　図３９のＡでは、図３８のＡと同様に、横軸は水平方向の周波数f_Hを表し、縦軸は垂直方向の周波数f_Vを表す。

　図３９のＡにおいて、周波数特性f41は、右上（左下）方向に長軸が向いた楕円形状になっており、右上方向の高周波数成分が多く、左上（右下）方向の高周波数成分が少ない画像、すなわち、例えば、左上方向のエッジ（左上方向に延びるエッジ）が支配的になっている左上エッジ領域が多い画像の周波数特性である。

　周波数特性f41の画像、すなわち、左上エッジ領域が多い画像の画素については、左上方向を表す傾斜特徴量が求められ、その結果、左上方向の傾斜／信頼度クラスc#Sに分類される。

　図３９のＢは、左上方向の傾斜／信頼度クラスc#Sの画素に対して構成される予測タップのタップ構造の例を示している。

　例えば、画素x₁₀が注目画素であり、その注目画素x₁₀が、左上方向の傾斜／信頼度クラスc#Sに分類された場合、注目画素x₁₀を中心とし、左上（右下）方向を長手方向とする長方形状の範囲の画素x₁ないしx₂₅が、予測タップとして採用される。この場合、注目画素x₁₀に対して右上方向及び左下方向に並ぶ画素よりも左上方向及び右下方向に並ぶ画素を多く用いて予測タップが構成される。

　この場合、図３８のＣ及びＤで説明した場合と同様に、タップ係数学習において、誤差がより小さいタップ係数を求めるとともに、ALF処理において、かかるタップ係数を用いたフィルタ演算により、より元画像に近いフィルタ後画像を求めることができる。

　なお、以上のように、クラスに応じて、予測タップのタップ構造が変更される場合、すなわち、クラスごとに、予測タップのタップ構造が異なる場合、その予測タップとしての画素（の画素値）とのフィルタ演算に用いられるタップ係数のタップ構造も、クラスに応じて異なる。

　また、図３８のＢないしＤ、及び、図３９のＢでは、予測タップを構成する画素の数として、25画素を採用しているが、予測タップを構成する画素の数は、25画素に限定されるものではない。

　さらに、予測タップを構成する画素の数としては、クラスごとに異なる数を採用することができる。

　＜クラス分類パラメータ＞

　図４０は、クラス分類パラメータ生成部１３１（図５）でのクラス分類パラメータの生成の例を説明する図である。

　クラス分類パラメータ生成部１３１は、タップ係数の更新を行う更新単位としての、例えば、１ピクチャの復号途中画像の画素が各クラスに均等に分類されるように、クラス分類パラメータを生成する。

　図４０は、更新単位としてのある1ピクチャの各画素の特徴量の確率密度pb1と、他の1ピクチャの各画素の特徴量の確率密度pb2とを示している。

　図４０において、横軸は、画素の特徴量を表し、縦軸は、特徴量の確率密度を表す。

　確率密度pb1は、特徴量が小さい場合に大きく、特徴量が大きくなるにつれて小さくなっていく。確率密度pb2は、特徴量が中程度の値の場合に大きく、特徴量が中程度の値から離れるにつれて小さくなっていく。

　図４０のＡは、クラス分類パラメータとしての閾値を固定にした場合のクラス分類を説明する図である。

　なお、図４０では、説明を簡単にするため、画素の特徴量として、例えば、画素値の分散を用い、クラス分類では、画素の特徴量と、クラス分類パラメータとしての閾値とを比較して、その比較結果に基づき、画素を、特徴量（の大きさ）に応じたクラスに分類することとする。

　図４０のＡでは、クラス分類パラメータとしての特徴量の閾値が、THv1，THv2，THv3，及び、THv4に固定されている。

　さらに、図４０のＡでは、確率密度pb1については、特徴量がTHv1未満の画素の確率密度が、他の値の特徴量の画素の確率密度より高くなっており、確率密度pb2については、特徴量がTHv1以上THv2未満の画素の確率密度が、他の値の特徴量の画素の確率密度より高くなっている。

　そのため、特徴量の閾値が、THv1ないしTHv4に固定されている場合、確率密度pb1の画像（特徴量の確率密度がpb1の画像）については、特徴量がTHv1未満のクラスに分類される画素が、他のクラスに分類される画素よりも多くなる。同様に、確率密度pb2の画像については、特徴量がTHv1以上THv2未満のクラスに分類される画素が、他のクラスに分類される画素よりも多くなる。

　以上のように、特徴量の閾値が固定されている場合、画像の特徴量の確率密度の違いによって、特定のクラスに分類される画素が、他のクラスに分類される画素に比較して多くなり（又は少なくなり）、いわば、クラス分類の結果に偏りが生じる。

　クラス分類の結果に偏りが生じると、注目画素についてフィルタ演算を行うにあたり、そのフィルタ演算に用いるタップ係数を決めるために行う注目画素のクラス分類の効果が薄れることがあり得る。

　そこで、クラス分類パラメータ生成部１３１は、例えば、タップ係数の更新を行う更新単位としての、例えば、１ピクチャの復号途中画像の画素が各クラスに均等に分類されるように、クラス分類パラメータを生成する。

　すなわち、特徴量が大きくなるにつれて小さくなる確率密度pb1の画像については、図４０のＢに示すように、特徴量が大きくなるにつれて、隣接する閾値どうしの幅が広くなるような閾値が、クラス分類パラメータとして生成される。かかる閾値を用いて、確率密度pb1の画像の各画素のクラス分類を行うことにより、確率密度pb1の画像の各画素は、各クラスに均等に分類される。すなわち、確率密度pb1の画像の各画素が適切に分類される。

　また、特徴量が中程度の値から離れるにつれて小さくなる確率密度pb2の画像については、図４０のＣに示すように、特徴量が中程度の値から離れるにつれて、隣接する閾値どうしの幅が広くなるような閾値が、クラス分類パラメータとして生成される。かかる閾値を用いて、確率密度pb2の画像の各画素のクラス分類を行うことにより、確率密度pb2の画像の各画素は、各クラスに均等に分類される。すなわち、確率密度pb2の画像の各画素が適切に分類される。

　クラス分類パラメータ生成部１３１は、元画像を用いて、タップ係数の更新を行う更新単位としての、例えば、１ピクチャの復号途中画像の画素が各クラスに均等に分類されるように、クラス分類パラメータを生成する。

　すなわち、クラス分類パラメータ生成部１３１は、更新単位の元画像から特徴量の確率密度を求め、その確率密度に応じて、更新単位の復号途中画像の画素が各クラスに均等に分類されるように、クラス分類パラメータを生成する。

　なお、クラス分類パラメータ生成部１３１では、更新単位の元画像ではなく、更新単位の復号途中画像に応じて、その更新単位の復号途中画像の画素が各クラスに均等に分類されるように、クラス分類パラメータを生成することができる。すなわち、例えば、クラス分類パラメータ生成部１３１では、更新単位の復号途中画像の特徴量を求め、その特徴量の分布から所定のルールに従って、更新単位の復号途中画像の画素が各クラスに均等に分類されるように、クラス分類パラメータを生成することができる。

　以上のように、画像符号化装置１００において、復号途中画像を用いて、クラス分類パラメータを生成する場合には、画像復号装置２００でも、復号途中画像を用いて、クラス分類パラメータを生成することができるので、クラス分類パラメータを、画像符号化装置１００から画像復号装置２００に伝送する必要がなくなり、符号化効率をさらに改善することができる。

　なお、クラス分類パラメータは、その他、例えば、更新単位の復号途中画像及び元画像を用いて生成することができる。すなわち、クラス分類パラメータ生成部１３１では、クラス分類に用いる特徴量の閾値を、様々な値に変化させて、タップ係数学習を行い、そのタップ係数学習において、式（４）の自乗誤差の総和Eをより小さくする特徴量の閾値や、タップ係数学習に用いられる復号途中画像の画素が各クラスに均等に分類されるときの特徴量の閾値を、クラス分類パラメータとして生成することができる。

　＜本技術を適用したコンピュータの説明＞
　上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

　図４１は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータ８００において、CPU（Central Processing Unit）８０１，ROM（Read Only Memory）８０２，RAM（Random Access Memory）８０３は、バス８０４により相互に接続されている。

　バス８０４には、さらに、入出力インタフェース８１０が接続されている。入出力インタフェース８１０には、入力部８１１、出力部８１２、記憶部８１３、通信部８１４、及びドライブ８１５が接続されている。

　入力部８１１は、キーボード、マウス、マイクロホン等よりなる。出力部８１２は、ディスプレイ、スピーカ等よりなる。記憶部８１３は、ハードディスクや不揮発性のメモリ等よりなる。通信部８１４は、ネットワークインタフェース等よりなる。ドライブ８１５は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブルメディア８２１を駆動する。

　以上のように構成されるコンピュータ８００では、CPU８０１が、例えば、記憶部８１３に記憶されているプログラムを、入出力インタフェース８１０及びバス８０４を介して、RAM８０３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ８００（CPU８０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア８２１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。

　コンピュータ８００では、プログラムは、リムーバブルメディア８２１をドライブ８１５に装着することにより、入出力インタフェース８１０を介して、記憶部８１３にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部８１４で受信し、記憶部８１３にインストールすることができる。その他、プログラムは、ROM８０２や記憶部８１３に、あらかじめインストールしておくことができる。

　なお、コンピュータ８００が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　＜テレビジョン装置＞
　図４２は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース（I/F）部９０９、制御部９１０、ユーザインタフェース（I/F）部９１１、及びバス９１２を備える。

　チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。すなわち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送部としての役割を有する。

　デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからEPG（Electronic Program Guide）等の補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

　デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

　映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去等の追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソル等のGUI（Graphical User Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

　表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD（Organic ElectroLuminescence Display）（有機ELディスプレイ）等）の映像面上に映像又は画像を表示する。

　音声信号処理部９０７は、デコーダ９０４から入力される音声データについてD/A変換及び増幅等の再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去等の追加的な処理を行ってもよい。

　外部インタフェース部９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース部９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。すなわち、外部インタフェース部９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送部としての役割を有する。

　制御部９１０は、CPU等のプロセッサ、並びにRAM及びROM等のメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータ等を記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

　ユーザインタフェース部９１１は、制御部９１０と接続される。ユーザインタフェース部９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部等を有する。ユーザインタフェース部９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

　バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース部９０９及び制御部９１０を相互に接続する。

　このように構成されたテレビジョン装置９００において、デコーダ９０４が、上述した画像復号装置２００の機能を有するようにしてもよい。つまり、デコーダ９０４が、符号化データを、以上の各実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、テレビジョン装置９００は、上述した各実施の形態と同様の効果を得ることができる。

　また、このように構成されたテレビジョン装置９００において、映像信号処理部９０５が、例えば、デコーダ９０４から供給される画像データを符号化し、得られた符号化データを、外部インタフェース部９０９を介してテレビジョン装置９００の外部に出力させることができるようにしてもよい。そして、その映像信号処理部９０５が、上述した画像符号化装置１００の機能を有するようにしてもよい。つまり、映像信号処理部９０５が、デコーダ９０４から供給される画像データを、以上の各実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、テレビジョン装置９００は、上述した各実施の形態と同様の効果を得ることができる。

　＜携帯電話機＞
　図４３は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

　アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

　携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録等の動作を行う。

　音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させるとともに、電子メールデータを記録再生部９２９に供給し、その記憶媒体に書き込ませる。

　記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリ等の内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB（Universal Serial Bus）メモリ、又はメモリカード等の外部装着型の記憶媒体であってもよい。

　また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記録再生部９２９に供給し、その記憶媒体に書き込ませる。

　さらに、画像表示モードにおいて、記録再生部９２９は、記憶媒体に記録されている符号化ストリームを読み出して画像処理部９２７へ出力する。画像処理部９２７は、記録再生部９２９から入力される符号化ストリームを復号し、画像データを表示部９３０に供給し、その画像を表示させる。

　また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

　このように構成された携帯電話機９２０において、例えば画像処理部９２７が、上述した画像符号化装置１００の機能を有するようにしてもよい。つまり、画像処理部９２７が、画像データを、以上の各実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、携帯電話機９２０は、上述した各実施の形態と同様の効果を得ることができる。

　また、このように構成された携帯電話機９２０において、例えば画像処理部９２７が、上述した画像復号装置２００の機能を有するようにしてもよい。つまり、画像処理部９２７が、符号化データを、以上の各実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、携帯電話機９２０は、上述した各実施の形態と同様の効果を得ることができる。

　＜記録再生装置＞
　図４４は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データ及び映像データを復号する。

　記録再生装置９４０は、チューナ９４１、外部インタフェース（I/F）部９４２、エンコーダ９４３、HDD（Hard Disk Drive）部９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、OSD（On-Screen Display）部９４８、制御部９４９、及びユーザインタフェース（I/F）部９５０を備える。

　チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。すなわち、チューナ９４１は、記録再生装置９４０における伝送部としての役割を有する。

　外部インタフェース部９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース部９４２は、例えば、IEEE（Institute of Electrical and Electronic Engineers）1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェース等であってよい。例えば、外部インタフェース部９４２を介して受信される映像データ及び音声データは、エンコーダ９４３へ入力される。すなわち、外部インタフェース部９４２は、記録再生装置９４０における伝送部としての役割を有する。

　エンコーダ９４３は、外部インタフェース部９４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

　HDD部９４４は、映像及び音声等のコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、HDD部９４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

　ディスクドライブ９４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばDVD（Digital Versatile Disc）ディスク（DVD-Video、DVD-RAM（DVD - Random Access Memory）、DVD-R（DVD - Recordable）、DVD-RW（DVD - Rewritable）、DVD+R（DVD + Recordable）、DVD+RW（DVD + Rewritable）等）又はBlu-ray（登録商標）ディスク等であってよい。

　セレクタ９４６は、映像及び音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD部９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、HDD部９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

　デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをOSD部９４８へ出力する。また、デコーダ９４７は、生成した音声データを外部のスピーカへ出力する。

　OSD部９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、OSD部９４８は、表示する映像に、例えばメニュー、ボタン又はカーソル等のGUIの画像を重畳してもよい。

　制御部９４９は、CPU等のプロセッサ、並びにRAM及びROM等のメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータ等を記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

　ユーザインタフェース部９５０は、制御部９４９と接続される。ユーザインタフェース部９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部等を有する。ユーザインタフェース部９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

　このように構成された記録再生装置９４０において、例えばエンコーダ９４３が、上述した画像符号化装置１００の機能を有するようにしてもよい。つまり、エンコーダ９４３が、画像データを、以上の各実施の形態において説明方法で符号化するようにしてもよい。このようにすることにより、記録再生装置９４０は、上述した各実施の形態と同様の効果を得ることができる。

　また、このように構成された記録再生装置９４０において、例えばデコーダ９４７が、上述した画像復号装置２００の機能を有するようにしてもよい。つまり、デコーダ９４７が、符号化データを、以上の各実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、記録再生装置９４０は、上述した各実施の形態と同様の効果を得ることができる。

　＜撮像装置＞
　図４５は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

　撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース（I/F）部９６６、メモリ部９６７、メディアドライブ９６８、OSD部９６９、制御部９７０、ユーザインタフェース（I/F）部９７１、及びバス９７２を備える。

　光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース部９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、OSD部９６９、及び制御部９７０を相互に接続する。

　光学ブロック９６１は、フォーカスレンズ及び絞り機構等を有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、CCD（Charge Coupled Device）又はCMOS（Complementary Metal Oxide Semiconductor）等のイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

　信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正等の種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

　画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース部９６６又はメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース部９６６又はメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、OSD部９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

　OSD部９６９は、例えばメニュー、ボタン又はカーソル等のGUIの画像を生成して、生成した画像を画像処理部９６４へ出力する。

　外部インタフェース部９６６は、例えばUSB入出力端子として構成される。外部インタフェース部９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース部９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスク等のリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース部９６６は、LAN又はインターネット等のネットワークに接続されるネットワークインタフェースとして構成されてもよい。すなわち、外部インタフェース部９６６は、撮像装置９６０における伝送部としての役割を有する。

　メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリ等の、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD（Solid State Drive）のような非可搬性の記憶部が構成されてもよい。

　制御部９７０は、CPU等のプロセッサ、並びにRAM及びROM等のメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータ等を記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

　ユーザインタフェース部９７１は、制御部９７０と接続される。ユーザインタフェース部９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチ等を有する。ユーザインタフェース部９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

　このように構成された撮像装置９６０において、例えば画像処理部９６４が、上述した画像符号化装置１００の機能を有するようにしてもよい。つまり、画像処理部９６４が、画像データを、以上の各実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、撮像装置９６０は、上述した各実施の形態と同様の効果を得ることができる。

　また、このように構成された撮像装置９６０において、例えば画像処理部９６４が、上述した画像復号装置２００の機能を有するようにしてもよい。つまり、画像処理部９６４が、符号化データを、以上の各実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、撮像装置９６０は、上述した各実施の形態と同様の効果を得ることができる。

　＜ビデオセット＞
　また、本技術は、任意の装置又はシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI（Large Scale Integration）等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等（すなわち、装置の一部の構成）として実施することもできる。図４６は、本技術を適用したビデオセットの概略的な構成の一例を示している。

　近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、１機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する１セットとして実施を行う場合も多く見られるようになってきた。

　図４６に示されるビデオセット１３００は、このような多機能化された構成であり、画像の符号化や復号（いずれか一方でもよいし、両方でも良い）に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。

　図４６に示されるように、ビデオセット１３００は、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、及びフロントエンドモジュール１３１４等のモジュール群と、コネクティビティ１３２１、カメラ１３２２、及びセンサ１３２３等の関連する機能を有するデバイスとを有する。

　モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。

　図４６の例の場合、ビデオモジュール１３１１は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ、ビデオプロセッサ、ブロードバンドモデム１３３３、及びRFモジュール１３３４を有する。

　プロセッサは、所定の機能を有する構成をSoC（System On a Chip）により半導体チップに集積したものであり、例えばシステムLSI（Large Scale Integration）等と称されるものもある。この所定の機能を有する構成は、論理回路（ハードウエア構成）であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム（ソフトウエア構成）であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路（ハードウエア構成）により実現し、その他の機能をCPUにおいて実行されるプログラム（ソフトウエア構成）により実現するようにしてもよい。

　図４６のアプリケーションプロセッサ１３３１は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ１３３１において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ１３３２等、ビデオモジュール１３１１内外の構成を必要に応じて制御することもできる。

　ビデオプロセッサ１３３２は、画像の符号化・復号（その一方又は両方）に関する機能を有するプロセッサである。

　ブロードバンドモデム１３３３は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線（又はその両方）の広帯域通信により送信するデータ（デジタル信号）をデジタル変調する等してアナログ信号に変換したり、その広帯域通信により受信したアナログ信号を復調してデータ（デジタル信号）に変換したりする。ブロードバンドモデム１３３３は、例えば、ビデオプロセッサ１３３２が処理する画像データ、画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報を処理する。

　RFモジュール１３３４は、アンテナを介して送受信されるRF（Radio Frequency）信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール１３３４は、ブロードバンドモデム１３３３により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール１３３４は、フロントエンドモジュール１３１４を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。

　なお、図４６において点線１３４１に示されるように、アプリケーションプロセッサ１３３１とビデオプロセッサ１３３２を、一体化し、１つのプロセッサとして構成されるようにしてもよい。

　外部メモリ１３１２は、ビデオモジュール１３１１の外部に設けられた、ビデオモジュール１３１１により利用される記憶デバイスを有するモジュールである。この外部メモリ１３１２の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM（Dynamic Random Access Memory）のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。

　パワーマネージメントモジュール１３１３は、ビデオモジュール１３１１（ビデオモジュール１３１１内の各構成）への電力供給を管理し、制御する。

　フロントエンドモジュール１３１４は、RFモジュール１３３４に対してフロントエンド機能（アンテナ側の送受信端の回路）を提供するモジュールである。図４６に示されるように、フロントエンドモジュール１３１４は、例えば、アンテナ部１３５１、フィルタ１３５２、及び増幅部１３５３を有する。

　アンテナ部１３５１は、無線信号を送受信するアンテナ及びその周辺の構成を有する。アンテナ部１３５１は、増幅部１３５３から供給される信号を無線信号として送信し、受信した無線信号を電気信号（RF信号）としてフィルタ１３５２に供給する。フィルタ１３５２は、アンテナ部１３５１を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール１３３４に供給する。増幅部１３５３は、RFモジュール１３３４から供給されるRF信号を増幅し、アンテナ部１３５１に供給する。

　コネクティビティ１３２１は、外部との接続に関する機能を有するモジュールである。コネクティビティ１３２１の物理構成は、任意である。例えば、コネクティビティ１３２１は、ブロードバンドモデム１３３３が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。

　例えば、コネクティビティ１３２１が、Bluetooth（登録商標）、IEEE 802.11（例えばWi-Fi（Wireless Fidelity、登録商標））、NFC（Near Field Communication）、IrDA（InfraRed Data Association）等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ１３２１が、USB（Universal Serial Bus）、HDMI（登録商標）（High-Definition Multimedia Interface）等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ１３２１が、アナログ入出力端子等のその他のデータ（信号）伝送機能等を有するようにしてもよい。

　なお、コネクティビティ１３２１が、データ（信号）の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ１３２１が、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ（リムーバブルメディアのドライブだけでなく、ハードディスク、SSD（Solid State Drive）、NAS（Network Attached Storage）等も含む）を有するようにしてもよい。また、コネクティビティ１３２１が、画像や音声の出力デバイス（モニタやスピーカ等）を有するようにしてもよい。

　カメラ１３２２は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ１３２２の撮像により得られた画像データは、例えば、ビデオプロセッサ１３３２に供給されて符号化される。

　センサ１３２３は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ１３２３により検出されたデータは、例えば、アプリケーションプロセッサ１３３１に供給されてアプリケーション等により利用される。

　以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。

　以上のような構成のビデオセット１３００において、後述するようにビデオプロセッサ１３３２に本技術を適用することができる。したがって、ビデオセット１３００は、本技術を適用したセットとして実施することができる。

　（ビデオプロセッサの構成例）
　図４７は、本技術を適用したビデオプロセッサ１３３２（図４６）の概略的な構成の一例を示している。

　図４７の例の場合、ビデオプロセッサ１３３２は、ビデオ信号及びオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータ及びオーディオデータを復号し、ビデオ信号及びオーディオ信号を再生出力する機能とを有する。

　図４７に示されるように、ビデオプロセッサ１３３２は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、フレームメモリ１４０５、及びメモリ制御部１４０６を有する。また、ビデオプロセッサ１３３２は、エンコード・デコードエンジン１４０７、ビデオES（Elementary Stream）バッファ１４０８Ａ及び１４０８Ｂ、並びに、オーディオESバッファ１４０９Ａ及び１４０９Ｂを有する。さらに、ビデオプロセッサ１３３２は、オーディオエンコーダ１４１０、オーディオデコーダ１４１１、多重化部（MUX（Multiplexer））１４１２、逆多重化部（DMUX（Demultiplexer））１４１３、及びストリームバッファ１４１４を有する。

　ビデオ入力処理部１４０１は、例えばコネクティビティ１３２１（図４６）等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第１画像拡大縮小部１４０２は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第２画像拡大縮小部１４０３は、画像データに対して、ビデオ出力処理部１４０４を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第１画像拡大縮小部１４０２と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部１４０４は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ１３２１等に出力する。

　フレームメモリ１４０５は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、及びエンコード・デコードエンジン１４０７によって共用される画像データ用のメモリである。フレームメモリ１４０５は、例えばDRAM等の半導体メモリとして実現される。

　メモリ制御部１４０６は、エンコード・デコードエンジン１４０７からの同期信号を受けて、アクセス管理テーブル１４０６Ａに書き込まれたフレームメモリ１４０５へのアクセススケジュールに従ってフレームメモリ１４０５に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル１４０６Ａは、エンコード・デコードエンジン１４０７、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３等で実行される処理に応じて、メモリ制御部１４０６により更新される。

　エンコード・デコードエンジン１４０７は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン１４０７は、フレームメモリ１４０５から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ１４０８Ａに順次書き込む。また、例えば、ビデオESバッファ１４０８Ｂからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ１４０５に順次書き込む。エンコード・デコードエンジン１４０７は、これらの符号化や復号において、フレームメモリ１４０５を作業領域として使用する。また、エンコード・デコードエンジン１４０７は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部１４０６に対して同期信号を出力する。

　ビデオESバッファ１４０８Ａは、エンコード・デコードエンジン１４０７によって生成されたビデオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。ビデオESバッファ１４０８Ｂは、逆多重化部（DMUX）１４１３から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン１４０７に供給する。

　オーディオESバッファ１４０９Ａは、オーディオエンコーダ１４１０によって生成されたオーディオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。オーディオESバッファ１４０９Ｂは、逆多重化部（DMUX）１４１３から供給されたオーディオストリームをバッファリングして、オーディオデコーダ１４１１に供給する。

　オーディオエンコーダ１４１０は、例えばコネクティビティ１３２１等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3（AudioCode number 3）方式等の所定の方式で符号化する。オーディオエンコーダ１４１０は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ１４０９Ａに順次書き込む。オーディオデコーダ１４１１は、オーディオESバッファ１４０９Ｂから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ１３２１等に供給する。

　多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法（すなわち、多重化により生成されるビットストリームのフォーマット）は任意である。また、この多重化の際に、多重化部（MUX）１４１２は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部（MUX）１４１２は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ（ファイルデータ）に変換する。

　逆多重化部（DMUX）１４１３は、多重化部（MUX）１４１２による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部（DMUX）１４１３は、ストリームバッファ１４１４から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する（ビデオストリームとオーディオストリームとを分離する）。つまり、逆多重化部（DMUX）１４１３は、逆多重化によりストリームのフォーマットを変換（多重化部（MUX）１４１２による変換の逆変換）することができる。例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等から供給されたトランスポートストリームを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１により各種記録媒体から読み出されたファイルデータを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。

　ストリームバッファ１４１４は、ビットストリームをバッファリングする。例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、又は外部からの要求等に基づいて、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等に供給する。

　また、例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、又は外部からの要求等に基づいて、例えばコネクティビティ１３２１等に供給し、各種記録媒体に記録させる。

　さらに、ストリームバッファ１４１４は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、又は外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

　また、ストリームバッファ１４１４は、例えばコネクティビティ１３２１等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、又は外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

　次に、このような構成のビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１等からビデオプロセッサ１３３２に入力されたビデオ信号は、ビデオ入力処理部１４０１において４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式のデジタル画像データに変換され、フレームメモリ１４０５に順次書き込まれる。このデジタル画像データは、第１画像拡大縮小部１４０２又は第２画像拡大縮小部１４０３に読み出されて、４：２：０Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式へのフォーマット変換及び拡大縮小処理が行われ、再びフレームメモリ１４０５に書き込まれる。この画像データは、エンコード・デコードエンジン１４０７によって符号化され、ビデオストリームとしてビデオESバッファ１４０８Ａに書き込まれる。

　また、コネクティビティ１３２１等からビデオプロセッサ１３３２に入力されたオーディオ信号は、オーディオエンコーダ１４１０によって符号化され、オーディオストリームとして、オーディオESバッファ１４０９Ａに書き込まれる。

　ビデオESバッファ１４０８Ａのビデオストリームと、オーディオESバッファ１４０９Ａのオーディオストリームは、多重化部（MUX）１４１２に読み出されて多重化され、トランスポートストリーム又はファイルデータ等に変換される。多重化部（MUX）１４１２により生成されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークに出力される。また、多重化部（MUX）１４１２により生成されたファイルデータは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１等に出力され、各種記録媒体に記録される。

　また、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークからビデオプロセッサ１３３２に入力されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。また、例えばコネクティビティ１３２１等において各種記録媒体から読み出され、ビデオプロセッサ１３３２に入力されたファイルデータは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。つまり、ビデオプロセッサ１３３２に入力されたトランスポートストリーム又はファイルデータは、逆多重化部（DMUX）１４１３によりビデオストリームとオーディオストリームとに分離される。

　オーディオストリームは、オーディオESバッファ１４０９Ｂを介してオーディオデコーダ１４１１に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ１４０８Ｂに書き込まれた後、エンコード・デコードエンジン１４０７により順次読み出されて復号されてフレームメモリ１４０５に書き込まれる。復号された画像データは、第２画像拡大縮小部１４０３によって拡大縮小処理されて、フレームメモリ１４０５に書き込まれる。そして、復号された画像データは、ビデオ出力処理部１４０４に読み出されて、４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。

　このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、エンコード・デコードエンジン１４０７に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、エンコード・デコードエンジン１４０７が、上述した画像符号化装置１００の機能若しくは画像復号装置２００の機能又はその両方を有するようにしてもよい。このようにすることにより、ビデオプロセッサ１３３２は、上述した各実施の形態と同様の効果を得ることができる。

　なお、エンコード・デコードエンジン１４０７において、本技術（すなわち、画像符号化装置１００の機能若しくは画像復号装置２００の機能又はその両方）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

　（ビデオプロセッサの他の構成例）
　図４８は、本技術を適用したビデオプロセッサ１３３２の概略的な構成の他の例を示している。図４８の例の場合、ビデオプロセッサ１３３２は、ビデオデータを所定の方式で符号化・復号する機能を有する。

　より具体的には、図４８に示されるように、ビデオプロセッサ１３３２は、制御部１５１１、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及び内部メモリ１５１５を有する。また、ビデオプロセッサ１３３２は、コーデックエンジン１５１６、メモリインタフェース１５１７、多重化・逆多重化部（MUX DMUX）１５１８、ネットワークインタフェース１５１９、及びビデオインタフェース１５２０を有する。

　制御部１５１１は、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６等、ビデオプロセッサ１３３２内の各処理部の動作を制御する。

　図４８に示されるように、制御部１５１１は、例えば、メインCPU１５３１、サブCPU１５３２、及びシステムコントローラ１５３３を有する。メインCPU１５３１は、ビデオプロセッサ１３３２内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU１５３１は、そのプログラム等に従って制御信号を生成し、各処理部に供給する（つまり、各処理部の動作を制御する）。サブCPU１５３２は、メインCPU１５３１の補助的な役割を果たす。例えば、サブCPU１５３２は、メインCPU１５３１が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ１５３３は、メインCPU１５３１及びサブCPU１５３２が実行するプログラムを指定する等、メインCPU１５３１及びサブCPU１５３２の動作を制御する。

　ディスプレイインタフェース１５１２は、制御部１５１１の制御の下、画像データを例えばコネクティビティ１３２１等に出力する。例えば、ディスプレイインタフェース１５１２は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、又はデジタルデータの画像データのまま、コネクティビティ１３２１のモニタ装置等に出力する。

　ディスプレイエンジン１５１３は、制御部１５１１の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。

　画像処理エンジン１５１４は、制御部１５１１の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。

　内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６により共用される、ビデオプロセッサ１３３２の内部に設けられたメモリである。内部メモリ１５１５は、例えば、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６の間で行われるデータの授受に利用される。例えば、内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、又はコーデックエンジン１５１６から供給されるデータを格納し、必要に応じて（例えば、要求に応じて）、そのデータを、ディスプレイエンジン１５１３、画像処理エンジン１５１４、又はコーデックエンジン１５１６に供給する。この内部メモリ１５１５は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM（Static Random Access Memory）のような比較的（例えば外部メモリ１３１２と比較して）小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。

　コーデックエンジン１５１６は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン１５１６が対応する符号化・復号の方式は任意であり、その数は１つであってもよいし、複数であってもよい。例えば、コーデックエンジン１５１６は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化又は符号化データの復号を行うようにしてもよい。

　図４８に示される例において、コーデックエンジン１５１６は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video１５４１、AVC/H.264１５４２、HEVC/H.265１５４３、HEVC/H.265(Scalable)１５４４、HEVC/H.265(Multi-view)１５４５、及びMPEG-DASH１５５１を有する。

　MPEG-2 Video１５４１は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.264１５４２は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265１５４３は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)１５４４は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)１５４５は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。

　MPEG-DASH１５５１は、画像データをMPEG-DASH（MPEG-Dynamic Adaptive Streaming over HTTP）方式で送受信する機能ブロックである。MPEG-DASHは、HTTP（HyperText Transfer Protocol）を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の１つとする。MPEG-DASH１５５１は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2 Video１５４１ないしHEVC/H.265(Multi-view)１５４５を利用する。

　メモリインタフェース１５１７は、外部メモリ１３１２用のインタフェースである。画像処理エンジン１５１４やコーデックエンジン１５１６から供給されるデータは、メモリインタフェース１５１７を介して外部メモリ１３１２に供給される。また、外部メモリ１３１２から読み出されたデータは、メモリインタフェース１５１７を介してビデオプロセッサ１３３２（画像処理エンジン１５１４又はコーデックエンジン１５１６）に供給される。

　多重化・逆多重化部（MUX DMUX）１５１８は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、複数のデータを１つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、１つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部（MUX DMUX）１５１８は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部（MUX DMUX）１５１８は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ（ファイルデータ）に変換することができる。もちろん、逆多重化によりその逆変換も可能である。

　ネットワークインタフェース１５１９は、例えばブロードバンドモデム１３３３やコネクティビティ１３２１等向けのインタフェースである。ビデオインタフェース１５２０は、例えばコネクティビティ１３２１やカメラ１３２２等向けのインタフェースである。

　次に、このようなビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース１５１９を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、例えば、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてファイルデータに変換され、ビデオインタフェース１５２０を介して例えばコネクティビティ１３２１等に出力され、各種記録媒体に記録される。

　さらに、例えば、コネクティビティ１３２１等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース１５２０を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてトランスポートストリームに変換され、ネットワークインタフェース１５１９を介して例えばコネクティビティ１３２１やブロードバンドモデム１３３３等に供給され図示せぬ他の装置に伝送される。

　なお、ビデオプロセッサ１３３２内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ１５１５や外部メモリ１３１２を利用して行われる。また、パワーマネージメントモジュール１３１３は、例えば制御部１５１１への電力供給を制御する。

　このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、コーデックエンジン１５１６に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、コーデックエンジン１５１６が、上述した画像符号化装置１００の機能若しくは画像復号装置２００の機能又はその両方を有するようにすればよい。このようにすることにより、ビデオプロセッサ１３３２は、上述した各実施の形態と同様の効果を得ることができる。

　なお、コーデックエンジン１５１６において、本技術（すなわち、画像符号化装置１００の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

　以上にビデオプロセッサ１３３２の構成を２例示したが、ビデオプロセッサ１３３２の構成は任意であり、上述した２例以外のものであってもよい。また、このビデオプロセッサ１３３２は、１つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する３次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。

　（装置への適用例）
　ビデオセット１３００は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット１３００は、テレビジョン装置９００（図４２）、携帯電話機９２０（図４３）、記録再生装置９４０（図４４）、撮像装置９６０（図４５）等に組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、上述した各実施の形態と同様の効果を得ることができる。

　なお、上述したビデオセット１３００の各構成の一部であっても、ビデオプロセッサ１３３２を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ１３３２のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線１３４１により示されるプロセッサやビデオモジュール１３１１等を、本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、及びフロントエンドモジュール１３１４を組み合わせ、本技術を適用したビデオユニット１３６１として実施することもできる。いずれの構成の場合であっても、上述した各実施の形態と同様の効果を得ることができる。

　つまり、ビデオプロセッサ１３３２を含むものであればどのような構成であっても、ビデオセット１３００の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ１３３２、点線１３４１により示されるプロセッサ、ビデオモジュール１３１１、又は、ビデオユニット１３６１を、テレビジョン装置９００（図４２）、携帯電話機９２０（図４３）、記録再生装置９４０（図４４）、撮像装置９６０（図４５）等に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット１３００の場合と同様に、上述した各実施の形態と同様の効果を得ることができる。

　＜ネットワークシステム＞
　また、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。図４９は、本技術を適用したネットワークシステムの概略的な構成の一例を示している。

　図４９に示されるネットワークシステム１６００は、機器同士が、ネットワークを介して画像（動画像）に関する情報を授受するシステムである。このネットワークシステム１６００のクラウドサービス１６０１は、自身に通信可能に接続されるコンピュータ１６１１、AV（Audio Visual）機器１６１２、携帯型情報処理端末１６１３、IoT（Internet of Things）デバイス１６１４等の端末に対して、画像（動画像）に関するサービスを提供するシステムである。例えば、クラウドサービス１６０１は、所謂動画配信（オンデマンドやライブ配信）のような、画像（動画像）のコンテンツの供給サービスを端末に提供する。また、例えば、クラウドサービス１６０１は、端末から画像（動画像）のコンテンツを受け取って保管するバックアップサービスを提供する。また、例えば、クラウドサービス１６０１は、端末同士の画像（動画像）のコンテンツの授受を仲介するサービスを提供する。

　クラウドサービス１６０１の物理構成は任意である。例えば、クラウドサービス１６０１は、動画像を保存し、管理するサーバ、動画像を端末に配信するサーバ、動画像を端末から取得するサーバ、ユーザ（端末）や課金を管理するサーバ等の各種サーバや、インターネットやLAN等の任意のネットワークを有するようにしてもよい。

　コンピュータ１６１１は、例えば、パーソナルコンピュータ、サーバ、ワークステーション等のような情報処理装置により構成される。AV機器１６１２は、例えば、テレビジョン受像機、ハードディスクレコーダ、ゲーム機器、カメラ等のような画像処理装置により構成される。携帯型情報処理端末１６１３は、例えば、ノート型パーソナルコンピュータ、タブレット端末、携帯電話機、スマートフォン等のような携帯型の情報処理装置により構成される。IoTデバイス１６１４は、例えば、機械、家電、家具、その他の物、ICタグ、カード型デバイス等、画像に関する処理を行う任意の物体により構成される。これらの端末は、いずれも通信機能を有し、クラウドサービス１６０１に接続し（セッションを確立し）、クラウドサービス１６０１と情報の授受を行う（すなわち通信を行う）ことができる。また、各端末は、他の端末と通信を行うこともできる。端末間の通信は、クラウドサービス１６０１を介して行うようにしてもよいし、クラウドサービス１６０１を介さずに行うようにしてもよい。

　以上のようなネットワークシステム１６００に本技術を適用し、端末間や、端末とクラウドサービス１６０１との間で画像（動画像）のデータが授受される際に、その画像データを各実施の形態において上述したように符号化・復号するようにしてもよい。つまり、端末（コンピュータ１６１１ないしIoTデバイス１６１４）やクラウドサービス１６０１が、それぞれ、上述した画像符号化装置１００や画像復号装置２００の機能を有するようにしてもよい。このようにすることにより、画像データを授受する端末（コンピュータ１６１１ないしIoTデバイス１６１４）やクラウドサービス１６０１は、上述した各実施の形態と同様の効果を得ることができる。

　なお、符号化データ（ビットストリーム）に関する各種情報は、符号化データに多重化されて伝送され又は記録されるようにしてもよいし、符号化データに多重化されることなく、符号化データと関連付けられた別個のデータとして伝送され又は記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、１フレーム、又はフレーム内の一部分等の任意の単位で互いに関連付けられるようにしてもよい。

　また、上述したように、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　なお、本技術は、以下の構成をとることができる。

　＜１＞
　予測符号化の残差と予測画像とを加算することにより得られる復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められるクラスごとのタップ係数を復号する復号部と、
　前記復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うクラス分類部と、
　前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行う演算部と
　を備える復号装置。
　＜２＞
　前記クラス分類部は、前記注目画素の傾斜特徴量と、前記注目画素の傾斜特徴量の信頼度とを用いて、前記注目画素のクラス分類を行う
　＜１＞に記載の復号装置。
　＜３＞
　前記注目画素の傾斜特徴量は、前記注目画素の周辺領域の各画素の前記等高線の接線方向を代表する代表値であり、
　前記注目画素の傾斜特徴量の信頼度は、前記周辺領域の各画素の前記等高線の接線方向の中に、前記代表値が表す方向と異なる方向がない程度を表す
　＜２＞に記載の復号装置。
　＜４＞
　前記クラス分類部は、前記注目画素の、前記傾斜特徴量及び前記信頼度以外の他の特徴量をも用いて、前記注目画素のクラス分類を行う
　＜２＞又は＜３＞に記載の復号装置。
　＜５＞
　前記他の特徴量は、前記注目画素の周辺領域の高域の周波数成分を表す特徴量である
　＜４＞に記載の復号装置。
　＜６＞
　前記復号部は、前記クラス分類において前記注目画素の特徴量を処理するのに用いられる所定のクラス分類パラメータを復号し、
　前記クラス分類部は、前記クラス分類パラメータを用いて、前記注目画素の特徴量を処理することにより、前記注目画素のクラス分類を行う
　＜１＞ないし＜５＞のいずれかに記載の復号装置。
　＜７＞
　前記クラス分類パラメータは、前記元画像を用いて、前記複数のクラスそれぞれに、画素が均等に分類されるように生成される
　＜６＞に記載の復号装置。
　＜８＞
　前記復号部は、第１の方向を表す前記傾斜特徴量の画素が分類される第１の方向のクラスのタップ係数と、第２の方向を表す前記傾斜特徴量の画素が分類される第２の方向のクラスのタップ係数との回転の対称性に応じて順序を並べ替えた前記第１の方向のクラスのタップ係数と、前記第２の方向のクラスのタップ係数との差分である差分係数を復号する
　＜１＞ないし＜７＞のいずれかに記載の復号装置。
　＜９＞
　各クラスのタップ係数のタップ構造が、クラスごとに異なる
　＜１＞ないし＜８＞のいずれかに記載の復号装置。
　＜１０＞
　復号装置が、
　予測符号化の残差と予測画像とを加算することにより得られる復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められるクラスごとのタップ係数を復号することと、
　前記復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うことと、
　前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行うことと
　を含む復号方法。
　＜１１＞
　予測符号化の残差と予測画像とを加算することにより得られる復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うクラス分類部と、
　前記復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められる前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行う演算部と、
　前記タップ係数を符号化する符号化部と
　を備える符号化装置。
　＜１２＞
　前記クラス分類部は、前記注目画素の傾斜特徴量と、前記注目画素の傾斜特徴量の信頼度とを用いて、前記注目画素のクラス分類を行う
　＜１１＞に記載の符号化装置。
　＜１３＞
　前記注目画素の傾斜特徴量は、前記注目画素の周辺領域の各画素の前記等高線の接線方向を代表する代表値であり、
　前記注目画素の傾斜特徴量の信頼度は、前記周辺領域の各画素の前記等高線の接線方向の中に、前記代表値が表す方向と異なる方向がない程度を表す
　＜１２＞に記載の符号化装置。
　＜１４＞
　前記クラス分類部は、前記注目画素の、前記傾斜特徴量及び前記信頼度以外の他の特徴量をも用いて、前記注目画素のクラス分類を行う
　＜１２＞又は＜１３＞に記載の符号化装置。
　＜１５＞
　前記他の特徴量は、前記注目画素の周辺領域の高域の周波数成分を表す特徴量である
　＜１４＞に記載の符号化装置。
　＜１６＞
　前記クラス分類部は、所定のクラス分類パラメータを用いて、前記注目画素の特徴量を処理することにより、前記注目画素のクラス分類を行い、
　前記符号化部は、前記クラス分類パラメータを符号化する
　＜１１＞ないし＜１５＞のいずれかに記載の符号化装置。
　＜１７＞
　前記元画像を用いて、前記複数のクラスそれぞれに、画素が均等に分類されるように、前記クラス分類パラメータを生成するクラス分類パラメータ生成部をさらに備える
　＜１６＞に記載の符号化装置。
　＜１８＞
　前記符号化部は、第１の方向を表す前記傾斜特徴量の画素が分類される第１の方向のクラスのタップ係数と、第２の方向を表す前記傾斜特徴量の画素が分類される第２の方向のクラスのタップ係数との回転の対称性に応じて順序を並べ替えた前記第１の方向のクラスのタップ係数と、前記第２の方向のクラスのタップ係数との差分である差分係数を、前記第２の方向のクラスのタップ係数に代えて符号化する
　＜１１＞ないし＜１７＞のいずれかに記載の符号化装置。
　＜１９＞
　各クラスのタップ係数のタップ構造が、クラスごとに異なる
　＜１１＞ないし＜１８＞のいずれかに記載の符号化装置。
　＜２０＞
　符号化装置が、
　予測符号化の残差と予測画像とを加算することにより得られる復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うことと、
　前記復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められる前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行うことと、
　前記タップ係数を符号化することと
　を含む符号化方法。

　１１　伝送媒体，　１２　記録媒体，　２０　ALF処理部，　２１　タップ選択部，　２２　クラス分類部，　２３　係数取得部，　２４　フィルタ演算部，　５０　学習部，　５１　タップ選択部，　５２　クラス分類部，　５３　足し込み部，　５４　係数算出部，　１００　画像符号化装置，　１０１　演算部，　１０２　直交変換部，　１０３　直交変換部，　１０４　可逆符号化部，　１０５　逆量子化部，　１０６　逆直交変換部，　１０７　演算部，　１０８　DF，　１０９　SAO，　１１０　ALF，　１１１　DPB，　１１２　予測部，　１３１　クラス分類パラメータ生成部，　１３２　学習部，　１３３　ALF処理部，　１６１　タップ選択部，　１６２　クラス分類部，　１６３　足し込み部，　１６４　係数算出部，　１７１　クラスブロック抽出部，　１７２　傾斜特徴量／信頼度算出部，　１７３　第１クラス分類部，　１７４　特徴量算出部，　１７５　第２クラス分類部，　１８１　タップ選択部，　１８２　クラス分類部，　１８３　係数取得部，　１８４　フィルタ演算部，　１９１　クラスブロック抽出部，　１９２　傾斜特徴量／信頼度算出部，　１９３　第１クラス分類部，　１９４　特徴量算出部，　１９５　第２クラス分類部，　２００　画像復号装置，　２０１　可逆復号部，　２０２　逆量子化部，　２０３　逆直交変換部，　２０４　演算部，　２０５　DF，　２０６　SAO，　２０７　ALF，　２０８　DPB，　２０９　予測部，　２３１　ALF処理部，　２４１　タップ選択部，　２４２　クラス分類部，　２４３　係数取得部，　２４４　フィルタ演算部，　２５１　クラスブロック抽出部，　２５２　傾斜特徴量／信頼度算出部，　２５３　第１クラス分類部，　２５４　特徴量算出部，　２５５　第２クラス分類部

Claims

　予測符号化の残差と予測画像とを加算することにより得られる復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められるクラスごとのタップ係数を復号する復号部と、
　前記復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うクラス分類部と、
　前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行う演算部と
　を備える復号装置。
　前記クラス分類部は、前記注目画素の傾斜特徴量と、前記注目画素の傾斜特徴量の信頼度とを用いて、前記注目画素のクラス分類を行う
　請求項１に記載の復号装置。
　前記注目画素の傾斜特徴量は、前記注目画素の周辺領域の各画素の前記等高線の接線方向を代表する代表値であり、
　前記注目画素の傾斜特徴量の信頼度は、前記周辺領域の各画素の前記等高線の接線方向の中に、前記代表値が表す方向と異なる方向がない程度を表す
　請求項２に記載の復号装置。
　前記クラス分類部は、前記注目画素の、前記傾斜特徴量及び前記信頼度以外の他の特徴量をも用いて、前記注目画素のクラス分類を行う
　請求項２に記載の復号装置。
　前記他の特徴量は、前記注目画素の周辺領域の高域の周波数成分を表す特徴量である
　請求項４に記載の復号装置。
　前記復号部は、前記クラス分類において前記注目画素の特徴量を処理するのに用いられる所定のクラス分類パラメータを復号し、
　前記クラス分類部は、前記クラス分類パラメータを用いて、前記注目画素の特徴量を処理することにより、前記注目画素のクラス分類を行う
　請求項１に記載の復号装置。
　前記クラス分類パラメータは、前記元画像を用いて、前記複数のクラスそれぞれに、画素が均等に分類されるように生成される
　請求項６に記載の復号装置。
　前記復号部は、第１の方向を表す前記傾斜特徴量の画素が分類される第１の方向のクラスのタップ係数と、第２の方向を表す前記傾斜特徴量の画素が分類される第２の方向のクラスのタップ係数との回転の対称性に応じて順序を並べ替えた前記第１の方向のクラスのタップ係数と、前記第２の方向のクラスのタップ係数との差分である差分係数を復号する
　請求項１に記載の復号装置。
　各クラスのタップ係数のタップ構造が、クラスごとに異なる
　請求項１に記載の復号装置。
　復号装置が、
　予測符号化の残差と予測画像とを加算することにより得られる復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められるクラスごとのタップ係数を復号することと、
　前記復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うことと、
　前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行うことと
　を含む復号方法。
　予測符号化の残差と予測画像とを加算することにより得られる復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うクラス分類部と、
　前記復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められる前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行う演算部と、
　前記タップ係数を符号化する符号化部と
　を備える符号化装置。
　前記クラス分類部は、前記注目画素の傾斜特徴量と、前記注目画素の傾斜特徴量の信頼度とを用いて、前記注目画素のクラス分類を行う
　請求項１１に記載の符号化装置。
　前記注目画素の傾斜特徴量は、前記注目画素の周辺領域の各画素の前記等高線の接線方向を代表する代表値であり、
　前記注目画素の傾斜特徴量の信頼度は、前記周辺領域の各画素の前記等高線の接線方向の中に、前記代表値が表す方向と異なる方向がない程度を表す
　請求項１２に記載の符号化装置。
　前記クラス分類部は、前記注目画素の、前記傾斜特徴量及び前記信頼度以外の他の特徴量をも用いて、前記注目画素のクラス分類を行う
　請求項１２に記載の符号化装置。
　前記他の特徴量は、前記注目画素の周辺領域の高域の周波数成分を表す特徴量である
　請求項１４に記載の符号化装置。
　前記クラス分類部は、所定のクラス分類パラメータを用いて、前記注目画素の特徴量を処理することにより、前記注目画素のクラス分類を行い、
　前記符号化部は、前記クラス分類パラメータを符号化する
　請求項１１に記載の符号化装置。
　前記元画像を用いて、前記複数のクラスそれぞれに、画素が均等に分類されるように、前記クラス分類パラメータを生成するクラス分類パラメータ生成部をさらに備える
　請求項１６に記載の符号化装置。
　前記符号化部は、第１の方向を表す前記傾斜特徴量の画素が分類される第１の方向のクラスのタップ係数と、第２の方向を表す前記傾斜特徴量の画素が分類される第２の方向のクラスのタップ係数との回転の対称性に応じて順序を並べ替えた前記第１の方向のクラスのタップ係数と、前記第２の方向のクラスのタップ係数との差分である差分係数を、前記第２の方向のクラスのタップ係数に代えて符号化する
　請求項１１に記載の符号化装置。
　各クラスのタップ係数のタップ構造が、クラスごとに異なる
　請求項１１に記載の符号化装置。
　符号化装置が、
　予測符号化の残差と予測画像とを加算することにより得られる復号途中画像の注目画素の画素値の等高線の接線方向を表す傾斜特徴量を用いて、前記注目画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類を行うことと、
　前記復号途中画像と、前記復号途中画像に対応する元画像とを用いた誤差を最小にする学習により求められる前記クラスごとのタップ係数のうちの、前記注目画素のクラスのタップ係数を用いて、前記復号途中画像とのフィルタ演算を行うことと、
　前記タップ係数を符号化することと
　を含む符号化方法。