JPWO2018131524A1

JPWO2018131524A1 - 画像処理装置及び画像処理方法

Info

Publication number: JPWO2018131524A1
Application number: JP2018561335A
Authority: JP
Inventors: 拓郎川合; 健一郎細川; 央二中神; 優池田
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2017-01-12
Filing date: 2017-12-28
Publication date: 2019-11-07
Anticipated expiration: 2037-12-28
Also published as: US20200077120A1; CN110169063A; RU2019120747A; KR20190105578A; WO2018131524A1; BR112019013976A2; JP7047776B2; EP3570543A1; KR102477784B1; US11190808B2; AU2017393149A1; CN114520915A; CA3048382A1; EP3570543A4; CN110169063B

Abstract

本技術は、S/Nを改善することができるようにする画像処理装置及び画像処理方法に関する。クラスタップ選択部は、予測符号化の残差と予測画像とを加算することにより得られる第１の画像の処理対象画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類に用いられるクラスタップとなる画素を、第１の画像から選択することにより、クラスタップを構成する。クラス分類部は、クラスタップを用いて、処理対象画素のクラス分類を行い、フィルタ処理部は、第１の画像に、処理対象画素のクラスに対応するフィルタ処理を行い、予測画像の予測に用いられる第２の画像を生成する。クラスタップ選択部は、クラスタップのタップ構造を、複数のタップ構造の中から選択されたタップ構造に更新する。本技術は、例えば、画像の符号化装置や復号装置に適用できる。

Description

本技術は、画像処理装置及び画像処理方法に関し、特に、例えば、画像のS/Nを、大きく改善することができるようにする画像処理装置及び画像処理方法に関する。

予測符号化方式の１つである、例えば、HEVC(High Efficiency Video Coding)では、ILF(In Loop Filter)が提案された。また、ポストHEVC（HEVCの次の世代の予測符号化方式）では、ILFを採用することが予想される。

ILFとしては、ブロックノイズを低減するためのDF(Deblocking Filter)、リンギングを低減するためのSAO(Sample Adaptive Offset)、符号化誤差（復号画像の、元画像に対する誤差）を最小化するためのALF(Adaptive Loop Filter)がある。

ALFについては、特許文献１に記載され、SAOについては、特許文献２に記載されている。

特許第5485983号公報特表2014-523183号公報

現在提案されているILFとしてのDFや、SAO、ALFは、自由度が低く、フィルタの細かい制御を行うことが困難であるため、画像のS/N(Signal to Noise Ratio)を、大きく改善することが困難である。

本技術は、このような状況に鑑みてなされたものであり、画像のS/Nを、大きく改善することができるようにするものである。

本技術の画像処理装置は、予測符号化の残差と予測画像とを加算することにより得られる第１の画像の処理対象画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類に用いられるクラスタップとなる画素を、前記第１の画像から選択することにより、前記クラスタップを構成するクラスタップ選択部と、前記クラスタップを用いて、前記処理対象画素のクラス分類を行うクラス分類部と、前記第１の画像に、前記処理対象画素のクラスに対応するフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成するフィルタ処理部とを備え、前記クラスタップ選択部は、前記クラスタップのタップ構造を、複数のタップ構造の中から選択されたタップ構造に更新する画像処理装置である。

本技術の画像処理方法は、予測符号化の残差と予測画像とを加算することにより得られる第１の画像の処理対象画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類に用いられるクラスタップとなる画素を、前記第１の画像から選択することにより、前記クラスタップを構成することと、前記クラスタップを用いて、前記処理対象画素のクラス分類を行うことと、前記第１の画像に、前記処理対象画素のクラスに対応するフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成することとを含み、前記クラスタップのタップ構造を、複数のタップ構造の中から選択されたタップ構造に更新する画像処理方法である。

本技術の画像処理装置及び画像処理方法においては、予測符号化の残差と予測画像とを加算することにより得られる第１の画像の処理対象画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類に用いられるクラスタップとなる画素が、前記第１の画像から選択されることにより、前記クラスタップが構成される。そして、前記クラスタップを用いて、前記処理対象画素のクラス分類が行われ、前記第１の画像に、前記処理対象画素のクラスに対応するフィルタ処理が行われて、前記予測画像の予測に用いられる第２の画像が生成される。この場合において、前記クラスタップのタップ構造が、複数のタップ構造の中から選択されたタップ構造に更新される。

なお、画像処理装置は、独立した装置であっても良いし、１つの装置を構成している内部ブロックであっても良い。

また、画像処理装置は、コンピュータにプログラムを実行させることにより実現することができる。プログラムは、伝送媒体を介して、伝送することにより、又は、記録媒体に記録して、提供することができる。

本技術によれば、画像のS/Nを、大きく改善することができる。

なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

本技術を適用した画像処理システムの一実施の形態の構成例を示す図である。クラス分類適応処理を行う画像変換装置の第１の構成例を示すブロック図である。係数取得部２４に記憶されるタップ係数の学習を行う学習装置の構成例を示すブロック図である。学習部３３の構成例を示すブロック図である。クラス分類適応処理を行う画像変換装置の第２の構成例を示すブロック図である。係数取得部２４に記憶される種係数の学習を行う学習装置の構成例を示すブロック図である。学習部６３の構成例を示すブロック図である。学習部６３の他の構成例を示すブロック図である。符号化装置１１の第１の構成例を示すブロック図である。クラス分類適応フィルタ１１１の構成例を示すブロック図である。学習装置１３１の構成例を示すブロック図である。クラスタップのタップ構造としてのクラスタップ形状の例を示す図である。複数フレームの画素から構成されるクラスタップのタップ構造の例を示す図である。クラスタップのタップ構造のバリエーションの例を示す図である。タップ構造選択部１５１に記憶させるクラスタップの複数のタップ構造の決定方法の例を説明する図である。クラス分類部１６３がクラス分類に用いるクラスタップの画像特徴量の例を示す図である。画像変換部１７１の構成例を示すブロック図である。学習装置１３１の処理の例を説明するフローチャートである。画像変換装置１３３の構成例を示すブロック図である。符号化装置１１の符号化処理の例を説明するフローチャートである。ステップＳ４６で行われるクラス分類適応処理の例を説明するフローチャートである。復号装置１２の第１の構成例を示すブロック図である。クラス分類適応フィルタ２０６の構成例を示すブロック図である。画像変換装置２３１の構成例を示すブロック図である。復号装置１２の復号処理の例を説明するフローチャートである。ステップＳ１２２で行われるクラス分類適応処理の例を説明するフローチャートである。クラスごとのタップ係数を削減する削減方法の例を説明する図である。符号化装置１１の第２の構成例を示すブロック図である。クラス分類適応フィルタ３１１の構成例を示すブロック図である。クラスタップのタップ構造の選択に用いる取得可能情報の例を示す図である。学習装置３３１の構成例を示すブロック図である。画像変換部３７１の構成例を示すブロック図である。学習装置３３１の処理の例を説明するフローチャートである。画像変換装置３３３の構成例を示すブロック図である。符号化装置１１の符号化処理の例を説明するフローチャートである。ステップＳ２４６で行われるクラス分類適応処理の例を説明するフローチャートである。復号装置１２の第２の構成例を示すブロック図である。クラス分類適応フィルタ４０１の構成例を示すブロック図である。画像変換装置４３１の構成例を示すブロック図である。復号装置１２の復号処理の例を説明するフローチャートである。ステップＳ３２２で行われるクラス分類適応処理の例を説明するフローチャートである。多視点画像符号化方式の例を示す図である。本技術を適用した多視点画像符号化装置の主な構成例を示す図である。本技術を適用した多視点画像復号装置の主な構成例を示す図である。階層画像符号化方式の例を示す図である。本技術を適用した階層画像符号化装置の主な構成例を示す図である。本技術を適用した階層画像復号装置の主な構成例を示す図である。コンピュータの主な構成例を示すブロック図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。ビデオセットの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の他の例を示すブロック図である。

＜本技術を適用した画像処理システム＞

図１は、本技術を適用した画像処理システムの一実施の形態の構成例を示す図である。

図１において、画像処理システムは、符号化装置１１及び復号装置１２を有する。

符号化装置１１には、符号化対象の元画像が供給される。

符号化装置１１は、例えば、HEVCやAVC(Advanced Video Coding)等のような予測符号化により、元画像を符号化する。

符号化装置１１の予測符号化では、元画像の予測画像が生成され、元画像と予測画像との残差が符号化される。

さらに、符号化装置１１の予測符号化では、予測符号化の残差と予測画像とを加算することにより得られる復号途中画像に、ILFをかけるILF処理を行うことで、予測画像の予測に用いられる参照画像が生成される。

ここで、ILF処理としてのフィルタ処理（フィルタリング）が、復号途中画像に施されることにより得られる画像を、フィルタ後画像ともいう。

符号化装置１１は、予測符号化を行う他、必要に応じて、復号途中画像と元画像とを用いて学習等を行うことにより、フィルタ後画像が、なるべく元画像に近くなるようなILF処理としてのフィルタ処理に関する情報を、フィルタ情報として求めることができる。

符号化装置１１のILF処理は、学習により得られるフィルタ情報を用いて行うことができる。

ここで、フィルタ情報を求める学習は、例えば、元画像の１又は複数のシーケンスごとや、元画像の１又は複数のシーン（シーンチェンジから、次のシーンチェンジまでのフレーム）ごと、元画像の１又は複数のフレーム（ピクチャ）ごと、元画像の１又は複数のスライスごと、ピクチャの符号化の単位のブロックの１又は複数ラインごと、その他任意の単位で行うことができる。また、フィルタ情報を求める学習は、例えば、残差が閾値以上になった場合に行うことができる。

符号化装置１１は、元画像の予測符号化により得られる符号化データを、伝送媒体１３を介して伝送し、又は、記録媒体１４に伝送して記録させる。

また、符号化装置１１は、学習により得られるフィルタ情報を、伝送媒体１３を介して伝送し、又は、記録媒体１４に伝送して記録させることができる。

なお、フィルタ情報を求める学習は、符号化装置１１とは別の装置で行うことができる。

また、フィルタ情報は、符号化データとは別に伝送することもできるし、符号化データに含めて伝送することもできる。

さらに、フィルタ情報を求める学習は、元画像そのもの（及び元画像から得られる復号途中画像）を用いて行う他、画像特徴量が元画像と類似する、元画像とは別個の画像を用いて行うことができる。

復号装置１２は、符号化装置１１から伝送される符号化データ及び必要なフィルタ情報を、伝送媒体１３や記録媒体１４を介して受け取り（受信し）（取得し）、符号化データを、符号化装置１１の予測符号化に対応する方式で復号する。

すなわち、復号装置１２は、符号化装置１１からの符号化データを処理することで、予測符号化の残差を求める。さらに、復号装置１２は、残差と予測画像とを加算することにより、符号化装置１１で得られるのと同様の復号途中画像を求める。そして、復号装置１２は、復号途中画像に、符号化装置１１からのフィルタ情報を必要に応じて用いたILF処理としてのフィルタ処理を施し、フィルタ後画像を求める。

復号装置１２において、フィルタ後画像は、元画像の復号画像として出力されるとともに、必要に応じて、予測画像の予測に用いられる参照画像として一時記憶される。

符号化装置１１及び復号装置１２のILF処理としてのフィルタ処理は、任意のフィルタによって行うことができる。

また、符号化装置１１及び復号装置１２のフィルタ処理は、クラス分類適応処理（の予測演算）によって行うことができる。以下、クラス分類適応処理について説明する。

＜クラス分類適応処理＞

図２は、クラス分類適応処理を行う画像変換装置の第１の構成例を示すブロック図である。

ここで、クラス分類適応処理は、例えば、第１の画像を、第２の画像に変換する画像変換処理として捉えることができる。

第１の画像を第２の画像に変換する画像変換処理は、その第１と第２の画像の定義によって様々な信号処理となる。

すなわち、例えば、第１の画像を低空間解像度の画像とするとともに、第２の画像を高空間解像度の画像とすれば、画像変換処理は、空間解像度を向上させる空間解像度創造（向上）処理ということができる。

また、例えば、第１の画像を低S/Nの画像とするとともに、第２の画像を高S/Nの画像とすれば、画像変換処理は、ノイズを除去するノイズ除去処理ということができる。

さらに、例えば、第１の画像を所定の画素数（サイズ）の画像とするとともに、第２の画像を、第１の画像の画素数を多くまたは少なくした画像とすれば、画像変換処理は、画像のリサイズ（拡大または縮小）を行うリサイズ処理ということができる。

また、例えば、第１の画像を、HEVC等のブロック単位で符号化された画像を復号することによって得られる復号画像とするとともに、第２の画像を、符号化前の元画像とすれば、画像変換処理は、ブロック単位の符号化及び復号によって生じるブロック歪みを除去する歪み除去処理ということができる。

なお、クラス分類適応処理は、画像の他、例えば、音響を、処理の対象とすることができる。音響を対象とするクラス分類適応処理は、第１の音響（例えば、S/Nの低い音響等）を、第２の音響（例えば、S/Nの高い音響等）に変換する音響変換処理として捉えることができる。

クラス分類適応処理では、第１の画像のうちの注目している注目画素（処理対象の処理対象画素）の画素値を複数のクラスのうちのいずれかのクラスにクラス分類することにより得られるクラスのタップ係数と、注目画素に対して選択される第１の画像の、タップ係数と同一の数の画素の画素値とを用いた予測演算により、注目画素の画素値が求められる。

図２は、クラス分類適応処理による画像変換処理を行う画像変換装置の構成例を示している。

図２において、画像変換装置２０は、タップ選択部２１及び２２、クラス分類部２３、係数取得部２４、並びに、予測演算部２５を有する。

画像変換装置２０には、第１の画像が供給される。画像変換装置２０に供給される第１の画像は、タップ選択部２１及び２２に供給される。

タップ選択部２１は、第１の画像を構成する画素を、順次、注目画素に選択する。さらに、タップ選択部２１は、注目画素に対応する第２の画像の対応画素（の画素値）を予測するのに用いる第１の画像を構成する画素（の画素値）の幾つかを、予測タップとして選択する。

具体的には、タップ選択部２１は、注目画素の時空間の位置から空間的又は時間的に近い位置にある第１の画像の複数の画素を、予測タップとして選択する。

タップ選択部２２は、注目画素を、幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる第１の画像を構成する画素（の画素値）の幾つかを、クラスタップとして選択する。すなわち、タップ選択部２２は、タップ選択部２１が予測タップを選択するのと同様にして、クラスタップを選択する。

なお、予測タップとクラスタップは、同一のタップ構造を有するものであっても良いし、異なるタップ構造を有するものであっても良い。

タップ選択部２１で得られた予測タップは、予測演算部２５に供給され、タップ選択部２２で得られたクラスタップは、クラス分類部２３に供給される。

クラス分類部２３は、一定の規則に従って、注目画素をクラス分類し、その結果得られるクラスに対応するクラスコードを、係数取得部２４に供給する。

すなわち、クラス分類部２３は、例えば、タップ選択部２２からのクラスタップを用いて、注目画素をクラス分類し、その結果得られるクラスに対応するクラスコードを、係数取得部２４に供給する。

例えば、クラス分類部２３は、クラスタップを用いて、注目画素の画像特徴量を求める。さらに、クラス分類部２３は、注目画素の画像特徴量に応じて、注目画素をクラス分類し、その結果得られるクラスに対応するクラスコードを、係数取得部２４に供給する。

ここで、クラス分類を行う方法としては、例えば、ADRC(Adaptive Dynamic Range Coding)等を採用することができる。

ADRCを用いる方法では、クラスタップを構成する画素（の画素値）が、ADRC処理され、その結果得られるADRCコード（ADRC値）にしたがって、注目画素のクラスが決定される。ADRCコードは、注目画素を含む小領域の画像特徴量としての波形パターンを表す。

なお、LビットADRCにおいては、例えば、クラスタップを構成する画素の画素値の最大値MAXと最小値MINが検出され、DR=MAX-MINを、集合の局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、クラスタップを構成する各画素の画素値がLビットに再量子化される。すなわち、クラスタップを構成する各画素の画素値から、最小値MINが減算され、その減算値がDR/2^Lで除算（再量子化）される。そして、以上のようにして得られる、クラスタップを構成するLビットの各画素の画素値を、所定の順番で並べたビット列が、ADRCコードとして出力される。したがって、クラスタップが、例えば、１ビットADRC処理された場合には、そのクラスタップを構成する各画素の画素値は、最大値MAXと最小値MINとの平均値で除算され（小数点以下切り捨て）、これにより、各画素の画素値が１ビットとされる（２値化される）。そして、その１ビットの画素値を所定の順番で並べたビット列が、ADRCコードとして出力される。

なお、クラス分類部２３には、例えば、クラスタップを構成する画素の画素値のレベル分布のパターンを、そのままクラスコードとして出力させることも可能である。しかしながら、この場合、クラスタップが、N個の画素の画素値で構成され、各画素の画素値に、Aビットが割り当てられているとすると、クラス分類部２３が出力するクラスコードの場合の数は、（２^N）^A通りとなり、画素の画素値のビット数Aに指数的に比例した膨大な数となる。

したがって、クラス分類部２３においては、クラスタップの情報量を、上述のADRC処理や、あるいはベクトル量子化等によって圧縮することにより、クラス分類を行うのが好ましい。

係数取得部２４は、後述する学習によって求められたクラスごとのタップ係数を記憶し、さらに、その記憶したタップ係数のうちの、クラス分類部２３から供給されるクラスコードが表すクラスのタップ係数、すなわち、注目画素のクラスのタップ係数を取得する。さらに、係数取得部２４は、注目画素のクラスのタップ係数を、予測演算部２５に供給する。

ここで、タップ係数とは、ディジタルフィルタにおける、いわゆるタップにおいて入力データと乗算される係数に相当する係数である。

予測演算部２５は、タップ選択部２１が出力する予測タップと、係数取得部２４が供給されるタップ係数とを用いて、注目画素に対応する第２の画像の画素（対応画素）の画素値の真値の予測値を求める所定の予測演算を行う。これにより、予測演算部２５は、対応画素の画素値（の予測値）、すなわち、第２の画像を構成する画素の画素値を求めて出力する。

図３は、係数取得部２４に記憶されるタップ係数の学習を行う学習装置の構成例を示すブロック図である。

ここで、例えば、高画質の画像（高画質画像）を第２の画像とするとともに、その高画質画像をLPF(Low Pass Filter)によってフィルタリングする等してその画質（解像度）を低下させた低画質の画像（低画質画像）を第１の画像として、低画質画像から予測タップを選択し、その予測タップとタップ係数を用いて、高画質画像の画素（高画質画素）の画素値を、所定の予測演算によって求める（予測する）ことを考える。

所定の予測演算として、例えば、線形１次予測演算を採用することとすると、高画質画素の画素値yは、次の線形１次式によって求められることになる。

・・・（１）

但し、式（１）において、x_nは、対応画素としての高画質画素yに対する予測タップを構成する、n番目の低画質画像の画素（以下、適宜、低画質画素という）の画素値を表し、w_nは、n番目の低画質画素（の画素値）と乗算されるn番目のタップ係数を表す。なお、式（１）では、予測タップが、N個の低画質画素x₁，x₂，・・・，x_Nで構成されることとする。

ここで、高画質画素の画素値yは、式（１）に示した線形１次式ではなく、２次以上の高次の式によって求めるようにすることも可能である。

いま、第ｋサンプルの高画質画素の画素値の真値をy_kと表すとともに、式（１）によって得られるその真値y_kの予測値をy_k’と表すと、その予測誤差e_kは、次式で表される。

・・・（２）

いま、式（２）の予測値y_k’は、式（１）にしたがって求められるため、式（２）のy_k’を、式（１）にしたがって置き換えると、次式が得られる。

・・・（３）

但し、式（３）において、x_n,kは、対応画素としての第kサンプルの高画質画素に対する予測タップを構成するn番目の低画質画素を表す。

式（３）（又は式（２））の予測誤差e_kを０とするタップ係数w_nが、高画質画素を予測するのに最適なものとなるが、すべての高画質画素について、そのようなタップ係数w_nを求めることは、一般には困難である。

そこで、タップ係数w_nが最適なものであることを表す規範として、例えば、最小自乗法を採用することとすると、最適なタップ係数w_nは、次式で表される自乗誤差の総和Ｅ（統計的な誤差）を最小にすることで求めることができる。

・・・（４）

但し、式（４）において、Kは、対応画素としての高画質画素y_kと、その高画質画素y_kに対する予測タップを構成する低画質画素x_1,k，x_2,k，・・・，x_N,kとのセットのサンプル数（学習用のサンプルの数）を表す。

式（４）の自乗誤差の総和Ｅの最小値（極小値）は、式（５）に示すように、総和Ｅをタップ係数w_nで偏微分したものを０とするw_nによって与えられる。

・・・（５）

そこで、上述の式（３）をタップ係数w_nで偏微分すると、次式が得られる。

・・・（６）

式（５）と（６）から、次式が得られる。

・・・（７）

式（７）のe_kに、式（３）を代入することにより、式（７）は、式（８）に示す正規方程式で表すことができる。

・・・（８）

式（８）の正規方程式は、例えば、掃き出し法（Gauss-Jordanの消去法）等を用いることにより、タップ係数w_nについて解くことができる。

式（８）の正規方程式を、クラスごとにたてて解くことにより、最適なタップ係数（ここでは、自乗誤差の総和Ｅを最小にするタップ係数）w_nを、クラスごとに求めることができる。

図３は、式（８）の正規方程式をたてて解くことによりタップ係数w_nを求める学習を行う学習装置の構成例を示している。

図３において、学習装置３０は、教師データ生成部３１、生徒データ生成部３２、及び、学習部３３を有する。

教師データ生成部３１及び生徒データ生成部３２には、タップ係数w_nの学習に用いられる学習画像が供給される。学習画像としては、例えば、解像度の高い高画質画像を用いることができる。

教師データ生成部３１は、学習画像から、タップ係数の学習の教師（真値）となる教師データ、すなわち、クラス分類適応処理により得たい教師データとして、式（１）による予測演算としての写像の写像先となる教師画像を生成し、学習部３３に供給する。ここでは、教師データ生成部３１は、例えば、学習画像としての高画質画像を、そのまま教師画像として、学習部３３に供給する。

生徒データ生成部３２は、学習画像から、タップ係数の学習の生徒となる生徒データ、すなわち、クラス分類適応処理においてタップ係数との予測演算の対象となる生徒データとして、式（１）による予測演算としての写像による変換対象となる生徒画像を生成し、学習部３３に供給する。ここでは、生徒データ生成部３２は、例えば、学習画像としての高画質画像をLPF(low Pass Filter)でフィルタリングすることにより、その解像度を低下させることで、低画質画像を生成し、この低画質画像を、生徒画像として、学習部３３に供給する。

学習部３３は、生徒データ生成部３２からの生徒データとしての生徒画像を構成する画素を、順次、注目画素とし、その注目画素について、図２のタップ選択部２１が選択するのと同一のタップ構造の画素を、生徒画像から予測タップとして選択する。さらに、学習部３３は、注目画素に対応する教師画像を構成する対応画素と、注目画素の予測タップとを用い、クラスごとに、式（８）の正規方程式をたてて解くことにより、クラスごとのタップ係数を求める。

図４は、図３の学習部３３の構成例を示すブロック図である。

図４において、学習部３３は、タップ選択部４１及び４２、クラス分類部４３、足し込み部４４、並びに、係数算出部４５を有する。

生徒画像は、タップ選択部４１及び４２に供給され、教師画像は、足し込み部４４に供給される。

タップ選択部４１は、生徒画像を構成する画素を、順次、注目画素として選択し、その注目画素を表す情報を、必要なブロックに供給する。

さらに、タップ選択部４１は、注目画素について、生徒画像を構成する画素から、図２のタップ選択部２１が選択するの同一の画素を予測タップに選択し、これにより、タップ選択部２１で得られるのと同一のタップ構造の予測タップを得て、足し込み部４４に供給する。

タップ選択部４２は、注目画素について、生徒画像を構成する画素から、図２のタップ選択部２２が選択するのと同一の画素をクラスタップに選択し、これにより、タップ選択部２２で得られるのと同一のタップ構造のクラスタップを得て、クラス分類部４３に供給する。

クラス分類部４３は、タップ選択部４２からのクラスタップを用いて、図２のクラス分類部２３と同一のクラス分類を行い、その結果得られる注目画素のクラスに対応するクラスコードを、足し込み部４４に出力する。

足し込み部４４は、教師画像を構成する画素から、注目画素に対応する対応画素（の画素値）を取得し、対応画素と、タップ選択部４１から供給される注目画素についての予測タップを構成する生徒画像の画素（の画素値）とを対象とした足し込みを、クラス分類部４３から供給されるクラスコードごとに行う。

すなわち、足し込み部４４には、教師データとしての教師画像の対応画素y_k、生徒データとしての注目画素の予測タップx_n,k、注目画素のクラスを表すクラスコードが供給される。

足し込み部４４は、注目画素のクラスごとに、予測タップ（生徒データ）x_n,kを用い、式（８）の左辺の行列における生徒データどうしの乗算（x_n,kx_n',k）と、サメーション（Σ）に相当する演算を行う。

さらに、足し込み部４４は、やはり、注目画素のクラスごとに、予測タップ（生徒データ）x_n,kと教師データy_kを用い、式（８）の右辺のベクトルにおける生徒データx_n,k及び教師データy_kの乗算（x_n,ky_k）と、サメーション（Σ）に相当する演算を行う。

すなわち、足し込み部４４は、前回、教師データとしての、注目画素に対応する対応画素について求められた式（８）における左辺の行列のコンポーネント（Σx_n,kx_n',k）と、右辺のベクトルのコンポーネント（Σx_n,ky_k）を、その内蔵するメモリ（図示せず）に記憶しており、その行列のコンポーネント（Σx_n,kx_n',k）又はベクトルのコンポーネント（Σx_n,ky_k）に対して、新たな注目画素に対応する対応画素となった教師データについて、その教師データy_k+1及び生徒データx_n,k+1を用いて計算される、対応するコンポーネントx_n,k+1x_n',k+1又はx_n,k+1y_k+1を足し込む（式（８）のサメーションで表される加算を行う）。

そして、足し込み部４４は、例えば、生徒画像の画素すべてを注目画素として、上述の足し込みを行うことにより、各クラスについて、式（８）に示した正規方程式をたて、その正規方程式を、係数算出部４５に供給する。

係数算出部４５は、足し込み部４４から供給される各クラスについての正規方程式を解くことにより、各クラスについて、最適なタップ係数w_nを求めて出力する。

図２の画像変換装置２０における係数取得部２４には、以上のようにして求められたクラスごとのタップ係数w_nを記憶させることができる。

図５は、クラス分類適応処理を行う画像変換装置の第２の構成例を示すブロック図である。

なお、図中、図２の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図５において、画像変換装置２０は、タップ選択部２１及び２２、クラス分類部２３、係数取得部２４、並びに、予測演算部２５を有する。

したがって、図５の画像変換装置２０は、図２の場合と同様に構成される。

但し、図５では、係数取得部２４は、後述する種係数を記憶する。さらに、図５では、係数取得部２４には、外部からパラメータzが供給される。

係数取得部２４は、種係数から、パラメータzに対応する、クラスごとのタップ係数を生成し、そのクラスごとのタップ係数から、クラス分類部２３からのクラスのタップ係数を取得して、予測演算部２５に供給する。

ここで、図２では、係数取得部２４は、タップ係数そのものを記憶するが、図５では、係数取得部２４は、種係数を記憶する。種係数は、パラメータzを与える（決定する）ことによって、タップ係数を生成することができ、かかる観点から、種係数は、タップ係数と同等の情報であるとみなすことができる。本明細書では、タップ係数には、タップ係数そのものの他、そのタップ係数を生成することができる種係数も必要に応じて含まれることとする。

図６は、係数取得部２４に記憶される種係数の学習を行う学習装置の構成例を示すブロック図である。

ここで、例えば、図３で説明した場合と同様に、高画質の画像（高画質画像）を第２の画像とするとともに、その高画質画像の空間解像度を低下させた低画質の画像（低画質画像）を第１の画像として、低画質画像から予測タップを選択し、その予測タップとタップ係数を用いて、高画質画像の画素である高画質画素の画素値を、例えば、式（１）の線形１次予測演算によって求める（予測する）ことを考える。

いま、タップ係数w_nが、種係数と、パラメータzとを用いた次式によって生成されることとする。

・・・（９）

但し、式（９）において、β_m,nは、n番目のタップ係数w_nを求めるのに用いられるｍ番目の種係数を表す。なお、式（９）では、タップ係数w_nが、Ｍ個の種係数β_1,n，β_2,n，・・・，β_M,nを用いて求められる。

ここで、種係数β_m,nとパラメータzから、タップ係数w_nを求める式は、式（９）に限定されるものではない。

いま、式（９）におけるパラメータzによって決まる値z^m-1を、新たな変数ｔ_mを導入して、次式で定義する。

・・・（１０）

式（１０）を、式（９）に代入することにより、次式が得られる。

・・・（１１）

式（１１）によれば、タップ係数w_nは、種係数β_m,nと変数ｔ_mとの線形１次式によって求められることになる。

ところで、いま、第kサンプルの高画質画素の画素値の真値をy_kと表すとともに、式（１）によって得られるその真値y_kの予測値をy_k’と表すと、その予測誤差e_kは、次式で表される。

・・・（１２）

いま、式（１２）の予測値y_k’は、式（１）にしたがって求められるため、式（１２）のy_k’を、式（１）にしたがって置き換えると、次式が得られる。

・・・（１３）

但し、式（１３）において、x_n,kは、対応画素としての第kサンプルの高画質画素に対する予測タップを構成するn番目の低画質画素を表す。

式（１３）のw_nに、式（１１）を代入することにより、次式が得られる。

・・・（１４）

式（１４）の予測誤差e_kを０とする種係数β_m,nが、高画質画素を予測するのに最適なものとなるが、すべての高画質画素について、そのような種係数β_m,nを求めることは、一般には困難である。

そこで、種係数β_m,nが最適なものであることを表す規範として、例えば、最小自乗法を採用することとすると、最適な種係数β_m,nは、次式で表される自乗誤差の総和Ｅを最小にすることで求めることができる。

・・・（１５）

但し、式（１５）において、Kは、対応画素としての高画質画素y_kと、その高画質画素y_kに対する予測タップを構成する低画質画素x_1,k，x_2,k，・・・，x_N,kとのセットのサンプル数（学習用のサンプルの数）を表す。

式（１５）の自乗誤差の総和Ｅの最小値（極小値）は、式（１６）に示すように、総和Ｅを種係数β_m,nで偏微分したものを０とするβ_m,nによって与えられる。

・・・（１６）

式（１３）を、式（１６）に代入することにより、次式が得られる。

・・・（１７）

いま、Ｘ_i,p,j,qとＹ_i,pを、式（１８）と（１９）に示すように定義する。

・・・（１８）

・・・（１９）

この場合、式（１７）は、Ｘ_i,p,j,qとＹ_i,pを用いた式（２０）に示す正規方程式で表すことができる。

・・・（２０）

式（２０）の正規方程式は、例えば、掃き出し法（Gauss-Jordanの消去法）等を用いることにより、種係数β_m,nについて解くことができる。

図５の画像変換装置２０においては、多数の高画質画素y₁，y₂，・・・，y_Kを教師データとするとともに、各高画質画素y_kに対する予測タップを構成する低画質画素x_1,k，x_2,k，・・・，x_N,kを生徒データとして、クラスごとに式（２０）の正規方程式をたてて解く学習を行うことにより求められたクラスごとの種係数β_m,nが、係数取得部２４に記憶される。そして、係数取得部２４では、種係数β_m,nと、外部から与えられるパラメータzから、式（９）にしたがって、クラスごとのタップ係数w_nが生成され、予測演算部２５において、そのタップ係数w_nと、注目画素についての予測タップを構成する低画質画素（第１の画像の画素）x_nを用いて、式（１）が計算されることにより、高画質画素（第２の画像の対応画素）の画素値（に近い予測値）が求められる。

図６は、式（２０）の正規方程式をクラスごとにたてて解くことにより、クラスごとの種係数β_m,nを求める学習を行う学習装置の構成例を示している。

なお、図中、図３の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図６において、学習装置３０は、教師データ生成部３１、パラメータ生成部６１、生徒データ生成部６２、及び、学習部６３を有する。

したがって、図６の学習装置３０は、教師データ生成部３１を有する点で、図３の場合と共通する。

但し、図６の学習装置３０は、パラメータ生成部６１を新たに有する点で、図３の場合と相違する。さらに、図６の学習装置３０は、生徒データ生成部３２及び学習部３３に代えて、生徒データ生成部６２、及び、学習部６３がそれぞれ設けられている点で、図３の場合と相違する。

パラメータ生成部６１は、パラメータzが取り得る範囲の幾つかの値を生成し、生徒データ生成部６２と学習部６３に供給する。

例えば、パラメータzが取り得る値が0乃至Zの範囲の実数であるとすると、パラメータ生成部６１は、例えば、例えば、z=0,1,2,・・・,Zの値のパラメータzを生成し、生徒データ生成部６２と学習部６３に供給する。

生徒データ生成部６２には、教師データ生成部３１に供給されるのと同様の学習画像が供給される。

生徒データ生成部６２は、図３の生徒データ生成部３２と同様に、学習画像から生徒画像を生成し、生徒データとして、学習部６３に供給する。

ここで、生徒データ生成部６２には、学習画像の他、パラメータzが取り得る範囲の幾つかの値が、パラメータ生成部６１から供給される。

生徒データ生成部６２は、学習画像としての高画質画像を、例えば、そこに供給されるパラメータzに対応するカットオフ周波数のLPFによってフィルタリングすることにより、パラメータzの幾つかの値それぞれに対して、生徒画像としての低画質画像を生成する。

すなわち、生徒データ生成部６２では、学習画像としての高画質画像について、Z+1種類の、空間解像度の異なる生徒画像としての低画質画像が生成される。

なお、ここでは、例えば、パラメータzの値が大きくなるほど、カットオフ周波数の高いLPFを用いて、高画質画像をフィルタリングし、生徒画像としての低画質画像を生成することとする。この場合、値の大きいパラメータzに対する生徒画像としての低画質画像ほど、空間解像度が高い。

また、生徒データ生成部６２では、パラメータzに応じて、学習画像としての高画質画像の水平方向及び垂直方向のうちの一方又は両方向の空間解像度を低下させた生徒画像としての低画質画像を生成することができる。

さらに、学習画像としての高画質画像の水平方向及び垂直方向のうちの両方向の空間解像度を低下させた生徒画像としての低画質画像を生成する場合には、学習画像としての高画質画像の水平方向及び垂直方向の空間解像度は、それぞれ別個のパラメータ、すなわち、２個のパラメータz及びz'に応じて、別個に低下させることができる。

この場合、図５の係数取得部２４では、外部から２個のパラメータz及びz'が与えられ、その２個のパラメータz及びz'と種係数とを用いて、タップ係数が生成される。

以上のように、種係数としては、１個のパラメータzの他、２個のパラメータz及びz'、さらには、３個以上のパラメータを用いて、タップ係数を生成することができる種係数を求めることができる。但し、本明細書では、説明を簡単にするため、１個のパラメータzを用いてタップ係数を生成する種係数を例に、説明を行う。

学習部６３は、教師データ生成部３１からの教師データとしての教師画像、パラメータ生成部６１からのパラメータz、及び、生徒データ生成部６２からの生徒データとしての生徒画像を用いて、クラスごとの種係数を求めて出力する。

図７は、図６の学習部６３の構成例を示すブロック図である。

なお、図中、図４の学習部３３と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図７において、学習部６３は、タップ選択部４１及び４２、クラス分類部４３、足し込み部７１、並びに、係数算出部７２を有する。

したがって、図７の学習部６３は、タップ選択部４１及び４２、並びに、クラス分類部４３を有する点で、図４の学習部３３と共通する。

但し、学習部６３は、足し込み部４４及び係数算出部４５に代えて、足し込み部７１、及び、係数算出部７２をそれぞれ有する点で、学習部３３と相違する。

図７では、タップ選択部４１と４２は、パラメータ生成部６１で生成されるパラメータzに対応して生成された生徒画像（ここでは、パラメータzに対応するカットオフ周波数のLPFを用いて生成された生徒データとしての低画質画像）から、予測タップとクラスタップをそれぞれ選択する。

足し込み部７１は、図６の教師データ生成部３１からの教師画像から、注目画素に対応する対応画素を取得し、その対応画素、タップ選択部４１から供給される注目画素について構成された予測タップを構成する生徒データ（生徒画像の画素）、及び、その生徒データを生成したときのパラメータzを対象とした足し込みを、クラス分類部４３から供給されるクラスごとに行う。

すなわち、足し込み部７１には、注目画素に対応する対応画素としての教師データy_k、タップ選択部４１が出力する注目画素についての予測タップx_i,k（x_j,k）、及び、クラス分類部４３が出力する注目画素のクラスが供給されるとともに、注目画素についての予測タップを構成する生徒データを生成したときのパラメータzが、パラメータ生成部６１から供給される。

そして、足し込み部７１は、クラス分類部４３から供給されるクラスごとに、予測タップ（生徒データ）x_i,k（x_j,k）とパラメータzを用い、式（２０）の左辺の行列における、式（１８）で定義されるコンポーネントＸ_i,p,j,qを求めるための生徒データ及びパラメータzの乗算（x_i,kｔ_px_j,kｔ_q）と、サメーション（Σ）に相当する演算を行う。なお、式（１８）のｔ_pは、式（１０）にしたがって、パラメータzから計算される。式（１８）のｔ_qも同様である。

さらに、足し込み部７１は、やはり、クラス分類部４３から供給されるクラスごとに、予測タップ（生徒データ）x_i,k、教師データy_k、及び、パラメータzを用い、式（２０）の右辺のベクトルにおける、式（１９）で定義されるコンポーネントＹ_i,pを求めるための生徒データx_i,k、教師データy_k、及び、パラメータzの乗算（x_i,kｔ_py_k）と、サメーション（Σ）に相当する演算を行う。なお、式（１９）のｔ_pは、式（１０）にしたがって、パラメータzから計算される。

すなわち、足し込み部７１は、前回、教師データとしての、注目画素に対応する対応画素について求められた式（２０）における左辺の行列のコンポーネントＸ_i,p,j,qと、右辺のベクトルのコンポーネントＹ_i,pを、その内蔵するメモリ（図示せず）に記憶しており、その行列のコンポーネントＸ_i,p,j,q又はベクトルのコンポーネントＹ_i,pに対して、新たな注目画素に対応する対応画素となった教師データについて、その教師データy_k、生徒データx_i,k(x_j,k)、及びパラメータzを用いて計算される、対応するコンポーネントx_i,kｔ_px_j,kｔ_q又はx_i,kｔ_py_kを足し込む（式（１８）のコンポーネントＸ_i,p,j,q又は式（１９）のコンポーネントＹ_i,pにおけるサメーションで表される加算を行う）。

そして、足し込み部７１は、０，１，・・・，Zのすべての値のパラメータzにつき、生徒画像の画素すべてを注目画素として、上述の足し込みを行うことにより、各クラスについて、式（２０）に示した正規方程式をたて、その正規方程式を、係数算出部７２に供給する。

係数算出部７２は、足し込み部７１から供給されるクラスごとの正規方程式を解くことにより、各クラスごとの種係数β_m,nを求めて出力する。

ところで、図６の学習装置３０では、学習画像としての高画質画像を教師データとするとともに、その高画質画像の空間解像度を、パラメータzに対応して劣化させた低画質画像を生徒データとして、タップ係数w_n及び生徒データx_nから式（１）の線形１次式で予測される教師データの予測値yの自乗誤差の総和を直接的に最小にする種係数β_m,nを求める学習を行うようにしたが、種係数β_m,nの学習としては、教師データの予測値yの自乗誤差の総和を、いわば、間接的に最小にする種係数β_m,nを求める学習を行うことができる。

すなわち、学習画像としての高画質画像を教師データとするとともに、その高画質画像を、パラメータzに対応したカットオフ周波数のLPFによってフィルタリングすることにより、その水平解像度及び垂直解像度を低下させた低画質画像を生徒データとして、まず最初に、タップ係数w_n及び生徒データx_nを用いて式（１）の線形１次予測式で予測される教師データの予測値yの自乗誤差の総和を最小にするタップ係数w_nを、パラメータzの値（ここでは、z=0,1,・・・,Z）ごとに求める。そして、そのパラメータzの値ごとに求められたタップ係数w_nを教師データとするとともに、パラメータzを生徒データとして、式（１１）によって種係数β_m,n及び生徒データであるパラメータzに対応する変数ｔ_mから予測される教師データとしてのタップ係数w_nの予測値の自乗誤差の総和を最小にする種係数β_m,nを求める。

ここで、式（１）の線形１次予測式で予測される教師データの予測値yの自乗誤差の総和Ｅを最小（極小）にするタップ係数w_nは、図３の学習装置３０における場合と同様に、式（８）の正規方程式をたてて解くことにより、各クラスについて、パラメータzの値（z=0,1,・・・,Z）ごとに求めることができる。

ところで、タップ係数は、式（１１）に示したように、種係数β_m,nと、パラメータzに対応する変数ｔ_mとから求められる。そして、いま、この式（１１）によって求められるタップ係数を、w_n’と表すこととすると、次の式（２１）で表される、最適なタップ係数w_nと式（１１）により求められるタップ係数w_n’との誤差e_nを０とする種係数β_m,nが、最適なタップ係数w_nを求めるのに最適な種係数となるが、すべてのタップ係数w_nについて、そのような種係数β_m,nを求めることは、一般には困難である。

・・・（２１）

なお、式（２１）は、式（１１）によって、次式のように変形することができる。

・・・（２２）

そこで、種係数β_m,nが最適なものであることを表す規範として、例えば、やはり、最小自乗法を採用することとすると、最適な種係数β_m,nは、次式で表される自乗誤差の総和Ｅを最小にすることで求めることができる。

・・・（２３）

式（２３）の自乗誤差の総和Ｅの最小値（極小値）は、式（２４）に示すように、総和Ｅを種係数β_m,nで偏微分したものを０とするβ_m,nによって与えられる。

・・・（２４）

式（２２）を、式（２４）に代入することにより、次式が得られる。

・・・（２５）

いま、Ｘ_i,j,とＹ_iを、式（２６）と（２７）に示すように定義する。

・・・（２６）

・・・（２７）

この場合、式（２５）は、Ｘ_i,jとＹ_iを用いた式（２８）に示す正規方程式で表すことができる。

・・・（２８）

式（２８）の正規方程式も、例えば、掃き出し法等を用いることにより、種係数β_m,nについて解くことができる。

図８は、図６の学習部６３の他の構成例を示すブロック図である。

すなわち、図８は、式（２８）の正規方程式をたてて解くことにより種係数β_m,nを求める学習を行う学習部６３の構成例を示している。

なお、図中、図４又は図７の場合と対応するについては、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図８の学習部６３は、タップ選択部４１及び４２、クラス分類部４３、係数算出部４５、足し込み部８１及び８２、並びに、係数算出部８３を有する。

したがって、図８の学習部６３は、タップ選択部４１及び４２、クラス分類部４３、並びに、係数算出部４５を有する点で、図４の学習部３３と共通する。

但し、図８の学習部６３は、足し込み部４４に代えて、足し込み部８１を有する点、並びに、足し込み部８２及び係数算出部８３を新たに有する点で、図４の学習部３３と相違する。

足し込み部８１には、クラス分類部４３が出力する注目画素のクラスと、パラメータ生成部６１が出力するパラメータzが供給される。足し込み部８１は、教師データ生成部３１からの教師画像のうちの、注目画素に対応する対応画素としての教師データと、タップ選択部４１から供給される注目画素についての予測タップを構成する生徒データとを対象とした足し込みを、クラス分類部４３から供給されるクラスごとに、かつ、パラメータ生成部６１が出力するパラメータzの値ごとに行う。

すなわち、足し込み部８１には、教師データy_k、予測タップx_n,k、注目画素のクラス、及び、予測タップx_n,kを構成する生徒画像を生成したときのパラメータzが供給される。

足し込み部８１は、注目画素のクラスごとに、かつ、パラメータzの値ごとに、予測タップ（生徒データ）x_n,kを用い、式（８）の左辺の行列における生徒データどうしの乗算（x_n,kx_n',k）と、サメーション（Σ）に相当する演算を行う。

さらに、足し込み部８１は、注目画素のクラスごとに、かつパラメータzの値ごとに、予測タップ（生徒データ）x_n,kと教師データy_kを用い、式（８）の右辺のベクトルにおける生徒データx_n,k及び教師データy_kの乗算（x_n,ky_k）と、サメーション（Σ）に相当する演算を行う。

すなわち、足し込み部８１は、前回、教師データとしての、注目画素に対応する対応画素について求められた式（８）における左辺の行列のコンポーネント（Σx_n,kx_n',k）と、右辺のベクトルのコンポーネント（Σx_n,ky_k）を、その内蔵するメモリ（図示せず）に記憶しており、その行列のコンポーネント（Σx_n,kx_n',k）又はベクトルのコンポーネント（Σx_n,ky_k）に対して、新たな注目画素に対応する対応画素となった教師データについて、その教師データy_k+1及び生徒データx_n,k+1を用いて計算される、対応するコンポーネントx_n,k+1x_n',k+1又はx_n,k+1y_k+1を足し込む（式（８）のサメーションで表される加算を行う）。

そして、足し込み部８１は、生徒画像の画素すべてを注目画素として、上述の足し込みを行うことにより、各クラスについて、パラメータzの各値ごとに、式（８）に示した正規方程式をたて、その正規方程式を、係数算出部４５に供給する。

したがって、足し込み部８１は、図４の足し込み部４４と同様に、各クラスについて、式（８）の正規方程式をたてる。但し、足し込み部８１は、さらに、パラメータzの各値ごとにも、式（８）の正規方程式をたてる点で、図４の足し込み部４４と異なる。

係数算出部４５は、足し込み部８１から供給される各クラスについての、パラメータzの値ごとの正規方程式を解くことにより、各クラスについて、パラメータzの値ごとの最適なタップ係数w_nを求め、足し込み部８２に供給する。

足し込み部８２は、パラメータ生成部６１（図６）から供給されるパラメータz（に対応する変数ｔ_m）と、係数算出部４５から供給される最適なタップ係数w_nを対象とした足し込みを、クラスごとに行う。

すなわち、足し込み部８２は、パラメータ生成部６１から供給されるパラメータzから式（１０）によって求められる変数ｔ_i（ｔ_j）を用い、式（２８）の左辺の行列における、式（２６）で定義されるコンポーネントＸ_i,jを求めるためのパラメータzに対応する変数ｔ_i（ｔ_j）どうしの乗算（ｔ_iｔ_j）と、サメーション（Σ）に相当する演算を、クラスごとに行う。

ここで、コンポーネントＸ_i,jは、パラメータzによってのみ決まるものであり、クラスとは関係がないので、コンポーネントＸ_i,jの計算は、実際には、クラスごとに行う必要はなく、１回行うだけで済む。

さらに、足し込み部８２は、パラメータ生成部６１から供給されるパラメータzから式（１０）によって求められる変数ｔ_iと、係数算出部４５から供給される最適なタップ係数w_nとを用い、式（２８）の右辺のベクトルにおける、式（２７）で定義されるコンポーネントＹ_iを求めるためのパラメータzに対応する変数ｔ_i及び最適なタップ係数w_nの乗算（ｔ_iw_n）と、サメーション（Σ）に相当する演算を、クラスごとに行う。

足し込み部８２は、各クラスごとに、式（２６）で表されるコンポーネントＸ_i,jと、式（２７）で表されるコンポーネントＹ_iを求めることにより、各クラスについて、式（２８）の正規方程式をたて、その正規方程式を、係数算出部８３に供給する。

係数算出部８３は、足し込み部８２から供給されるクラスごとの式（２８）の正規方程式を解くことにより、各クラスごとの種係数β_m,nを求めて出力する。

図５の係数取得部２４には、以上のようにして求められたクラスごとの種係数β_m,nを記憶させることができる。

なお、種係数の学習においても、タップ係数の学習における場合と同様に、第１の画像に対応する生徒データと、第２の画像に対応する教師データとする画像の選択の仕方によって、種係数としては、各種の画像変換処理を行う種係数を得ることができる。

すなわち、上述の場合には、学習画像を、そのまま第２の画像に対応する教師データとするとともに、その学習画像の空間解像度を劣化させた低画質画像を、第１の画像に対応する生徒データとして、種係数の学習を行うようにしたことから、種係数としては、第１の画像を、その空間解像度を向上させた第２の画像に変換する空間解像度創造処理としての画像変換処理を行う種係数を得ることができる。

この場合、図５の画像変換装置２０では、画像の水平解像度及び垂直解像度を、パラメータzに対応する解像度に向上させることができる。

また、例えば、高画質画像を教師データとするとともに、その教師データとしての高画質画像に対して、パラメータzに対応するレベルのノイズを重畳した画像を生徒データとして、種係数の学習を行うことにより、種係数としては、第１の画像を、そこに含まれるノイズを除去（低減）した第２の画像に変換するノイズ除去処理としての画像変換処理を行う種係数を得ることができる。この場合、図５の画像変換装置２０では、パラメータzに対応するS/Nの画像（パラメータzに対応する強度のノイズ除去を施した画像）を得ることができる。

なお、上述の場合には、タップ係数w_nを、式（９）に示したように、β_1,nz⁰＋β_2,nz¹＋・・・＋β_M,nz^M-1で定義し、この式（９）によって、水平及び垂直方向の空間解像度を、いずれも、パラメータzに対応して向上させるためのタップ係数w_nを求めるようにしたが、タップ係数w_nとしては、水平解像度と垂直解像度を、独立のパラメータz_xとz_yに対応して、それぞれ独立に向上させるものを求めるようにすることも可能である。

すなわち、タップ係数w_nを、式（９）に代えて、例えば、３次式β_1,nz_x ⁰z_y ⁰＋β_2,nz_x ¹z_y ⁰＋β_3,nz_x ²z_y ⁰＋β_4,nz_x ³z_y ⁰＋β_5,nz_x ⁰z_y ¹＋β_6,nz_x ⁰z_y ²＋β_7,nz_x ⁰z_y ³＋β_8,nz_x ¹z_y ¹＋β_9,nz_x ²z_y ¹＋β_10,nz_x ¹z_y ²で定義するとともに、式（１０）で定義した変数ｔ_mを、式（１０）に代えて、例えば、ｔ₁＝z_x ⁰z_y ⁰，ｔ₂＝z_x ¹z_y ⁰，ｔ₃＝z_x ²z_y ⁰，ｔ₄＝z_x ³z_y ⁰，ｔ₅＝z_x ⁰z_y ¹，ｔ₆＝z_x ⁰z_y ²，ｔ₇＝z_x ⁰z_y ³，ｔ₈＝z_x ¹z_y ¹，ｔ₉＝z_x ²z_y ¹，ｔ₁₀＝z_x ¹z_y ²で定義する。この場合も、タップ係数w_nは、最終的には、式（１１）で表すことができ、したがって、図６の学習装置３０において、パラメータz_xとz_yに対応して、教師データの水平解像度と垂直解像度をそれぞれ劣化させた画像を、生徒データとして用いて学習を行って、種係数β_m,nを求めることにより、水平解像度と垂直解像度を、独立のパラメータz_xとz_yに対応して、それぞれ独立に向上させるタップ係数w_nを求めることができる。

その他、例えば、水平解像度と垂直解像度それぞれに対応するパラメータz_xとz_yに加えて、さらに、時間方向の解像度に対応するパラメータz_tを導入することにより、水平解像度、垂直解像度、時間解像度を、独立のパラメータz_x，z_y，z_tに対応して、それぞれ独立に向上させるタップ係数w_nを求めることが可能となる。

さらに、図６の学習装置３０において、パラメータz_xに対応して教師データの水平解像度及び垂直解像度を劣化させるとともに、パラメータz_yに対応して教師データにノイズを付加した画像を、生徒データとして用いて学習を行って、種係数β_m,nを求めることにより、パラメータz_xに対応して水平解像度及び垂直解像度を向上させるとともに、パラメータz_yに対応してノイズ除去を行うタップ係数w_nを求めることができる。

＜符号化装置１１の第１の構成例＞

図９は、図１の符号化装置１１の第１の構成例を示すブロック図である。

図９において、符号化装置１１は、A/D変換部１０１、並べ替えバッファ１０２、演算部１０３、直交変換部１０４、量子化部１０５、可逆符号化部１０６、及び、蓄積バッファ１０７を有する。さらに、符号化装置１１は、逆量子化部１０８、逆直交変換部１０９、演算部１１０、クラス分類適応フィルタ１１１、フレームメモリ１１２、選択部１１３、イントラ予測部１１４、動き予測補償部１１５、予測画像選択部１１６、及び、レート制御部１１７を有する。

A/D変換部１０１は、アナログ信号の元画像を、ディジタル信号の元画像にA/D変換し、並べ替えバッファ１０２に供給して記憶させる。

並べ替えバッファ１０２は、元画像のフレームを、GOP（Group Of Picture）に応じて、表示順から符号化（復号）順に並べ替え、演算部１０３、イントラ予測部１１４、動き予測補償部１１５、及び、クラス分類適応フィルタ１１１に供給する。

演算部１０３は、並べ替えバッファ１０２からの元画像から、予測画像選択部１１６を介してイントラ予測部１１４又は動き予測補償部１１５から供給される予測画像を減算し、その減算により得られる残差（予測残差）を、直交変換部１０４に供給する。

例えば、インター符号化が行われる画像の場合、演算部１０３は、並べ替えバッファ１０２から読み出された元画像から、動き予測補償部１１５から供給される予測画像を減算する。

直交変換部１０４は、演算部１０３から供給される残差に対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。なお、この直交変換の方法は任意である。直交変換部１０４は、直交交換により得られる変換係数を量子化部１０５に供給する。

量子化部１０５は、直交変換部１０４から供給される変換係数を量子化する。量子化部１０５は、レート制御部１１７から供給される符号量の目標値（符号量目標値）に基づいて量子化パラメータQPを設定し、変換係数の量子化を行う。なお、この量子化の方法は任意である。量子化部１０５は、量子化された変換係数を可逆符号化部１０６に供給する。

可逆符号化部１０６は、量子化部１０５において量子化された変換係数を所定の可逆符号化方式で符号化する。変換係数は、レート制御部１１７の制御の下で量子化されているので、可逆符号化部１０６の可逆符号化により得られる符号化データの符号量は、レート制御部１１７が設定した符号量目標値となる（又は符号量目標値に近似する）。

また、可逆符号化部１０６は、符号化装置１１での予測符号化に関する符号化情報のうちの、必要な符号化情報を、各ブロックから取得する。

ここで、符号化情報としては、例えば、イントラ予測やインター予測の予測モード、動きベクトル等の動き情報、符号量目標値、量子化パラメータQP、ピクチャタイプ(I,P,B)、CU(Coding Unit)やCTU(Coding Tree Unit)の情報等がある。

例えば、予測モードは、イントラ予測部１１４や動き予測補償部１１５から取得することができる。また、例えば、動き情報は、動き予測補償部１１５から取得することができる。

可逆符号化部１０６は、符号化情報を取得する他、クラス分類適応フィルタ１１１から、そのクラス分類適応フィルタ１１１でのクラス分類適応処理に関するフィルタ情報を取得する。図９では、フィルタ情報には、クラスごとのタップ係数が必要に応じて含まれる。

可逆符号化部１０６は、符号化情報及びフィルタ情報を、任意の可逆符号化方式で符号化し、符号化データのヘッダ情報の一部とする（多重化する）。

可逆符号化部１０６は、符号化データを、蓄積バッファ１０７を介して伝送する。したがって、可逆符号化部１０６は、符号化データ、ひいては、符号化データに含まれる符号化情報やフィルタ情報を伝送する伝送部として機能する。

可逆符号化部１０６の可逆符号化方式としては、例えば、可変長符号化又は算術符号化等を採用することができる。可変長符号化としては、例えば、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）等がある。算術符号化としては、例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）等がある。

蓄積バッファ１０７は、可逆符号化部１０６から供給される符号化データを、一時的に蓄積する。蓄積バッファ１０７に蓄積された符号化データは、所定のタイミングで読み出されて伝送される。

量子化部１０５において量子化された変換係数は、可逆符号化部１０６に供給される他、逆量子化部１０８にも供給される。逆量子化部１０８は、量子化された変換係数を、量子化部１０５による量子化に対応する方法で逆量子化する。この逆量子化の方法は、量子化部１０５による量子化処理に対応する方法であればどのような方法であってもよい。逆量子化部１０８は、逆量子化により得られる変換係数を、逆直交変換部１０９に供給する。

逆直交変換部１０９は、逆量子化部１０８から供給される変換係数を、直交変換部１０４による直交変換処理に対応する方法で逆直交変換する。この逆直交変換の方法は、直交変換部１０４による直交変換処理に対応する方法であればどのようなものであってもよい。逆直交変換された出力（復元された残差）は、演算部１１０に供給される。

演算部１１０は、逆直交変換部１０９から供給される逆直交変換結果、すなわち、復元された残差に、予測画像選択部１１６を介してイントラ予測部１１４又は動き予測補償部１１５から供給される予測画像を加算し、その加算結果を、復号途中の復号途中画像として出力する。

演算部１１０が出力する復号途中画像は、クラス分類適応フィルタ１１１又はフレームメモリ１１２に供給される。

クラス分類適応フィルタ１１１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF処理を行う。

クラス分類適応フィルタ１１１には、演算部１１０から復号途中画像が供給される他、並べ替えバッファ１０２から、復号途中画像に対応する元画像が供給されるとともに、符号化装置１１の各ブロックから必要な符号化情報が供給される。

クラス分類適応フィルタ１１１は、演算部１１０からの復号途中画像に相当する生徒画像と、並べ替えバッファ１０２からの元画像に相当する教師画像とを用いるとともに、必要に応じて、符号化情報を用いて、クラスごとのタップ係数を求める学習を行う。

すなわち、クラス分類適応フィルタ１１１は、例えば、演算部１１０からの復号途中画像そのものを生徒画像とするとともに、並べ替えバッファ１０２からの元画像そのものを教師画像として、必要に応じて、符号化情報を用いて、クラスごとのタップ係数を求める学習を行う。クラスごとのタップ係数は、フィルタ情報として、クラス分類適応フィルタ１１１から可逆符号化部１０６に供給される。

さらに、クラス分類適応フィルタ１１１は、演算部１１０からの復号途中画像を第１の画像として、クラスごとのタップ係数を用いたクラス分類適応処理（による画像変換）を、符号化情報を必要に応じて用いて行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）出力する。

クラス分類適応フィルタ１１１が出力するフィルタ後画像は、フレームメモリ１１２に供給される。

ここで、クラス分類適応フィルタ１１１では、上述のように、復号途中画像を生徒画像とするとともに、元画像を教師画像として、学習が行われ、その学習により得られるタップ係数を用いて、復号途中画像をフィルタ後画像に変換するクラス分類適応処理が行われる。したがって、クラス分類適応フィルタ１１１で得られるフィルタ後画像は、極めて元画像に近い画像になる。

フレームメモリ１１２は、演算部１１０から供給される復号途中画像、又は、クラス分類適応フィルタ１１１から供給されるフィルタ後画像を、局所復号された復号画像として一時記憶する。フレームメモリ１１２に記憶された復号画像は、必要なタイミングで、予測画像の生成に用いられる参照画像として、選択部１１３に供給される。

選択部１１３は、フレームメモリ１１２から供給される参照画像の供給先を選択する。例えば、イントラ予測部１１４においてイントラ予測が行われる場合、選択部１１３は、フレームメモリ１１２から供給される参照画像を、イントラ予測部１１４に供給する。また、例えば、動き予測補償部１１５においてインター予測が行われる場合、選択部１１３は、フレームメモリ１１２から供給される参照画像を、動き予測補償部１１５に供給する。

イントラ予測部１１４は、並べ替えバッファ１０２から供給される元画像と、選択部１１３を介してフレームメモリ１１２から供給される参照画像とを用いて、基本的に、PU(Prediction Unit)を処理単位として、イントラ予測（画面内予測）を行う。イントラ予測部１１４は、所定のコスト関数（例えば、RD(Rate-Distortion)コスト）に基づいて、最適なイントラ予測モードを選択し、その最適なイントラ予測モードで生成された予測画像を、予測画像選択部１１６に供給する。また、上述したように、イントラ予測部１１４は、コスト関数に基づいて選択されたイントラ予測モードを示す予測モードを、可逆符号化部１０６等に適宜供給する。

動き予測補償部１１５は、並べ替えバッファ１０２から供給される元画像と、選択部１１３を介してフレームメモリ１１２から供給される参照画像とを用いて、基本的にPUを処理単位として、動き予測（インター予測）を行う。さらに、動き予測補償部１１５は、動き予測により検出される動きベクトルに応じて動き補償を行い、予測画像を生成する。動き予測補償部１１５は、あらかじめ用意された複数のインター予測モードで、インター予測を行い、予測画像を生成する。

動き予測補償部１１５は、複数のインター予測モードそれぞれについて得られた予測画像の所定のコスト関数に基づいて、最適なインター予測モードを選択する。さらに、動き予測補償部１１５は、最適なインター予測モードで生成された予測画像を、予測画像選択部１１６に供給する。

また、動き予測補償部１１５は、コスト関数に基づいて選択されたインター予測モードを示す予測モードや、そのインター予測モードで符号化された符号化データを復号する際に必要な動きベクトル等の動き情報等を、可逆符号化部１０６に供給する。

予測画像選択部１１６は、演算部１０３及び１１０に供給する予測画像の供給元（イントラ予測部１１４又は動き予測補償部１１５）を選択し、その選択した方の供給元から供給される予測画像を、演算部１０３及び１１０に供給する。

レート制御部１１７は、蓄積バッファ１０７に蓄積された符号化データの符号量に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。すなわち、レート制御部１１７は、蓄積バッファ１０７のオーバーフロー及びアンダーフローが生じないように、符号化データの目標符号量を設定し、量子化部１０５に供給する。

＜クラス分類適応フィルタ１１１の構成例＞

図１０は、図９のクラス分類適応フィルタ１１１の構成例を示すブロック図である。

図１０において、クラス分類適応フィルタ１１１は、学習装置１３１、フィルタ情報生成部１３２、及び、画像変換装置１３３を有する。

学習装置１３１には、並べ替えバッファ１０２（図９）から元画像が供給されるとともに、演算部１１０（図９）から復号途中画像が供給される。さらに、学習装置１３１には、符号化情報が供給される。

学習装置１３１は、復号途中画像を生徒データとするとともに、元画像を教師データとして、クラスごとのタップ係数を求める学習（以下、タップ係数学習ともいう）を行う。

さらに、学習装置１３１は、タップ係数学習により得られるクラスごとのタップ係数、及び、そのクラスごとのタップ係数を得るのに用いたクラスタップのタップ構造を表すタップ構造情報を、フィルタ情報生成部１３２に供給する。

なお、学習装置１３１は、タップ係数学習において、クラス分類を、必要に応じて、符号化情報を用いて行うことができる。

フィルタ情報生成部１３２は、学習装置１３１からのクラスごとのタップ係数及びタップ構造情報を必要に応じて含むフィルタ情報を生成し、画像変換装置１３３及び可逆符号化部１０６（図９）に供給する。

画像変換装置１３３には、フィルタ情報生成部１３２からフィルタ情報が供給される他、演算部１１０（図９）から復号途中画像が供給されるとともに、符号化情報が供給される。

画像変換装置１３３は、例えば、復号途中画像を第１の画像として、フィルタ情報生成部１３２からのフィルタ情報に含まれるクラスごとのタップ係数を用いたクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、フレームメモリ１１２（図９）に供給する。

なお、画像変換装置１３３は、クラス分類適応処理において、クラス分類を、必要に応じて、符号化情報を用いて行うことができる。

ここで、一般のALFでは、クラスタップのエッジ強度と方向差分を用いたクラス分類が行われるが、クラスタップのタップ構造は、固定されており、更新される（切り替えられる）ことはない。

クラスタップのタップ構造が固定である場合には、復号途中画像の空間解像度や時間解像度の違い、その他の復号途中画像の（局所の）特徴の違いによって、復号途中画像を適切に分類することが難しいことがある。この場合、復号途中画像に、その復号途中画像のクラスに対応するフィルタ処理を行っても、そのフィルタ処理により得られるフィルタ後画像について、画質改善効果を十分に得ることが困難である。

そこで、図１の画像処理システムでは、復号途中画像の特徴の違いによって、復号途中画像を適切にクラス分類し、復号途中画像のクラスに対応するフィルタ処理として、復号途中画像の特徴に適切なフィルタ処理を施し、そのフィルタ処理により得られるフィルタ後画像のS/Nを大きく改善するために、復号途中画像の所定のピクチャシーケンスごとに、クラスタップのタップ構造を適応的に更新し（切り替え）、復号途中画像を、その復号途中画像の特徴に適したクラスにクラス分類する。

さらに、図１の画像処理システムでは、例えば、更新後のタップ構造のクラスタップを用いたタップ係数学習により得られるクラスごとのタップ係数を用いたフィルタ処理を、復号途中画像に行うことで、復号途中画像の特徴に適切なフィルタ処理を施し、そのフィルタ処理により得られるフィルタ後画像のS/Nを大きく改善する。

すなわち、復号途中画像のクラス分類を行い、復号途中画像に、その復号途中画像のクラスに対応するフィルタ処理を行って、フィルタ後画像を得る場合には、クラス分類において、特徴が類似（同一を含む）する復号途中画像が、同一のクラスに分類され、特徴が類似しない復号途中画像が、異なるクラスに分類されることにより、フィルタ後画像の画質改善効果を大にすることができる。

画像の特徴（エッジやテクスチャ等）には、様々な特徴があり、そのような様々な特徴を有し得る復号途中画像のクラス分類を、固定のタップ構造のクラスタップを用いて行うのでは、復号途中画像が、適切なクラスに分類されないことがある。すなわち、クラス分類において、復号途中画像が、特徴がそれほど類似しない他の復号途中画像が分類されたクラスと同一クラスに分類されることがある。

このように、特徴がそれほど類似しない複数の復号途中画像が同一クラスに分類される場合、そのクラスに対応するフィルタ処理により得られるフィルタ後画像の画質改善効果は、特徴が類似する複数の復号途中画像が同一クラスに分類される場合よりも小になる。

図１の画像処理システムでは、クラスタップのタップ構造を適応的に更新することで、クラス分類において、特徴がそれほど類似しない複数の復号途中画像が同一クラスに分類されることを抑制し、復号途中画像を、その復号途中画像の特徴に適したクラスに分類する。

したがって、図１の画像処理システムでは、クラス分類を、固定のタップ構造のクラスタップを用いて行う場合に比較して、フィルタ後画像の画質改善効果を大にすること、すなわち、フィルタ後画像のS/Nを大きく改善することができる。

さらに、図１の画像処理システムでは、クラスタップのタップ構造が適応的に更新されることで、固定のタップ構造のクラスタップを用いたクラス分類と同一のクラス数（クラス分類によって分類し得るクラスの数）のクラス分類を行う場合であっても、フィルタ後画像のS/Nを大きく改善することができる。この場合、フィルタ後画像を参照画像として求められる残差が小さくなるので、圧縮効率を向上させることができる。

なお、クラス分類によって分類し得るクラスとして、多数のクラスを用意することにより、復号途中画像を、その復号途中画像の特徴に応じた適切なクラスに分類することができる。

しかしながら、多数のクラスに分類し得るクラス分類を採用する場合には、クラスごとのタップ係数のデータ量が増加し、クラスごとのタップ係数等を、符号化装置１１から復号装置１２に伝送する場合には、オーバーヘッドが増加して、圧縮効率が悪化する。

したがって、実用性の観点からは、クラス数（クラス分類によって分類し得るクラスの数）は、多数でないことが望ましい。

図１の画像処理システムでは、クラスタップのタップ構造を適応的に更新することで、クラス数がそれほど多くないクラス分類を採用しても、復号途中画像を、その復号途中画像の特徴に応じた適切なクラスに分類し、フィルタ処理により得られるフィルタ後画像のS/Nを大きく改善するとともに、圧縮効率の悪化を抑制することができる。

ここで、クラスタップのタップ構造を適応的に更新し、更新後のタップ構造のクラスタップを用いたタップ係数学習により得られるクラスごとのタップ係数等を、符号化装置１１から復号装置１２に伝送する場合には、その伝送の頻度が多いと、オーバーヘッドが増加して、圧縮効率が悪化する。

ところで、復号途中画像（ひいては、元画像）の時間方向の相関が高い場合には、クラスタップのタップ構造として、直前のタップ構造の更新時と同一のタップ構造を用いたクラス分類を行い、直前のタップ構造の更新時と同一のクラスごとのタップ係数を用いたフィルタ処理を行っても、フィルタ後画像のS/Nを維持することができる。

さらに、クラスタップのタップ構造として、直前のタップ構造の更新時と同一のタップ構造を用いたクラス分類を行い、直前のタップ構造の更新時と同一のクラスごとのタップ係数を用いたフィルタ処理を行う場合には、復号装置１２では、直前まで用いていたクラスごとのタップ係数を継続して用いることができる。したがって、新たなクラスごとのタップ係数等を、符号化装置１１から復号装置１２に伝送する必要がなく、圧縮効率を向上させることができる。

一方、復号途中画像の時間方向の相関が低い場合、すなわち、例えば、復号途中画像のシーケンスに、複雑な動きのシーンや、シーンチェンジが含まれる場合には、シーンチェンジ等によってシーンが大きく変化した復号途中画像について、クラスタップのタップ構造として、直前のタップ構造の更新時と同一のタップ構造を用いたクラス分類を行い、直前のタップ構造の更新時と同一のクラスごとのタップ係数を用いたフィルタ処理を行うと、フィルタ後画像の画質改善効果が小さくなり、その小さくなる分だけ、圧縮効率が悪化する。

そこで、図１の画像処理システムでは、時間方向の相関が低い復号途中画像を（直接的又は間接的に）検出し、その復号途中画像（以降）については、クラスタップのタップ構造を更新し、更新後のタップ構造のクラスタップを用いたタップ係数学習により求められたクラスごとのタップ係数を用いたフィルタ処理を行うことで、圧縮効率の悪化を抑制することができる。

但し、時間方向の相関が低い復号途中画像を検出し、クラスタップのタップ構造の更新、及び、そのタップ構造のクラスタップを用いたタップ係数学習により求められたクラスごとのタップ係数を用いたフィルタ処理を行う場合には、時間方向の相関が低いシーンが続く復号途中画像のシーケンスについては、クラスタップのタップ構造の更新等が頻繁に行われ、更新後のタップ構造のクラスタップを用いたタップ係数学習により得られるクラスごとのタップ係数等の（符号化装置１１から復号装置１２への）伝送が頻繁に行われることがあり得る。クラスごとのタップ係数等の伝送が頻繁に行われる場合、圧縮効率が悪化する。

そこで、図１の画像処理システムでは、平均的な画質改善効果を見込むことができるクラスタップのタップ構造（以下、平均構造ともいう）と、そのようなタップ構造のクラスタップを用いたタップ係数学習により得られるクラスごとのタップ係数（以下、平均タップ係数ともいう）とを用意しておくことができる。

時間方向の相関が低いシーンが続く復号途中画像のシーケンスについては、平均構造のクラスタップを用いたクラス分類と、平均タップ係数を用いたフィルタ処理を適用することで、クラスごとのタップ係数等の伝送が頻繁に行われることによる圧縮効率の悪化を抑制することができる。

以上のように、フィルタ後画像のS/Nを大きく改善し、また、圧縮効率の悪化を抑制するため、図１０のクラス分類適応フィルタ１１１では、学習装置１３１が、クラスタップのタップ構造として、複数のタップ構造を採用し、複数のタップ構造それぞれについて、タップ係数学習を行って、クラスごとのタップ係数を求める。

さらに、学習装置１３１は、複数のタップ構造それぞれについて、そのタップ構造のクラスタップをクラス分類に用いる適切さを表すタップ構造評価値を求め、複数のタップ構造の中で、タップ構造評価値が最良のタップ構造を、最適タップ構造に選択する。

そして、学習装置１３１は、最適タップ構造を表すタップ構造情報と、最適タップ構造についてのクラスごとのタップ係数（最適タップ構造のクラスタップを用いたタップ係数学習により求められたクラスごとのタップ係数）とを、フィルタ情報生成部１３２に供給する。

ここで、複数のタップ構造それぞれのタップ構造評価値としては、例えば、そのタップ構造についてのクラスごとのタップ係数を用いたフィルタ処理（ここでは、例えば、クラス分類適応処理）を、生徒データとしての復号途中結果画像を対象として行うことにより得られる、教師データとしての元画像に相当する相当画像のS/N等を採用することができる。

また、複数のタップ構造それぞれのタップ構造評価値としては、例えば、そのタップ構造についてのクラスごとのタップ係数を用いたフィルタ処理を採用して、教師データとしての元画像の符号化を行った場合のRDコスト等を採用することができる。

フィルタ情報生成部１３２は、学習装置１３１からのクラスごとのタップ係数及びタップ構造情報を必要に応じて含むフィルタ情報を生成する。

フィルタ情報には、クラスごとのタップ係数及びタップ構造情報に代えて、又は、クラスごとのタップ係数及びタップ構造情報とともに、クラスタップのタップ構造及びクラスごとのタップ係数として、直前のタップ構造及びタップ係数の更新時と同一のタップ構造及びクラスごとのタップ係数を用いるかどうかを表すコピー情報としてのフラグ等を含ませることができる。

フィルタ情報に、クラスごとのタップ係数及びタップ構造情報を含ませずに、コピー情報を含ませることにより、クラスごとのタップ係数及びタップ構造情報を含ませる場合に比較して、フィルタ情報のデータ量を大きく低減し、圧縮効率を向上させることができる。

フィルタ情報生成部１３２において、クラスタップのタップ構造及びクラスごとのタップ係数として、直前のタップ構造及びタップ係数の更新時と同一のタップ構造及びクラスごとのタップ係数を用いることを表すコピー情報は、例えば、学習装置１３１から供給された最新のタップ構造情報が、学習装置１３１から供給された前回のタップ構造情報と一致している場合や、今回のタップ係数学習に用いられた元画像のシーケンスと、前回のタップ係数学習に用いられた元画像のシーケンスとの時間方向の相関が高い場合等に、フィルタ情報に含ませることができる。

クラスタップのタップ構造（及びタップ係数）の更新を行うタップ構造更新単位としては、例えば、複数のフレーム（ピクチャ）、１フレーム、CUその他のブロック等の、任意のピクチャシーケンスを採用し、そのタップ構造更新単位を最小単位とするタイミングで、クラスタップのタップ構造を更新することができる。

例えば、本技術を、HEVC（又はHEVCに準ずる符号化方式）に適用する場合、タップ構造更新単位として、複数のフレームを採用するときには、フィルタ情報は、例えば、Sequence parameter set syntaxとして、符号化データに含ませることができる。

また、タップ構造更新単位として、１フレームを採用するときには、フィルタ情報は、例えば、Picture parameter set syntaxとして、符号化データに含ませることができる。

さらに、タップ構造更新単位として、CU等のブロックを採用する場合には、フィルタ情報は、例えば、Slice data syntaxとして、符号化データに含ませることができる。

また、フィルタ情報は、Sequence parameter set syntax，Picture parameter set syntax、及び、Slice data syntaxの任意の複数階層に含ませることができる。

この場合、あるブロックに対しては、複数階層に含まれるフィルタ情報の中で、より粒度の細かい階層のフィルタ情報を優先して適用することができる。例えば、あるブロックに対するSequence parameter set syntax、及び、Slice data syntaxの両方に、フィルタ情報が含まれるときには、そのブロックに対しては、Slice data syntaxに含まれるフィルタ情報を優先的に適用することができる。

クラスタップのタップ構造は、例えば、クラスタップとなる画素それぞれの、注目画素に対する位置関係（空間的な位置関係と、時間的な位置関係との両方を含む）で表すことができる。

したがって、クラスタップとなる画素の数が異なる場合や、クラスタップとなる画素が形作る形状（以下、クラスタップ形状ともいう）が異なる場合、タップ構造は、異なる。

さらに、クラスタップとなる画素の数が同一で、クラスタップ形状が同一（合同）であっても、注目画素に対するクラスタップ形状の位置が異なる場合、タップ構造は、異なる。注目画素に対するクラスタップ形状の位置が異なるクラスタップとは、例えば、クラスタップ形状が注目画素の位置を中心とするクラスタップと、クラスタップ形状が注目画素からずれた位置を中心とするクラスタップとを意味する。

また、クラスタップとなる画素の数が同一であっても、クラスタップとなる画素の疎密が異なり、そのため、クラスタップ形状が相似になっている場合、タップ構造は、異なる。クラスタップ形状が相似である場合、クラスタップとなる画素すべての、注目画素に対する位置関係が一致しないからである。

クラスタップのタップ構造を表すタップ構造情報としては、そのタップ構造のクラスタップとなる画素それぞれの、注目画素に対する位置情報を採用することができる。

タップ構造情報として、クラスタップとなる画素の位置情報を採用する場合には、タップ構造情報のデータ量は大になるが、クラスタップのタップ構造を柔軟に制御することができる。

また、タップ構造情報としては、例えば、複数のタップ構造それぞれに割り当てられたユニークなID(Identification)を採用することができる。この場合、複数のタップ構造をあらかじめ決定し、その複数のタップ構造それぞれに対して、IDを割り当てるとともに、各タップ構造と、そのタップ構造に割り当てられたIDとを、事前知識として、符号化装置１１及び復号装置１２で共有することが前提となる。

タップ構造情報として、タップ構造に割り当てられたユニークなIDを採用する場合には、クラスタップのタップ構造の柔軟性は低下するが、タップ構造情報のデータ量を小にすることができる。

さらに、タップ構造情報としては、例えば、複数のクラスタップ形状それぞれに割り当てられたユニークなID（以下、形状IDともいう）、クラスタップとなる画素の数、及び、クラスタップ形状の中心等の所定の点の、注目画素に対する位置情報のセットを採用することができる。この場合、複数のクラスタップ形状をあらかじめ決定し、その複数のクラスタップ形状それぞれに対して、形状IDを割り当てるとともに、各クラスタップ形状と、そのクラスタップ形状に割り当てられた形状IDとを、事前知識として、符号化装置１１及び復号装置１２で共有することが前提となる。

タップ構造情報として、形状ID、クラスタップとなる画素の数、及び、クラスタップ形状の中心等の所定の点の位置情報のセットを採用する場合には、クラスタップのタップ構造の柔軟性をある程度確保するとともに、タップ構造情報のデータ量をある程度小にすることができる。

＜学習装置１３１の構成例＞

図１１は、図１０の学習装置１３１の構成例を示すブロック図である。

図１１において、学習装置１３１は、タップ構造選択部１５１、学習部１５２、記憶部１５３、評価値算出部１５４、及び、選択部１５５を有する。

タップ構造選択部１５１は、例えば、あらかじめ決められた複数のタップ構造の候補（の情報）を記憶しており、その複数のタップ構造の候補を、順次、注目タップ構造として選択する。そして、タップ構造選択部１５１は、注目タップ構造を表すタップ構造情報を、学習部１５２（のタップ選択部１６２）、及び、記憶部１５３に供給する。

学習部１５２は、タップ選択部１６１及び１６２、クラス分類部１６３、足し込み部１６４、並びに、係数算出部１６５を有する。

タップ選択部１６１ないし係数算出部１６５は、図４の学習部３３を構成するタップ選択部４１ないし係数算出部４５とそれぞれ同様の処理を行う。

学習部１５２には、生徒データとしての復号途中画像、教師データとしての元画像、及び、符号化情報が供給される。そして、学習部１５２では、生徒データとしての復号途中画像、及び、教師データとしての元画像を用いるとともに、符号化情報を必要に応じて用いて、図４の学習部３３と同様のタップ係数学習が行われ、クラスごとのタップ係数が求められる。

但し、学習部１５２において、タップ選択部１６２には、タップ構造選択部１５１から、タップ構造情報が供給される。

タップ選択部１６２は、図４のタップ選択部４２と同様に、注目画素について、復号途中画像の画素から、クラスタップとなる画素を選択することにより、その画素によってクラスタップを構成するが、その際、タップ構造選択部１５１からのタップ構造情報に従い、そのタップ構造情報が表すタップ構造のクラスタップを構成する。

そして、クラス分類部１６３は、タップ選択部１６２で構成されたクラスタップを用いて、注目画素のクラス分類を行う。

なお、クラス分類部１６３では、注目画素のクラス分類を、注目画素のクラスタップを用いるとともに、注目画素の符号化情報を用いて行うことができる。

クラス分類に用いる注目画素の符号化情報としては、例えば、注目画素を含むCUやPU等のブロック内における注目画素の位置を表すブロック位相や、注目画素を含むピクチャのピクチャタイプ、注目画素を含むPUの量子化パラメータQP等を採用することができる。

クラス分類に用いる注目画素の符号化情報として、ブロック位相を採用する場合には、例えば、注目画素がブロックの境界の画素であるか否かによって、注目画素をクラス分類することができる。

また、クラス分類に用いる注目画素の符号化情報として、ピクチャタイプを採用する場合には、例えば、注目画素を含むピクチャが、Iピクチャ、Pピクチャ、及び、Bピクチャのうちのいずれであるかによって、注目画素をクラス分類することができる。

さらに、クラス分類に用いる注目画素の符号化情報として、量子化パラメータQPを採用する場合には、例えば、量子化の粗さ（細かさ）によって、注目画素をクラス分類することができる。

注目画素のクラスタップ、及び、符号化情報を用いたクラス分類では、注目画素を、クラスタップを用いて、第１のサブクラスに分類するとともに、符号化情報を用いて、第２のサブクラスに分類し、その第１のサブクラスと第２のサブクラスとから、注目画素の（最終的な）クラスを求めることができる。例えば、第１のサブクラスを表すビット列と、第２のサブクラスを表すビット列とを、１つのビット列に並べた値を、注目画素のクラス（を表すクラスコード）として求めることができる。

学習部１５２では、タップ構造選択部１５１に記憶された複数のタップ構造（の候補）それぞれについて、タップ係数学習が行われ、クラスごとのタップ係数が求められる。

そして、学習部１５２が、複数のタップ構造それぞれについて、タップ係数学習を行うことにより得られるクラスごとのタップ係数は、記憶部１５３に供給される。

記憶部１５３は、タップ構造選択部１５１から供給される、注目タップ構造を表すタップ構造情報と、学習部１５２から供給される注目タップ構造についてのクラスごとのタップ係数とを対応付けて記憶する。

評価値算出部１５４は、タップ構造選択部１５１に記憶された複数のタップ構造（の候補）それぞれについて、そのタップ構造のクラスタップをクラス分類に用いる適切さを表すタップ構造評価値を求め、選択部１５５に供給する。

評価値算出部１５４には、学習部１５２に供給されるのと同様の生徒データとしての復号途中画像、教師データとしての元画像、及び、符号化情報が供給される。

評価値算出部１５４は、画像変換部１７１及び算出部１７２を有する。

画像変換部１７１は、評価値算出部１５４に供給される復号途中画像を第１の画像として、クラス分類適応処理を行うことにより、第１の画像としての復号途中画像を、第２の画像としての元画像に相当する相当画像に変換し、算出部１７２に供給する。

すなわち、画像変換部１７１は、記憶部１５３に記憶された複数のタップ構造情報（タップ構造選択部１５１に記憶されている複数のタップ構造それぞれについてのタップ構造情報）それぞれについて、そのタップ構造情報と、そのタップ構造情報に対応付けられているクラスごとのタップ係数とを用いて、クラス分類適応処理を行う。

具体的には、画像変換部１７１は、記憶部１５３に記憶されている複数のタップ構造情報それぞれについて、そのタップ構造情報が表すタップ構造のクラスタップを構成し、そのタップ構造情報に対応付けられているクラスごとのタップ係数を用いたフィルタ処理（ここでは、例えば、式（１）の予測演算）を施すクラス分類適応処理を行う。

そして、画像変換部１７１は、複数のタップ構造情報それぞれについて得られる相当画像を、算出部１７２に供給する。

算出部１７２は、画像変換部１７１からの、複数のタップ構造情報それぞれについて得られた相当画像と、教師データとしての元画像とを用いて、例えば、相当画像のS/Nに対応する値を、タップ構造評価値として求め、選択部１５５に供給する。

選択部１５５は、記憶部１５３に記憶されたタップ構造情報の中から、評価値算出部１５４（の算出部１７２）から供給されるタップ構造評価値が最良のタップ構造情報を、最適タップ構造を表すタップ構造情報として選択する。さらに、選択部１５５は、記憶部１５３に記憶されたクラスごとのタップ係数の中から、最適タップ構造を表すタップ構造情報に対応付けられたクラスごとのタップ係数（以下、最適タップ構造についてのクラスごとのタップ係数ともいう）を選択する。

そして、選択部１５５は、最適タップ構造を表すタップ構造情報と、最適タップ構造についてのクラスごとのタップ係数とを、フィルタ情報生成部１３２（図１０）に供給する。

なお、学習装置１３１において、最適タップ構造を表すタップ構造情報と、その最適タップ構造についてのクラスごとのタップ係数とを求める処理は、例えば、図１０で説明したタップ構造更新単位と同様の単位（タイミング）で行うことができる。

＜複数のタップ構造の例＞

図１２は、クラスタップのタップ構造としてのクラスタップ形状の例を示す図である。

クラスタップとなる画素が形作るクラスタップ形状としては、例えば、図１２に示すような、クロス型や、Ｘ型、水平１ライン型、垂直１ライン型、斜め１ライン型、菱形、正方形、縦長の長方形、横長の長方形等がある。

本件発明者が行ったシミュレーションによれば、水平方向に１ライン状に並ぶ画素と垂直方向に１ライン状に並ぶ画素とがクロスしたクロス型のタップ構造のクラスタップを用いたタップ係数学習により求められたクラスごとのタップ係数を用いたクラス分類適応処理では、そのクラス分類適応処理により得られる第２の画像において、水平方向のエッジや、垂直方向のエッジが、精度良く再現されることが確認された。

さらに、シミュレーションによれば、右斜め上方向に１ライン状に並ぶ画素と左斜め上方向に１ライン状に並ぶ画素とがクロスしたＸ型のタップ構造のクラスタップを用いたタップ係数学習により求められたクラスごとのタップ係数を用いたクラス分類適応処理では、斜め方向に多数のエッジを有する画像について、クラス分類適応処理により得られる第２の画像のPSNR(Peak signal-to-noise ratio)が、クロス型のタップ構造のクラスタップを用いたタップ係数学習により求められたクラスごとのタップ係数を用いたクラス分類適応処理よりも改善することが確認された。

したがって、画像の特徴（ここでは、エッジの方向）に応じて、クラスタップのタップ構造を変えることにより、クラス分類適応処理により得られる第２の画像のPSNRが改善されることが確認された。

図１２のクラスタップ形状は、１フレームの画素によって形作られるが、クラスタップは、１フレームの画素から構成する他、複数フレームの画素から構成することができる。

図１３は、複数フレームの画素から構成されるクラスタップのタップ構造の例を示す図である。

図１３では、注目画素の空間方向にある画素の他、注目画素の時間方向にある画素をも用いて、クラスタップが構成されている。すなわち、図１３では、注目画素のフレームtの画素の他、フレームtの１フレーム前のフレームt-1の画素と、1フレーム後のフレームt+1の画素とを用いて、クラスタップが構成されている。

例えば、フレームt-1及びt+1については、注目画素の位置と同一位置の画素と、その画素の周辺の画素とを、クラスタップとなる画素として選択することができる。

また、例えば、フレームt-1及びt+1については、注目画素の位置から、動きベクトルだけ移動した、注目画素と同一被写体が映る画素と、その画素の周辺の画素とを、クラスタップとなる画素として選択することができる。

以上のように、注目画素の空間方向にある画素の他、注目画素の時間方向にある画素をも用いて、クラスタップを構成する場合には、クラス分類適応処理によって得られる第２の画像での、動きぼけ等の動きに起因する画質の劣化を改善することができる。

なお、クラスタップを用いたクラス分類では、クラスタップを構成する画素から得られる注目画素の画像特徴量（局所的な画像特徴量）に応じて、注目画素が分類される。

画像特徴量としては、図２等で説明したADRCコードや、後述するDiffMax等を採用することができる。

但し、クラス分類に用いる画像特徴量として、ADRCコードを採用する場合には、ADRCコードは、その性質上、クラスタップを構成する画素の数に対して、指数的に、クラス数が増加する。

したがって、クラス分類に用いる画像特徴量として、ADRCコードを採用する場合には、圧縮効率の観点から、クラスタップのタップ構造としては、画素の数が少ないタップ構造を採用することが望ましい。

図１３では、フレームt-1ないしt+1それぞれから、クロス型のクラスタップ形状を形作る画素が選択されることにより構成されるクラスタップCT1と、フレームt-1ないしt+1それぞれから、正方形のクラスタップ形状を形作る画素が選択されることにより構成されるクラスタップCT2とが示されている。クラスタップCT1は、19画素で構成され、クラスタップCT2は、75画素で構成されている。

クラス分類に用いる画像特徴量として、ADRCコードを採用する場合には、圧縮効率の観点から、クラスタップCT1及びCT2のうちの、画素の数が少ないタップ構造のクラスタップCT1を採用することが望ましい。

また、クラス分類に用いる画像特徴量として、DiffMax等の、クラスタップを構成する画素の数がクラス数に影響しない画像特徴量を採用する場合には、画素の数が少ないタップ構造のクラスタップCT1を採用しても、画素の数が多いタップ構造のクラスタップCT2を採用しても、クラス数の変化に起因する圧縮効率の変化は生じない。

一方、注目画素の画像特徴量は、クラスタップを構成する画素の数が多い方が、的確に求められることが多い。したがって、クラス分類に用いる画像特徴量として、DiffMax等の、クラスタップを構成する画素の数がクラス数に影響しない画像特徴量を採用する場合には、画素の数が多いタップ構造のクラスタップCT2を採用することにより、注目画素の画像特徴量を的確に求めることができる。

ここで、図１３に示したように、注目画素の時間方向にある画素を用いて構成されるクラスタップのクラスタップ形状を、以下、時間方向型ともいう。

図１４は、クラスタップのタップ構造のバリエーションの例を示す図である。

図１２及び図１３に示したクロス型や、Ｘ型、水平１ライン型、垂直１ライン型、斜め１ライン型、菱形、正方形、縦長の長方形、横長の長方形、時間方向型の（クラスタップ形状の）クラスタップのバリエーションとしては、例えば、図１４に示すように、クラスタップを構成する画素が密になっているクラスタップや、クラスタップを構成する画素が疎になっているクラスタップがある。

画素が密になっているクラスタップとは、例えば、隣接する画素がクラスタップを構成する画素になっているクラスタップであり、画素が疎になっているクラスタップとは、例えば、１個おきや複数おきの画素がクラスタップを構成する画素になっているクラスタップである。

なお、以下では、説明を簡単にするため、クラスタップは、注目画素の空間方向に位置する画素から構成することとし、時間方向に位置する画素は、考慮しないこととする。

図１５は、タップ構造選択部１５１（図１１）に記憶させるクラスタップの複数のタップ構造（の候補）の決定方法の例を説明する図である。

クラスタップの複数のタップ構造の決定方法としては、例えば、クラスタップ形状を予測タップ形状と同じ範囲にする方法と、クラスタップ形状を予測タップ形状と同じ範囲にしない方法とがある。

ここで、予測タップ形状とは、予測タップを構成する画素が形作る形状を意味する。

クラスタップ形状を予測タップ形状と同じ範囲にする方法としては、例えば、クラスタップ形状を、予測タップ形状と一致させる（クラスタップ形状を予測タップ形状と合同の形状とする）方法と、クラスタップ形状の水平方向及び垂直方向の最大範囲を、予測タップ形状の水平方向及び垂直方向の最大範囲にそれぞれ一致させる方法とがある。

クラスタップ形状の水平方向及び垂直方向の最大範囲を、予測タップ形状の水平方向及び垂直方向の最大範囲にそれぞれ一致させる、とは、クラスタップ形状を囲む最小の長方形が、予測タップ形状を囲む最小の長方形に一致することを意味する。

クラスタップ形状の水平方向及び垂直方向の最大範囲を、予測タップ形状の水平方向及び垂直方向の最大範囲にそれぞれ一致させる場合には、クラスタップを構成する画素は、予測タップ形状を囲む最小の長方形内に分布する。但し、クラスタップ形状は、予測タップ形状に一致するとは限らない。

クラスタップ形状を予測タップ形状と同じ範囲にしない方法としては、例えば、クラスタップ形状と予測タップ形状とについて、水平方向及び垂直方向のうちの一方の方向だけの最大範囲を一致させる方法と、クラスタップ形状と予測タップ形状とについて、水平方向及び垂直方向のうちのいずれの方向の最大範囲も一致させない方法とがある。

クラスタップ形状と予測タップ形状とについて、水平方向及び垂直方向のうちの一方の方向だけの最大範囲を一致させる場合には、クラスタップを構成する画素と、予測タップを構成する画素との水平方向又は垂直方向に分布する範囲が一致するが、クラスタップ形状は、予測タップ形状に一致しない。

また、クラスタップ形状と予測タップ形状とについて、水平方向及び垂直方向のうちのいずれの方向の最大範囲も一致させない場合には、クラスタップ形状と予測タップ形状とが一致していないときは勿論、クラスタップ形状と予測タップ形状とが一致している（合同になっている）ときであっても、クラスタップを構成する画素が分布する範囲と、予測タップを構成する画素が分布する範囲とは、一致しない。但し、クラスタップを構成する画素が分布する範囲と、予測タップを構成する画素が分布する範囲とが、重複することはあり得る。

図１６は、図１１のクラス分類部１６３がクラス分類に用いるクラスタップの画像特徴量の例を示す図である。

クラス分類に用いるクラスタップの画像特徴量としては、例えば、ADRCコードや、DR、DiffMax、定常性、アクティビティ、二次微分和、最大方向差分、フィルタバンク出力等を採用することができる。

ADRCコードは、図２等で説明したようにして求めることができる。すなわち、例えば、1ビットADRCコードは、クラスタップを構成する画素の輝度等の画素値を、閾値によって２値に分割し、その２値の画素値を並べることにより求めることができる。

ADRCコードを用いたクラス分類によれば、クラスタップ（を構成する画素群）の波形パターン(エッジやテクスチャ（方向含む）)を網羅的に分類し．クラス分類適応処理において、クラスタップの波形パターンごとに、画像の最適な復元効果を得ることができる。

DRは、クラスタップを構成する画素の輝度等の画素値の最大値と最小値との差分である。DRを用いたクラス分類は、クラス分類適応処理において、DRが小である場合には、平坦部のノイズ等の低減に寄与し、DRが大である場合には、エッジの復元に寄与する。

DiffMaxは、クラスタップにおいて、水平、垂直、斜め方向に隣接する画素の画素値の差分絶対値の最大値である。DiffMaxを用いたクラス分類は、クラス分類適応処理において、DiffMaxが小である場合には、グラデーションの偽輪郭の低減に寄与し、DiffMaxが大である場合には、急峻なエッジ(段差)の復元に寄与する。

なお、DiffMax及びDRの組み合わせ、すなわち、例えば、DiffMax/DRや、DiffMaxとDRとの二軸表現(DiffMax, DR)は、DiffMaxだけ又はDRだけとは異なる画像特徴量として、クラスタップにおいて、DRの振幅を何画素かけて登り切るかの指標にすることができる。

定常性は、例えば、クラスタップにおいて、方向ごとの隣接する画素の画素値の差分絶対値和の最大となる方向と最小となる方向との差分絶対値和の差分を表す値によって表すことができる。定常性を用いたクラス分類は、クラス分類適応処理において、定常性が小である場合には、テクスチャ（やノイズのような細かい模様）の復元に寄与し、定常性が大である場合には、エッジ(構造線)の復元に寄与する。

アクティビティは、例えば、クラスタップにおいて、水平と垂直方向に隣接する画素の画素値の差分絶対値和で表すことができる。アクティビティを用いたクラス分類は、クラス分類適応処理において、アクティビティが小である場合には、ステップエッジ（単純なパターン）の復元に寄与し、アクティビティが大である場合には、テクスチャ（複雑なパターン）の復元に寄与する。

二次微分和は、例えば、クラスタップにおいて、水平と垂直方向に隣接する画素の画素値の二次微分の絶対値和である。二次微分和を用いたクラス分類は、二次微分和が小である場合には、ステップエッジの復元に寄与し、二次微分和が大である場合には、テクスチャの復元に寄与する。

最大方向差分は、例えば、クラスタップにおいて、水平、垂直、斜め方向に隣接する画素の画素値の差分絶対値和が最大となる方向を表す値である。最大方向差分を用いたクラス分類は、注目画素の周辺の振幅や、勾配、構造等の方向を分類し、これにより、クラス分類適応処理において、注目画素の周辺の振幅や、勾配、構造等の方向ごとに、画像の最適な復元効果を得ることができる。

フィルタバンク出力は、方向性を持つ複数のバンドパスフィルタ（画像の振幅や、勾配、構造等の方向を表す値を出力するバンドパスフィルタ）に対して、クラスタップを構成する画素の画素値を入力して得られる値である。フィルタバンク出力を用いたクラス分類は、計算コストが大きいが、最大方向差分を用いたクラス分類に比較して、分類精度が高い。

クラスタップのADRCコードを用いたクラス分類では、例えば、ADRCコード（が表す値）を、注目画素のクラス（を表すクラスコード）として採用することができる。

クラス分類に用いるクラスタップの画像特徴量としては、以上のような、ADRCコードや、DR、DiffMax、定常性、アクティビティ、二次微分和、最大方向差分、フィルタバンク出力の他、任意の画像特徴量を採用することができる。

クラスタップのDRや、DiffMax(DiffMax/DR)、定常性、アクティビティ、二次微分和、最大方向差分、フィルタバンク出力等の画像特徴量を用いたクラス分類では、例えば、その画像特徴量そのものの値の他、画像特徴量を、１以上の閾値と比較し、画像特徴量と閾値との大小関係を表す値を、注目画素のクラスとして採用することができる。

また、クラス分類は、クラスタップの１種類の画像特徴量を用いて行う他、クラスタップの複数種類の画像特徴量を用いて行うことができる。

図１７は、図１１の画像変換部１７１の構成例を示すブロック図である。

図１７において、画像変換部１７１は、タップ選択部１８１及び１８２、クラス分類部１８３、係数取得部１８４、並びに、予測演算部１８５を有する。

タップ選択部１８１ないし予測演算部１８５は、図２の画像変換装置２０のタップ選択部２１ないし予測演算部２５とそれぞれ同様の処理を行う。

画像変換部１７１には、学習部１５２（図１１）に供給されるのと同様の生徒データとしての復号途中画像、及び、符号化情報が供給される。画像変換部１７１では、生徒データとしての復号途中画像を用いるとともに、符号化情報を必要に応じて用いて、図２の画像変換装置２０と同様のクラス分類適応処理が行われ、教師データとしての元画像に相当する相当画像が求められる。

但し、画像変換部１７１において、タップ選択部１８２及び係数取得部１８４には、記憶部１５３（図１１）に記憶されたタップ構造情報、及び、そのタップ構造情報に対応付けられたクラスごとのタップ係数が、それぞれ供給される。

タップ選択部１８２は、図２のタップ選択部２２と同様に、注目画素について、復号途中画像の画素から、クラスタップとなる画素を選択することにより、その画素によってクラスタップを構成するが、その際、記憶部１５３からのタップ構造情報に従い、そのタップ構造情報が表すタップ構造のクラスタップを構成する。

そして、クラス分類部１８３は、タップ選択部１８２で構成されたクラスタップを用いて、注目画素のクラス分類を行う。

なお、クラス分類部１８３は、図１１のクラス分類部１６３と同様のクラス分類を行う。したがって、図１１のクラス分類部１６３が、注目画素のクラス分類を、注目画素のクラスタップを用いるとともに、注目画素の符号化情報を用いて行う場合、クラス分類部１８３も、注目画素のクラスタップ及び符号化情報を用いて、注目画素のクラス分類を行う。

係数取得部１８４は、図２の係数取得部２４と同様に、クラスごとのタップ係数を記憶し、そのクラスごとのタップ係数から、クラス分類部１８３からの注目画素のクラスのタップ係数を取得して、予測演算部１８５に供給する。

但し、係数取得部１８４は、記憶部１５３（図１１）からのクラスごとのタップ係数を記憶し、そのクラスごとのタップ係数から、注目画素のクラスのタップ係数を取得する。

係数取得部１８４で記憶されるクラスごとのタップ係数は、記憶部１５３からタップ選択部１８２に供給されるタップ構造情報に対応付けられたクラスごとのタップ係数であり、そのタップ構造情報が表すタップ構造のクラスタップを用いたクラス分類で得られるクラスに対するタップ係数である。

なお、図１７の画像変換部１７１では、予測演算部１８５が、タップ選択部１８１で構成された注目画素の予測タップと、係数取得部１８４で取得された注目画素のクラスのタップ係数とを用いて、予測演算を行い、注目画素に対応する元画像に対応する対応画素の画素値の予測値を求める。

予測演算部１８５で行われる予測演算は、注目画素の予測タップに対するフィルタ処理の一種であるということができ、したがって、フィルタ処理の対象となる予測タップを構成するタップ選択部１８１、フィルタ処理に用いるタップ係数を取得する係数取得部１８４、及び、フィルタ処理の一種としての予測演算を行う予測演算部１８５は、フィルタ処理を行うフィルタ処理部１８０を構成している、ということができる。

フィルタ処理部１８０において、予測演算部１８５がフィルタ処理としての予測演算は、係数取得部１８４が取得する、注目画素のクラスのタップ係数によって異なるフィルタ処理になる。したがって、フィルタ処理部１８０のフィルタ処理は、注目画素のクラスに対応するフィルタ処理である、ということができる。

＜学習装置１３１の処理＞

図１８は、図１１の学習装置１３１の処理の例を説明するフローチャートである。

ステップＳ１１において、タップ構造選択部１５１は、あらかじめ決められた複数のタップ構造の候補の中で、まだ、注目タップ構造としていないタップ構造の候補の１つを、注目タップ構造として選択する。そして、タップ構造選択部１５１は、注目タップ構造を表すタップ構造情報を、学習部１５２のタップ選択部１６２、及び、記憶部１５３に供給（出力）し、処理は、ステップＳ１１からステップＳ１２に進む。

ステップＳ１２では、学習部１５２が、生徒データとしての復号途中画像、及び、教師データとしての元画像を用いるとともに、符号化情報を必要に応じて用いて、タップ係数学習を行い、クラスごとのタップ係数を求める。

学習部１５２でのタップ係数学習では、クラス分類が、タップ構造選択部１５１からタップ選択部１６２に供給されるタップ構造情報が表す注目タップ構造のクラスタップを用いて行われ、そのようなクラス分類により得られるクラスに対するタップ係数が求められる。

学習部１５２は、注目タップ構造のクラスタップを用いたクラス分類により得られるクラスごとのタップ係数を、記憶部１５３に供給し、処理は、ステップＳ１２からステップＳ１３に進む。

ステップＳ１３では、記憶部１５３は、タップ構造選択部１５１からの注目タップ構造を表すタップ構造情報と、学習部１５２からの、注目タップ構造のクラスタップを用いたクラス分類により得られるクラスごとのタップ係数とを対応付けて記憶し、処理は、ステップＳ１４に進む。

ステップＳ１４では、タップ構造選択部１５１は、例えば、あらかじめ決められた複数のタップ構造の候補の中で、まだ、注目タップ構造としていないタップ構造の候補があるかどうかを判定する。

ステップＳ１４において、あらかじめ決められた複数のタップ構造の候補の中で、まだ、注目タップ構造としていないタップ構造の候補があると判定された場合、処理は、ステップＳ１１に戻り、以下、同様の処理が繰り返される。

また、ステップＳ１４において、あらかじめ決められた複数のタップ構造の候補の中で、注目タップ構造としていないタップ構造の候補がないと判定された場合、すなわち、あらかじめ決められた複数のタップ構造（の候補）それぞれについて、タップ構造を表すタップ構造情報と、そのタップ構造情報が表すクラスタップを用いたクラス分類により得られるクラスごとのタップ係数とが対応付けられて、記憶部１５３に記憶された場合、処理は、ステップＳ１５に進む。

ステップＳ１５では、評価値算出部１５４において、画像変換部１７１が、記憶部１５３に記憶された複数のタップ構造情報（タップ構造選択部１５１に記憶されている複数のタップ構造それぞれについてのタップ構造情報）それぞれについて、そのタップ構造情報と、そのタップ構造情報に対応付けられているクラスごとのタップ係数とを用い、生徒データとしての復号途中画像を対象に、クラス分類適応処理を行って、教師データとしての元画像に相当する相当画像を求める。

さらに、評価値算出部１５４では、算出部１７２が、複数のタップ構造情報それぞれについて、そのタップ構造情報に対応付けられているクラスごとのタップ係数を用いたクラス分類適応処理により得られた相当画像のS/Nに対応する値等を、タップ構造評価値として求め、選択部１５５に供給する。

そして、処理は、ステップＳ１５からステップＳ１６に進み、選択部１５５は、記憶部１５３に記憶されたタップ構造情報の中から、評価値算出部１５４の算出部１７２から供給されるタップ構造評価値が最良のタップ構造情報を、最適タップ構造を表すタップ構造情報として選択する。さらに、選択部１５５は、記憶部１５３に記憶されたクラスごとのタップ係数の中から、最適タップ構造についてのクラスごとのタップ係数（最適タップ構造を表すタップ構造情報に対応付けられたクラスごとのタップ係数）を選択する。

選択部１５５は、最適タップ構造を表すタップ構造情報と、最適タップ構造についてのクラスごとのタップ係数とを、フィルタ情報生成部１３２に供給し、処理は終了する。

＜画像変換装置１３３の構成例＞

図１９は、図１０の画像変換装置１３３の構成例を示すブロック図である。

図１９において、画像変換装置１３３は、タップ選択部１９１及び１９２、クラス分類部１９３、係数取得部１９４、並びに、予測演算部１９５を有する。

タップ選択部１９１ないし予測演算部１９５は、図１７の画像変換部１７１のタップ選択部１８１ないし予測演算部１８５とそれぞれ同様の処理を行う。

画像変換装置１３３には、第１の画像としての復号途中画像、及び、符号化情報が供給される。画像変換装置１３３では、第１の画像としての復号途中画像を用いるとともに、符号化情報を必要に応じて用いて、図１７の画像変換部１７１と同様のクラス分類適応処理が行われ、元画像に相当する第２の画像としてのフィルタ後画像が求められる。

なお、画像変換装置１３３において、タップ選択部１９２及び係数取得部１９４には、フィルタ情報生成部１３２（図１０）からフィルタ情報が供給される。

タップ選択部１９２は、図１７のタップ選択部１８２と同様に、注目画素について、復号途中画像の画素から、クラスタップとなる画素を選択することにより、その画素によってクラスタップを構成する。

すなわち、タップ選択部１９２は、フィルタ情報生成部１３２からのフィルタ情報に含まれるタップ構造情報に従い、そのタップ構造情報が表す最適タップ構造のクラスタップを構成する。

そして、クラス分類部１９３は、タップ選択部１９２で構成されたクラスタップを用い、注目画素について、図１７のクラス分類部１８３と同様のクラス分類を行う。

したがって、図１７のクラス分類部１８３が、注目画素のクラス分類を、注目画素のクラスタップ及び符号化情報を用いて行う場合には、クラス分類部１９３も、注目画素のクラス分類を、注目画素のクラスタップ及び符号化情報を用いて行う。

係数取得部１９４は、図１７の係数取得部１８４と同様に、クラスごとのタップ係数を記憶し、そのクラスごとのタップ係数から、クラス分類部１９３からの注目画素のクラスのタップ係数を取得して、予測演算部１９５に供給する。

すなわち、係数取得部１９４は、フィルタ情報生成部１３２（図１０）からのフィルタ情報に含まれるクラスごとのタップ係数を記憶し、そのクラスごとのタップ係数から、注目画素のクラスのタップ係数を取得する。

フィルタ情報生成部１３２からのフィルタ情報に含まれるクラスごとのタップ係数は、学習装置１３１（図１１）で求められる、最適タップ構造のクラスタップを用いたクラス分類で得られるクラスごとのタップ係数である。

ここで、図１９の画像変換装置１３３において、タップ選択部１９１、係数取得部１９４、及び、予測演算部１９５は、図１７のタップ選択部１８１、係数取得部１８４、及び、予測演算部１８５と同様に、注目画素のクラスに対応するフィルタ処理を行うフィルタ処理部１９０を構成している、ということができる。

なお、フィルタ情報生成部１３２から画像変換装置１３３に供給されるフィルタ情報には、図１０で説明したように、クラスタップのタップ構造及びクラスごとのタップ係数として、直前のタップ構造及びタップ係数の更新時と同一のタップ構造及びクラスごとのタップ係数を用いるかどうかを表すコピー情報を含ませることができる。

いま、クラスタップのタップ構造及びクラスごとのタップ係数として、直前のタップ構造及びタップ係数の更新時と同一のタップ構造及びクラスごとのタップ係数を用いることを、コピーモードということとする。

フィルタ情報生成部１３２から画像変換装置１３３に供給された最新のフィルタ情報に含まれるコピー情報がコピーモードを表していない場合、タップ選択部１９２は、フィルタ情報生成部１３２から画像変換装置１３３に供給された前回のフィルタ情報に含まれるタップ構造情報が表すタップ構造に代えて、最新のフィルタ情報に含まれるタップ構造情報が表すタップ構造を、クラスタップのタップ構造として採用する。

さらに、係数取得部１９４は、前回のフィルタ情報に含まれるクラスごとのタップ係数に上書きする形で、最新のフィルタ情報に含まれるクラスごとのタップ係数を記憶する。

一方、（最新のフィルタ情報が、タップ構造情報及びクラスごとのタップ係数を含まず、）最新のフィルタ情報に含まれるコピー情報がコピーモードを表す場合、タップ選択部１９２は、前回のフィルタ情報に含まれるタップ構造を、そのまま、クラスタップのタップ構造として採用する。

さらに、係数取得部１９４は、前回のフィルタ情報に含まれるクラスごとのタップ係数の記憶を、そのまま維持する。

したがって、最新のフィルタ情報に含まれるコピー情報がコピーモードを表す場合には、直前のクラスタップのタップ構造、及び、クラスごとのタップ係数が維持される。

＜符号化処理＞

図２０は、図９の符号化装置１１の符号化処理の例を説明するフローチャートである。

なお、図２０に示す符号化処理の各ステップの順番は、説明の便宜上の順番であり、実際の符号化処理の各ステップは、適宜、並列的に、必要な順番で行われる。後述する符号化処理についても、同様である。

符号化装置１１において、クラス分類適応フィルタ１１１の学習装置１３１（図１０）は、そこに供給される復号途中画像のうちの、例えば、複数のフレーム、１フレーム、ブロック等のタップ構造更新単位の復号途中画像を生徒データとするとともに、その復号途中画像に対応する元画像を教師データとして、随時、タップ係数学習を行っている。そして、学習装置１３１は、ステップＳ３１において、クラスタップのタップ構造の更新タイミング（クラスタップのタップ構造を更新する所定のタイミング）であるかどうか、すなわち、例えば、複数のフレーム、１フレーム、ブロック等のタップ構造更新単位の終点又は始点のタイミングであるかどうかを判定する。

ステップＳ３１において、クラスタップのタップ構造の更新タイミングでないと判定された場合、処理は、ステップＳ３２ないしＳ３４をスキップして、ステップＳ３５に進む。

また、ステップＳ３１において、クラスタップのタップ構造の更新タイミングであると判定された場合、処理は、ステップＳ３２に進む。

ステップＳ３２では、フィルタ情報生成部１３２（図１０）は、学習装置１３１が最新のタップ係数学習により生成するタップ構造情報及びクラスごとのタップ係数（又はコピー情報）、すなわち、最適タップ構造を表すタップ構造情報、及び、最適タップ構造についてのクラスごとのタップ係数を含むフィルタ情報を生成し、画像変換装置１３３（図１０）及び可逆符号化部１０６（図９）に供給して、処理は、ステップＳ３３に進む。

なお、符号化装置１１では、元画像の時間方向の相関を検出し、その相関が低い場合（閾値以下の場合）にのみ、更新タイミングで、フィルタ情報を生成し、後述するステップＳ３３及びＳ３４の処理を行うことができる。

ステップＳ３３では、画像変換装置１３３は、フィルタ情報生成部１３２からのフィルタ情報に従って、タップ選択部１９２（図１９）で構成されるクラスタップのタップ構造、及び、係数取得部１９４（図１９）に記憶されるクラスごとのタップ係数を更新し、処理は、ステップＳ３４に進む。

ステップＳ３４では、可逆符号化部１０６は、フィルタ情報生成部１３２から供給されるフィルタ情報を、伝送対象に設定して、処理は、ステップＳ３５に進む。伝送対象に設定されたフィルタ情報は、後述するステップＳ４８において符号化データに含められて伝送される。

ステップＳ３５以降では、元画像の予測符号化処理が行われる。

すなわち、ステップＳ３５において、A/D変換部１０１は、元画像をA/D変換し、並べ替えバッファ１０２に供給して、処理は、ステップＳ３６に進む。

ステップＳ３６において、並べ替えバッファ１０２は、A/D変換部１０１からの元画像を記憶し、符号化順に並べ替えて出力し、処理は、ステップＳ３７に進む。

ステップＳ３７では、イントラ予測部１１４は、イントラ予測モードのイントラ予測処理を行い、処理は、ステップＳ３８に進む。ステップＳ３８において、動き予測補償部１１５は、インター予測モードでの動き予測や動き補償を行うインター動き予測処理を行い、処理は、ステップＳ３９に進む。

イントラ予測部１１４のイントラ予測処理、及び、動き予測補償部１１５のインター動き予測処理では、各種の予測モードのコスト関数が演算されるとともに、予測画像が生成される。

ステップＳ３９では、予測画像選択部１１６は、イントラ予測部１１４及び動き予測補償部１１５で得られる各コスト関数に基づいて、最適な予測モードを決定する。そして、予測画像選択部１１６は、イントラ予測部１１４により生成された予測画像と、動き予測補償部１１５により生成された予測画像のうちの最適な予測モードの予測画像を選択して出力し、処理は、ステップＳ３９からステップＳ４０に進む。

ステップＳ４０では、演算部１０３は、並べ替えバッファ１０２が出力する元画像である符号化対象の対象画像と、予測画像選択部１１６が出力する予測画像との残差を演算し、直交変換部１０４に供給して、処理は、ステップＳ４１に進む。

ステップＳ４１では、直交変換部１０４は、演算部１０３からの残差を直交変換し、その結果得られる変換係数を、量子化部１０５に供給して、処理は、ステップＳ４２に進む。

ステップＳ４２では、量子化部１０５は、直交変換部１０４からの変換係数を量子化し、その量子化により得られる量子化係数を、可逆符号化部１０６及び逆量子化部１０８に供給して、処理は、ステップＳ４３に進む。

ステップＳ４３では、逆量子化部１０８は、量子化部１０５からの量子化係数を逆量子化し、その結果得られる変換係数を、逆直交変換部１０９に供給して、処理は、ステップＳ４４に進む。ステップＳ４４では、逆直交変換部１０９は、逆量子化部１０８からの変換係数を逆直交変換し、その結果得られる残差を、演算部１１０に供給して、処理は、ステップＳ４５に進む。

ステップＳ４５では、演算部１１０は、逆直交変換部１０９からの残差と、予測画像選択部１１６が出力する予測画像とを加算し、演算部１０３での残差の演算の対象となった元画像に対応する復号途中画像を生成する。演算部１１０は、復号途中画像を、クラス分類適応フィルタ１１１又はフレームメモリ１１２に供給し、処理は、ステップＳ４５からステップＳ４６に進む。

演算部１１０からクラス分類適応フィルタ１１１に、復号途中画像が供給される場合、ステップＳ４６において、クラス分類適応フィルタ１１１は、演算部１１０からの復号途中画像に、ILFの処理としてのクラス分類適応処理（クラス分類適応フィルタ処理）を施す。復号途中画像に、クラス分類適応処理が施されることにより、復号途中画像を一般のILFでフィルタリングする場合よりも元画像に近いフィルタ後画像が求められる。

クラス分類適応フィルタ１１１は、クラス分類適応処理により得られるフィルタ後画像を、フレームメモリ１１２に供給して、処理は、ステップＳ４６からステップＳ４７に進む。

ステップＳ４７では、フレームメモリ１１２は、演算部１１０から供給される復号途中画像、又は、クラス分類適応フィルタ１１１から供給されるフィルタ後画像を、復号画像として記憶し、処理は、ステップＳ４８に進む。フレームメモリ１１２に記憶された復号画像は、ステップＳ３８やＳ３９で、予測画像を生成する元となる参照画像として使用される。

ステップＳ４８では、可逆符号化部１０６は、量子化部１０５からの量子化係数を符号化する。さらに、可逆符号化部１０６は、量子化部１０５での量子化に用いられた量子化パラメータQPや、イントラ予測部１１４でのイントラ予測処理で得られた予測モード、動き予測補償部１１５でのインター動き予測処理で得られた予測モードや動き情報等の符号化情報を必要に応じて符号化し、符号化データに含める。

また、可逆符号化部１０６は、ステップＳ３４で伝送対象に設定されたフィルタ情報を符号化し、符号化データに含める。そして、可逆符号化部１０６は、符号化データを、蓄積バッファ１０７に供給し、処理は、ステップＳ４８からステップＳ４９に進む。

ステップＳ４９において、蓄積バッファ１０７は、可逆符号化部１０６からの符号化データを蓄積し、処理は、ステップＳ５０に進む。蓄積バッファ１０７に蓄積された符号化データは、適宜読み出されて伝送される。

ステップＳ５０では、レート制御部１１７は、蓄積バッファ１０７に蓄積されている符号化データの符号量（発生符号量）に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御し、符号化処理は終了する。

図２１は、図２０のステップＳ４６で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ１１１の画像変換装置１３３（図１９）では、ステップＳ６１において、タップ選択部１９１が、演算部１１０から供給される復号途中画像（としてのブロック）の画素のうちの、まだ、注目画素とされていない画素の１つを、注目画素として選択し、処理は、ステップＳ６２に進む。

ステップＳ６２において、タップ選択部１９１が、演算部１１０から供給される復号途中画像から、注目画素についての予測タップとする画素を選択し、予測タップを構成する。そして、タップ選択部１９１は、予測タップを、予測演算部１９５に供給して、処理は、ステップＳ６３に進む。

ステップＳ６３では、タップ選択部１９２が、フィルタ情報生成部１３２（図１０）からのフィルタ情報に含まれるタップ構造情報に従い、演算部１１０から供給される復号途中画像から、注目画素についてのクラスタップとする画素を選択し、これにより、フィルタ情報に含まれるタップ構造情報が表す最適タップ構造のクラスタップを構成する。そして、タップ選択部１９２は、クラスタップを、クラス分類部１９３に供給する。

すなわち、タップ選択部１９２が構成するクラスタップのタップ構造は、直前に行われた図２０のステップＳ３３のクラスタップのタップ構造の更新により更新されており、タップ選択部１９２は、更新後のタップ構造のクラスタップを構成して、クラス分類部１９３に供給する。

その後、処理は、ステップＳ６３からステップＳ６４に進み、クラス分類部１９３は、注目画素についてのクラスタップを用いるとともに、注目画素についての符号化情報を必要に応じて用いて、注目画素のクラス分類を行う。そして、クラス分類部１９３は、クラス分類により得られる注目画素のクラスを、係数取得部１９４に供給して、処理は、ステップＳ６４からステップＳ６５に進む。

係数取得部１９４は、フィルタ情報生成部１３２から供給されるフィルタ情報に含まれるクラスごとのタップ係数、すなわち、タップ選択部１９２で構成されたクラスタップの最適タップ構造についてのクラスごとのタップ係数を、直前に行われた図２０のステップＳ３３のタップ係数の更新によって記憶している。ステップＳ６５では、係数取得部９１４は、記憶している最適タップ構造についてのクラスごとのタップ係数から、クラス分類部１９３から供給される注目画素のクラスのタップ係数を取得し、予測演算部１９５に供給して、処理は、ステップＳ６６に進む。

ステップＳ６６では、予測演算部１９５は、タップ選択部１９１からの予測タップと、係数取得部１９４からのタップ係数とを用いて、フィルタ処理としての式（１）の予測演算を行う。これにより、予測演算部１９５は、注目画素に対応する元画像の対応画素の画素値の予測値を、フィルタ後画像の画素値として求め、処理は、ステップＳ６７に進む。

ステップＳ６７では、タップ選択部１９１が、演算部１１０からの復号途中画像（としてのブロック）の画素の中に、まだ、注目画素としていない画素があるかどうかを判定する。ステップＳ６７において、まだ、注目画素としていない画素があると判定された場合、処理は、ステップＳ６１に戻り、以下、同様の処理が繰り返される。

また、ステップＳ６７において、まだ、注目画素とされていない画素がないと判定された場合、処理は、ステップＳ６８に進み、予測演算部１９５は、演算部１１０からの復号途中画像（としてのブロック）に対して得られた画素値で構成されるフィルタ後画像を、フレームメモリ１１２（図９）に供給する。そして、クラス分類適応処理は終了され、処理はリターンする。

＜復号装置１２の第１の構成例＞

図２２は、図１の復号装置１２の第１の構成例を示すブロック図である。

図２２において、復号装置１２は、蓄積バッファ２０１、可逆復号部２０２、逆量子化部２０３、逆直交変換部２０４、演算部２０５、クラス分類適応フィルタ２０６、並べ替えバッファ２０７、及び、D/A変換部２０８を有する。また、復号装置１２は、フレームメモリ２１０、選択部２１１、イントラ予測部２１２、動き予測補償部２１３、及び、選択部２１４を有する。

蓄積バッファ２０１は、符号化装置１１から伝送されてくる符号化データを一時蓄積し、所定のタイミングにおいて、その符号化データを、可逆復号部２０２に供給する。

可逆復号部２０２は、蓄積バッファ２０１からの符号化データを取得する。したがって、可逆復号部２０２は、符号化装置１１から伝送されてくる符号化データ、ひいては、符号化データに含まれる符号化情報やフィルタ情報を受け取る受け取り部として機能する。

可逆復号部２０２は、蓄積バッファ２０１から取得した符号化データを、図９の可逆符号化部１０６の符号化方式に対応する方式で復号する。

そして、可逆復号部２０２は、符号化データの復号により得られる量子化係数を、逆量子化部２０３に供給する。

また、可逆復号部２０２は、符号化データの復号により、符号化情報やフィルタ情報が得られた場合には、必要な符号化情報を、イントラ予測部２１２や動き予測補償部２１３その他の必要なブロックに供給する。

さらに、可逆復号部２０２は、符号化情報及びフィルタ情報を、クラス分類適応フィルタ２０６に供給する。

逆量子化部２０３は、可逆復号部２０２からの量子化係数を、図９の量子化部１０５の量子化方式に対応する方式で逆量子化し、その逆量子化により得られる変換係数を、逆直交変換部２０４に供給する。

逆直交変換部２０４は、逆量子化部２０３から供給される変換係数を、図９の直交変換部１０４の直交変換方式に対応する方式で逆直交変換し、その結果得られる残差を、演算部２０５に供給する。

演算部２０５には、逆直交変換部２０４から残差が供給される他、選択部２１４を介して、イントラ予測部２１２又は動き予測補償部２１３から予測画像が供給される。

演算部２０５は、逆直交変換部２０４からの残差と、選択部２１４からの予測画像とを加算し、復号途中画像を生成して、クラス分類適応フィルタ２０６、又は、並べ替えバッファ２０７及びフレームメモリ２１０に供給する。例えば、復号途中画像のうちの、イントラ予測に用いる参照画像となる復号途中画像は、並べ替えバッファ２０７及びフレームメモリ２１０に供給され、他の復号途中画像は、クラス分類適応フィルタ２０６に供給される。

クラス分類適応フィルタ２０６は、クラス分類適応フィルタ１１１と同様に、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF（の）処理を行う。

すなわち、クラス分類適応フィルタ２０６は、演算部２０５からの復号途中画像を第１の画像として、可逆復号部２０２からのフィルタ情報に含まれるクラスごとのタップ係数を用いたクラス分類適応処理（による画像変換）を、可逆復号部２０２からの符号化情報を必要に応じて用いて行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）出力する。

なお、クラス分類適応フィルタ２０６は、クラス分類適応処理において、クラス分類に用いるクラスタップとして、可逆復号部２０２からのフィルタ情報に含まれるタップ構造情報が表す最適タップ構造のクラスタップを用いる。

クラス分類適応フィルタ２０６が出力するフィルタ後画像は、クラス分類適応フィルタ１１１が出力するフィルタ後画像と同様の画像であり、並べ替えバッファ２０７及びフレームメモリ２１０に供給される。

並べ替えバッファ２０７は、演算部２０５から供給される復号途中画像や、クラス分類適応フィルタ２０６から供給されるフィルタ後画像を、復号画像として一時記憶し、復号画像のフレーム（ピクチャ）の並びを、符号化（復号）順から表示順に並べ替え、D/A変換部２０８に供給する。

D/A変換部２０８は、並べ替えバッファ２０７から供給される復号画像をD/A変換し、図示せぬディスプレイに出力して表示させる。

フレームメモリ２１０は、演算部２０５から供給される復号途中画像や、クラス分類適応フィルタ２０６から供給されるフィルタ後画像を、復号画像として一時記憶する。さらに、フレームメモリ２１０は、所定のタイミングにおいて、又は、イントラ予測部２１２や動き予測補償部２１３等の外部の要求に基づいて、復号画像を、予測画像の生成に用いる参照画像として、選択部２１１に供給する。

選択部２１１は、フレームメモリ２１０から供給される参照画像の供給先を選択する。選択部２１１は、イントラ符号化された画像を復号する場合、フレームメモリ２１０から供給される参照画像をイントラ予測部２１２に供給する。また、選択部２１１は、インター符号化された画像を復号する場合、フレームメモリ２１０から供給される参照画像を動き予測補償部２１３に供給する。

イントラ予測部２１２は、可逆復号部２０２から供給される符号化情報に含まれる予測モードに従い、図９のイントラ予測部１１４において用いられたイントラ予測モードで、フレームメモリ２１０から選択部２１１を介して供給される参照画像を用いてイントラ予測を行う。そして、イントラ予測部２１２は、イントラ予測により得られる予測画像を、選択部２１４に供給する。

動き予測補償部２１３は、可逆復号部２０２から供給される符号化情報に含まれる予測モードに従い、図９の動き予測補償部１１５において用いられたインター予測モードで、フレームメモリ２１０から選択部２１１を介して供給される参照画像を用いてインター予測を行う。インター予測は、可逆復号部２０２から供給される符号化情報に含まれる動き情報等を必要に応じて用いて行われる。

動き予測補償部２１３は、インター予測により得られる予測画像を、選択部２１４に供給する。

選択部２１４は、イントラ予測部２１２から供給される予測画像、又は、動き予測補償部２１３から供給される予測画像を選択し、演算部２０５に供給する。

＜クラス分類適応フィルタ２０６の構成例＞

図２３は、図２２のクラス分類適応フィルタ２０６の構成例を示すブロック図である。

図２３において、クラス分類適応フィルタ２０６は、画像変換装置２３１を有する。

画像変換装置２３１には、演算部２０５（図２２）から復号途中画像が供給されるとともに、可逆復号部２０２からフィルタ情報、及び、符号化情報が供給される。

画像変換装置２３１は、図１０の画像変換装置１３３と同様に、復号途中画像を第１の画像として、フィルタ情報に含まれるタップ構造情報が表す最適タップ構造のクラスタップを用いたクラス分類を行い、フィルタ情報に含まれる最適タップ構造についてのクラスごとのタップ係数を用いたフィルタ処理としての予測演算を行うクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、並べ替えバッファ２０７及びフレームメモリ２１０（図２２）に供給する。

なお、画像変換装置２３１は、クラス分類適応処理において、図１０の画像変換装置１３３と同様に、クラス分類を、必要に応じて、符号化情報を用いて行う。

＜画像変換装置２３１の構成例＞

図２４は、図２３の画像変換装置２３１の構成例を示すブロック図である。

図２４において、画像変換装置２３１は、タップ選択部２４１及び２４２、クラス分類部２４３、係数取得部２４４、並びに、予測演算部２４５を有する。

タップ選択部２４１ないし予測演算部２４５は、画像変換装置１３３（図１９）を構成するタップ選択部１９１ないし予測演算部１９５とそれぞれ同様に構成される。

すなわち、タップ選択部２４１及び２４２には、演算部２０５（図２２）から復号途中画像が供給される。

タップ選択部２４１は、演算部２０５からの復号途中画像を第１の画像として、復号途中画像の画素を、順次、注目画素に選択する。

さらに、タップ選択部２４１は、注目画素について、復号途中画像から、図１９のタップ選択部１９１で選択される予測タップと同一構造の予測タップを選択し、予測演算部２４５に供給する。

タップ選択部２４２には、演算部２０５（図２２）から復号途中画像が供給される他、可逆復号部２０２からフィルタ情報が供給される。

タップ選択部２４２は、注目画素について、演算部２０５からの復号途中画像を第１の画像として、可逆復号部２０２からのフィルタ情報に含まれるタップ構造情報に従い、復号途中画像の画素から、クラスタップとなる画素を選択することにより、フィルタ情報に含まれるタップ構造情報が表す最適タップ構造のクラスタップ、すなわち、図１９のタップ選択部１９２で構成されるクラスタップと同一構造のクラスタップを選択し、クラス分類部２４３に供給する。

クラス分類部２４３には、タップ選択部２４２からクラスタップが供給される他、可逆復号部２０２（図２２）から、符号化情報が供給される。

クラス分類部２４３は、タップ選択部２４２からのクラスタップを用いるとともに、可逆復号部２０２からの符号化情報を必要に応じて用いて、図１９のクラス分類部１９３と同一のクラス分類を行い、注目画素のクラス（を表すクラスコード）を、係数取得部２４４に供給する。

係数取得部２４４には、クラス分類部２４３から注目画素のクラスが供給される他、可逆復号部２０２からフィルタ情報が供給される。

係数取得部２４４は、可逆復号部２０２からのフィルタ情報に含まれる最適タップ構造についてのクラスごとのタップ係数を記憶し、そのクラスごとのタップ係数から、クラス分類部２４３からの注目画素のクラスのタップ係数を取得して、予測演算部２４５に供給する。

予測演算部２４５は、タップ選択部２４１からの予測タップと、係数取得部２４４からのタップ係数とを用いて、フィルタ処理としての式（１）の予測演算を行い、復号途中画像の注目画素に対応する元画像の対応画素の画素値の予測値を、第２の画像としてのフィルタ後画像の画素の画素値として求めて出力する。

ここで、図２４の画像変換装置２３１において、タップ選択部２４１、係数取得部２４４、及び、予測演算部２４５は、図１９の画像変換装置１３３のタップ選択部１９１、係数取得部１９４、及び、予測演算部１９５と同様に、注目画素のクラスに対応するフィルタ処理を行うフィルタ処理部２４０を構成している、ということができる。

なお、可逆復号部２０２から画像変換装置２３１に供給されるフィルタ情報には、図１０で説明したように、クラスタップのタップ構造及びクラスごとのタップ係数として、直前のタップ構造及びタップ係数の更新時と同一のタップ構造及びクラスごとのタップ係数を用いるかどうかを表すコピー情報を含ませることができる。

可逆復号部２０２から画像変換装置２３１に供給された最新のフィルタ情報に含まれるコピー情報がコピーモードを表していない場合、タップ選択部２４２は、可逆復号部２０２から画像変換装置２３１に供給された前回のフィルタ情報に含まれるタップ構造情報が表す最適タップ構造に代えて、最新のフィルタ情報に含まれるタップ構造情報が表す最適タップ構造を、クラスタップのタップ構造として採用する。

さらに、係数取得部２４４は、前回のフィルタ情報に含まれるクラスごとのタップ係数に上書きする形で、最新のフィルタ情報に含まれるクラスごとのタップ係数を記憶する。

一方、最新のフィルタ情報に含まれるコピー情報がコピーモードを表す場合、タップ選択部２４２は、前回のフィルタ情報に含まれる最適タップ構造を、そのまま、クラスタップのタップ構造として採用する。

さらに、係数取得部２４４は、前回のフィルタ情報に含まれるクラスごとのタップ係数の記憶を、そのまま維持する。

したがって、画像変換装置２３１でも、画像変換装置１３３（図１０）（図１９）と同様に、最新のフィルタ情報に含まれるコピー情報がコピーモードを表す場合には、直前のクラスタップのタップ構造、及び、クラスごとのタップ係数が維持される。

＜復号処理＞

図２５は、図２２の復号装置１２の復号処理の例を説明するフローチャートである。

なお、図２５に示す復号処理の各ステップの順番は、説明の便宜上の順番であり、実際の復号処理の各ステップは、適宜、並列的に、必要な順番で行われる。後述する復号処理についても、同様である。

復号処理では、ステップＳ１１１において、蓄積バッファ２０１は、符号化装置１１から伝送されてくる符号化データを一時蓄積し、適宜、可逆復号部２０２に供給して、処理は、ステップＳ１１２に進む。

ステップＳ１１２では、可逆復号部２０２は、蓄積バッファ２０１から供給される符号化データを受け取って復号し、その復号により得られる量子化係数を、逆量子化部２０３に供給する。

また、可逆復号部２０２は、符号化データの復号により、符号化情報やフィルタ情報が得られた場合、必要な符号化情報を、イントラ予測部２１２や動き予測補償部２１３その他の必要なブロックに供給する。

その後、処理は、ステップＳ１１２からステップＳ１１３に進み、クラス分類適応フィルタ２０６は、可逆復号部２０２からフィルタ情報が供給されたかどうかを判定する。

ステップＳ１１３において、フィルタ情報が供給されていないと判定された場合、処理は、ステップＳ１１４をスキップして、ステップＳ１１５に進む。

また、ステップＳ１１３において、フィルタ情報が供給されたと判定された場合、処理は、ステップＳ１１４に進み、クラス分類適応フィルタ２０６の画像変換装置２３１（図２４）は、可逆復号部２０２からのフィルタ情報を取得し、処理は、ステップＳ１１５に進む。

ステップＳ１１５では、画像変換装置２３１は、クラスタップのタップ構造の更新タイミングであるかどうか、すなわち、例えば、複数のフレーム、１フレーム、ブロック等のタップ構造更新単位の終点又は始点のタイミングであるかどうかを判定する。

ここで、タップ構造更新単位は、例えば、フィルタ情報が配置されている（含まれている）符号化データの階層（例えば、Sequence parameter set syntaxや、Picture parameter set syntax，Slice data syntax等）から認識することができる。

例えば、フィルタ情報が、符号化データのPicture parameter set syntaxとして配置されている場合には、タップ構造更新単位は、１フレームであると認識される。

ステップＳ１１５において、クラスタップのタップ構造の更新タイミングでないと判定された場合、処理は、ステップＳ１１６をスキップして、ステップＳ１１７に進む。

また、ステップＳ１１５において、クラスタップのタップ構造の更新タイミングであると判定された場合、処理は、ステップＳ１１６に進む。

ステップＳ１１６では、画像変換装置２３１は、直前のステップＳ１１４で取得したフィルタ情報に従って、タップ選択部２４２（図２４）で構成されるクラスタップのタップ構造、及び、係数取得部２４４（図２４）に記憶されるクラスごとのタップ係数を更新し、処理は、ステップＳ１１７に進む。

ステップＳ１１７では、逆量子化部２０３は、可逆復号部２０２からの量子化係数を逆量子化し、その結果得られる変換係数を、逆直交変換部２０４に供給して、処理は、ステップＳ１１８に進む。

ステップＳ１１８では、逆直交変換部２０４は、逆量子化部２０３からの変換係数を逆直交変換し、その結果得られる残差を、演算部２０５に供給して、処理は、ステップＳ１１９に進む。

ステップＳ１１９では、イントラ予測部２１２又は動き予測補償部２１３が、フレームメモリ２１０から選択部２１１を介して供給される参照画像、及び、可逆復号部２０２から供給される符号化情報を用いて、予測画像を生成する予測処理を行う。そして、イントラ予測部２１２又は動き予測補償部２１３は、予測処理により得られる予測画像を、選択部２１４に供給し、処理は、ステップＳ１１９からステップＳ１２０に進む。

ステップＳ１２０では、選択部２１４は、イントラ予測部２１２又は動き予測補償部２１３から供給される予測画像を選択し、演算部２０５に供給して、処理は、ステップＳ１２１に進む。

ステップＳ１２１では、演算部２０５は、逆直交変換部２０４からの残差と、選択部２１４からの予測画像を加算することにより、復号途中画像を生成する。そして、演算部２０５は、復号途中画像を、クラス分類適応フィルタ２０６、又は、並べ替えバッファ２０７及びフレームメモリ２１０に供給して、処理は、ステップＳ１２１からステップＳ１２２に進む。

演算部２０５からクラス分類適応フィルタ２０６に、復号途中画像が供給される場合、ステップＳ１２２において、クラス分類適応フィルタ２０６は、演算部２０５からの復号途中画像に、ILFの処理としてのクラス分類適応処理を施す。復号途中画像に、クラス分類適応処理が施されることにより、符号化装置１１の場合と同様に、復号途中画像をILFでフィルタリングする場合よりも元画像に近いフィルタ後画像が求められる。

クラス分類適応フィルタ２０６は、クラス分類適応処理により得られるフィルタ後画像を、並べ替えバッファ２０７及びフレームメモリ２１０に供給して、処理は、ステップＳ１２２からステップＳ１２３に進む。

ステップＳ１２３では、並べ替えバッファ２０７は、演算部２０５から供給される復号途中画像、又は、クラス分類適応フィルタ２０６から供給されるフィルタ後画像を、復号画像として一時記憶する。さらに、並べ替えバッファ２０７は、記憶した復号画像を、表示順に並べ替えて、D/A変換部２０８に供給し、処理は、ステップＳ１２３からステップＳ１２４に進む。

ステップＳ１２４では、D/A変換部２０８は、並べ替えバッファ２０７からの復号画像をD/A変換し、処理は、ステップＳ１２５に進む。D/A変換後の復号画像は、図示せぬディスプレイに出力されて表示される。

ステップＳ１２５では、フレームメモリ２１０は、演算部２０５から供給される復号途中画像、又は、クラス分類適応フィルタ２０６から供給されるフィルタ後画像を、復号画像として記憶し、復号処理は終了する。フレームメモリ２１０に記憶された復号画像は、ステップＳ１１９の予測処理で、予測画像を生成する元となる参照画像として使用される。

図２６は、図２５のステップＳ１２２で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ２０６の画像変換装置２３１（図２４）では、ステップＳ１３１において、タップ選択部２４１が、演算部２０５（図２２）から供給される復号途中画像（としてのブロック）の画素のうちの、まだ、注目画素とされていない画素の１つを、注目画素として選択し、処理は、ステップＳ１３２に進む。

ステップＳ１３２において、タップ選択部２４１が、演算部２０５から供給される復号途中画像から、注目画素についての予測タップとする画素を選択し、予測タップを構成する。そして、タップ選択部２４１は、予測タップを、予測演算部２４５に供給して、処理は、ステップＳ１３２からステップＳ１３３に進む。

ステップＳ１３３では、タップ選択部２４２が、可逆復号部２０２（図２２）からのフィルタ情報に含まれるタップ構造情報に従い、演算部２０５から供給される復号途中画像から、注目画素についてのクラスタップとする画素を選択し、これにより、フィルタ情報に含まれるタップ構造情報が表す最適タップ構造のクラスタップを構成する。そして、タップ選択部２４２は、クラスタップを、クラス分類部２４３に供給する。

すなわち、タップ選択部２４２が構成するクラスタップのタップ構造は、直前に行われた図２５のステップＳ１１６のクラスタップのタップ構造の更新により更新されており、タップ選択部１９２は、更新後のタップ構造のクラスタップを構成して、クラス分類部２４３に供給する。

その後、処理は、ステップＳ１３３からステップＳ１３４に進み、クラス分類部２４３は、注目画素についてのクラスタップを用いるとともに、注目画素についての符号化情報を必要に応じて用いて、注目画素のクラス分類を行う。そして、クラス分類部２４３は、クラス分類により得られる注目画素のクラスを、係数取得部２４４に供給して、処理は、ステップＳ１３４からステップＳ１３５に進む。

係数取得部２４４は、可逆復号部２０２から供給されるフィルタ情報に含まれるクラスごとのタップ係数、すなわち、タップ選択部２４２で構成されたクラスタップの最適タップ構造についてのクラスごとのタップ係数を、直前に行われた図２５のステップＳ１１６のタップ係数の更新によって記憶している。ステップＳ１３５では、係数取得部２４４は、記憶している最適タップ構造についてのクラスごとのタップ係数から、クラス分類部２４３から供給される注目画素のクラスのタップ係数を取得し、予測演算部２４５に供給して、処理は、ステップＳ１３６に進む。

ステップＳ１３６では、予測演算部２４５は、タップ選択部２４１からの予測タップと、係数取得部２４４からのタップ係数とを用いて、フィルタ処理としての式（１）の予測演算を行う。これにより、予測演算部２４５は、注目画素に対応する元画像の対応画素の画素値の予測値を、フィルタ後画像の画素値として求め、処理は、ステップＳ１３７に進む。

ステップＳ１３７では、タップ選択部２４１が、演算部２０５からの復号途中画像（としてのブロック）の画素の中に、まだ、注目画素としていない画素があるかどうかを判定する。ステップＳ１３７において、まだ、注目画素としていない画素があると判定された場合、処理は、ステップＳ１３１に戻り、以下、同様の処理が繰り返される。

また、ステップＳ１３７において、まだ、注目画素とされていない画素がないと判定された場合、処理は、ステップＳ１３８に進み、予測演算部２４５は、演算部２０５からの復号途中画像（としてのブロック）に対して得られた画素値で構成されるフィルタ後画像を、並べ替えバッファ２０７及びフレームメモリ２１０（図２２）に供給する。そして、クラス分類適応処理は終了され、処理はリターンする。

以上のように、符号化装置１１及び復号装置１２では、ILF処理を、クラス分類適応処理によって行うので、ILFの処理結果よりも元画像に近いフィルタ後画像を得ることができる。その結果、復号画像のS/Nを大きく改善することができる。さらに、元画像に近いフィルタ後画像を得ることができることから、残差が小さくなり、タップ係数をオーバーヘッドとして符号化データに含めても、特に、4kや8k等と呼ばれるデータ量の多い高解像度の元画像については、圧縮効率を、大きく改善することができる。

さらに、符号化装置１１及び復号装置１２では、タップ構造更新単位を最小単位とするタイミングで、クラスタップのタップ構造を、複数のタップ構造の中から選択されたタップ構造に更新する。したがって、クラスタップのタップ構造が、注目画素を適切なクラスに分類するように更新されることで、元画像により近いフィルタ後画像を得ることが可能となり、その結果、復号画像のS/Nを、さらに大きく改善することができる。

なお、図９の符号化装置１１の第１の構成例では、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべての処理を行うこととしたが、クラス分類適応処理では、ILFのすべてではなく、DF，SAO、及び、ALFのうちの１つ又は２つの処理を行うことができる。図２２の復号装置１２の第１の構成例、並びに、後述する符号化装置１１及び復号装置１２の他の構成例でも、同様である。

＜タップ係数の削減＞

図２７は、タップ係数学習により得られるクラスごとのタップ係数を削減する削減方法の例を説明する図である。

タップ係数は、符号化データのオーバーヘッドとなるため、フィルタ後画像が元画像に極めて近い画像となるタップ係数が得られても、タップ係数のデータ量が多いと、圧縮効率の改善の妨げとなる。

そこで、タップ係数学習により得られるタップ係数（の数）は、必要に応じて削減することができる。

例えば、図２７に示すように、注目画素を中心として、注目画素と、注目画素の上下左右それぞれに隣接する２画素ずつとの、合計で、９画素で構成されるクロス型のクラスタップを構成し、1ビットADRC処理によるクラス分類を行う場合には、例えば、最上位ビット（注目画素のADRC結果）が1のADRCコードについて、各ビットの反転を行うことにより、クラス数を、512=2⁹クラスから256=2⁸クラスに縮退することができる。クラスの縮退後の256クラスでは、9画素のクラスタップ（の1ビットADRC処理）のADRCコードをそのままクラスコードとする場合に比較して、タップ係数のデータ量が1/2に削減される。

さらに、クラスタップを構成するクロス型の9画素のうちの、上下方向、左右方向、又は、斜め方向に線対称の位置関係にある画素のADRC結果が同一のクラスどうしを、１つのクラスにまとめるクラスの縮退を行うことにより、クラス数は、100クラスにすることができる。この場合、100クラスのタップ係数のデータ量は、256クラスのタップ係数のデータ量の約39％になる。

また、以上に加えて、クラスタップを構成するクロス型の9画素のうちの、点対称の位置関係にある画素のADRC結果が同一のクラスどうしを、１つのクラスにまとめるクラスの縮退を行うことにより、クラス数は、55クラスにすることができる。この場合、55クラスのタップ係数のデータ量は、256クラスのタップ係数のデータ量の約21％になる。

クラスの縮退は、その他、例えば、クラスを統合する統合指標を算出し、その統合指標に基づいて、複数のクラスを１つのクラスに統合することにより行うことができる。

例えば、あるクラスC1のタップ係数それぞれと、他のクラスC2のタップ係数それぞれとの差分の自乗和等を、タップ係数どうしの係数間距離として定義し、その係数間距離を、統合指標として用いて、統合指標としての係数間距離が閾値以下のクラスC1及びC2を、１つのクラスCに統合することができる。クラスの統合を行った場合には、その統合後のクラスのタップ係数としては、統合前のクラスC1のタップ係数又はクラスC2のタップ係数を採用することができる。また、統合後のクラスのタップ係数は、タップ係数学習により求め直すことができる。

さらに、例えば、RDコストを統合指標として用い、あるクラスC1と他のクラスC2とを統合する前のRDコストに対して、クラスC1とクラスC2とを統合した後のRDコストが改善する場合には、クラスC1及びC2を、１つのクラスCに統合することができる。

なお、以上のように、統合指標に基づいて、複数のクラスを１つのクラスに統合する場合には、統合後のクラスごとのタップ係数が、フィルタ情報として、符号化装置１１から復号装置１２に伝送されるが、さらに、統合前のクラスと統合後のクラスとの対応関係を表す情報（対応関係を、復号装置１２側で認識することができる情報）を、フィルタ情報として、符号化装置１１から復号装置１２に伝送する必要がある。

タップ係数の削減は、以上のように、クラスの縮退によって行う他、タップ係数自体を削減することによって行うこともできる。

すなわち、例えば、予測タップ及び符号化ブロックが同一の画素で構成される場合には、ブロック位相に基づいて、タップ係数自体を削減することができる。

例えば、図２７に示すように、予測タップ及び符号化ブロックが、4×4画素で構成される場合には、予測タップの左上の2×2画素と左右方向に線対称の位置関係にある右上の2×2画素、上下方向に線対称の位置関係にある左下の2×2画素、及び、点対称の位置関係にある右下の2×2画素のタップ係数として、左上の2×2画素それぞれのタップ係数を位置関係に応じて配置し直したタップ係数を採用することができる。この場合、予測タップを構成する4×4画素に対する16個のタップ係数を、左上の2×2画素に対する4個のタップ係数に削減することができる。

また、予測タップの上半分の4×2画素と上下方向に線対称の位置関係にある下半分の4×2画素のタップ係数として、上半分の4×2画素それぞれのタップ係数を位置関係に応じて配置し直したタップ係数を採用することができる。この場合、予測タップを構成する4×4画素に対する16個のタップ係数を、上半分の4×2画素に対する8個のタップ係数に削減することができる。

その他、予測タップの左右方向に線対称の位置関係にある画素どうしや、斜め方向に線対称の位置関係にある画素どうしのタップ係数として、同一のタップ係数を採用することによって、タップ係数を削減することができる。

＜符号化装置１１の第２の構成例＞

図２８は、図１の符号化装置１１の第２の構成例を示すブロック図である。

なお、図中、図９の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図２８において、符号化装置１１は、A/D変換部１０１ないし演算部１１０、フレームメモリ１１２ないしレート制御部１１７、及び、クラス分類適応フィルタ３１１を有する。

したがって、図２８の符号化装置１１は、A/D変換部１０１ないし演算部１１０、及び、フレームメモリ１１２ないしレート制御部１１７を有する点で、図９の場合と共通する。

但し、図２８の符号化装置１１は、クラス分類適応フィルタ１１１に代えて、クラス分類適応フィルタ３１１を有する点で、図９の場合と相違する。

クラス分類適応フィルタ３１１は、図９のクラス分類適応フィルタ１１１と同様に、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF処理を行う。

＜クラス分類適応フィルタ３１１の構成例＞

図２９は、図２８のクラス分類適応フィルタ３１１の構成例を示すブロック図である。

図２９において、クラス分類適応フィルタ３１１は、学習装置３３１、フィルタ情報生成部３３２、及び、画像変換装置３３３を有する。

学習装置３３１には、並べ替えバッファ１０２（図２８）から元画像が供給されるとともに、演算部１１０（図２８）から復号途中画像が供給される。さらに、学習装置３３１には、符号化情報が供給される。

学習装置３３１は、復号途中画像を生徒データとするとともに、元画像を教師データとして、クラスごとのタップ係数を求めるタップ係数学習を行う。

さらに、学習装置３３１は、タップ係数学習により得られるクラスごとのタップ係数、及び、そのクラスごとのタップ係数を得るのに用いたクラスタップのタップ構造を選択する選択規則を、フィルタ情報生成部３３２に供給する。

なお、学習装置３３１は、タップ係数学習において、クラス分類を、必要に応じて、符号化情報を用いて行うことができる。

フィルタ情報生成部３３２は、学習装置３３１からのクラスごとのタップ係数及び選択規則を必要に応じて含むフィルタ情報を生成し、画像変換装置３３３及び可逆符号化部１０６（図２８）に供給する。

画像変換装置３３３には、フィルタ情報生成部３３２からフィルタ情報が供給される他、演算部１１０（図２８）から復号途中画像が供給されるとともに、符号化情報が供給される。

画像変換装置３３３は、例えば、復号途中画像を第１の画像として、フィルタ情報生成部３３２からのフィルタ情報に含まれるクラスごとのタップ係数を用いたクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、フレームメモリ１１２（図２８）に供給する。

なお、画像変換装置３３３は、クラス分類適応処理において、クラス分類を、必要に応じて、符号化情報を用いて行うことができる。

図２９のクラス分類適応フィルタ３１１では、フィルタ後画像のS/Nを大きく改善し、圧縮効率の悪化を抑制するため、学習装置３３１が、複数の選択規則それぞれに従って、複数のタップ構造の中から、クラスタップのタップ構造を選択し、複数の選択規則それぞれについて、タップ係数学習を行って、クラスごとのタップ係数を求める。

さらに、学習装置３３１は、複数の選択規則それぞれについて、その選択規則に従って選択されたタップ構造のクラスタップをクラス分類に用いる適切さを表すタップ構造評価値を求め、タップ構造評価値が最良の選択規則を、最適選択規則に選択する。

そして、学習装置３３１は、最適選択規則と、最適選択規則に従って選択されたタップ構造である最適タップ構造についてのクラスごとのタップ係数（最適タップ構造のクラスタップを用いたタップ係数学習により求められたクラスごとのタップ係数）とを、フィルタ情報生成部３３２に供給する。

ここで、複数の選択規則それぞれについてのタップ構造評価値としては、例えば、各選択規則に従って選択されたタップ構造についてのクラスごとのタップ係数を用いたフィルタ処理（ここでは、例えば、クラス分類適応処理）を、生徒データとしての復号途中結果画像を対象として行うことにより得られる、教師データとしての元画像に相当する相当画像のS/N等を採用することができる。

また、複数の選択規則それぞれについてのタップ構造評価値としては、例えば、各選択規則に従って選択されたタップ構造についてのクラスごとのタップ係数を用いたフィルタ処理を採用して、教師データとしての元画像の符号化を行った場合のRDコスト等を採用することができる。

選択規則は、復号装置１２が、符号化装置１１からの符号化データから取得することができる取得可能情報に応じて、タップ構造を選択する方法を規定する規則である。選択規則では、例えば、どのような取得可能情報が、どのような場合に、どのようなタップ構造を選択するかが規定される。

学習装置３３１がフィルタ情報生成部３３２に供給する選択規則としては、どのような取得可能情報が、どのような場合に、どのようなタップ構造を選択するかを、具体的に規定する規則そのものを採用することができる。

また、どのような取得可能情報が、どのような場合に、どのようなタップ構造を選択するかを、具体的に規定する規則を、複数用意するとともに、その複数の規則それぞれに、ユニークなIDを割り当てておき、そのIDを、学習装置３３１がフィルタ情報生成部３３２に供給する選択規則として採用することができる。

選択規則では、例えば、あらかじめ決定された複数のタップ構造の中から、クラスタップのタップ構造として選択するタップ構造を規定することができる。

選択規則に規定する取得可能情報としては、例えば、符号化データから得られる復号途中画像や符号化情報等を採用することができる。

フィルタ情報生成部３３２は、学習装置３３１からのクラスごとのタップ係数及び選択規則を必要に応じて含むフィルタ情報を生成する。

フィルタ情報には、図１０で説明したコピー情報を含ませることができる。

フィルタ情報に、クラスごとのタップ係数及び選択規則を含ませずに、コピー情報を含ませることにより、クラスごとのタップ係数及び選択規則を含ませる場合に比較して、フィルタ情報のデータ量を大きく低減し、圧縮効率を向上させることができる。

また、図１０で説明した場合と同様に、クラスタップのタップ構造（及びタップ係数）の更新を行うタップ構造更新単位としては、複数のフレーム、１フレーム、CUその他のブロック等の、任意のピクチャシーケンスを採用することができる。

そして、フィルタ情報は、例えば、Sequence parameter set syntaxや、Picture parameter set syntax，Slice data syntaxとして、符号化データに含ませることができる。

＜取得可能情報の例＞
図３０は、クラスタップのタップ構造の選択に用いる取得可能情報の例を示す図である。

取得可能情報としては、復号途中画像の画像特徴量や符号化情報（画像特徴量や符号化情報から認識することができる情報を含む）を採用することができる。

すなわち、復号途中画像における、注目画素のピクチャ（フレーム）全体の画像特徴量や、注目画素の周辺の局所の画像特徴量、注目画素の符号化情報等を、クラスタップのタップ構造の選択に用いる取得可能情報として採用することができる。

注目画素のピクチャ全体の画像特徴量としては、例えば、全画面（ピクチャ全体）のアクティビティ（例えば、水平と垂直方向それぞれの隣接画素どうしの差分絶対値和の総和等）や、全画面の方向差分絶対値和（水平、垂直、斜め等の複数の方向それぞれの隣接画素どうしの差分絶対値和）、全画面のフレーム間差分絶対値和（注目画素のフレームと、そのフレームの前のフレームとの、同一位置の画素どうしの差分絶対値和）等を採用することができる。

全画面のアクティビティによれば、全画面の周波数帯域（全画面帯域）を認識することができる。

全画面帯域が高い場合、注目画素のピクチャには、テクスチャようなディテールを多く含むシーンが映っている（と推測される）ので、クラスタップを、密に張る（密な画素で構成する）ことにより、注目画素を適切に分類することができる。そこで、選択規則では、取得可能情報としての全画面帯域が高い場合、すなわち、閾値以上の場合、密な画素のタップ構造を、クラスタップのタップ構造として選択することを規定することができる。具体的な閾値やタップ構造は、選択規則に含めることができる。

全画面帯域が低い場合、注目画素のピクチャには、ディテールが失われてエッジがぼけ気味のシーンが映っているので、クラスタップを、疎に張る（疎な画素で構成する）ことにより、注目画素を適切に分類することができる。そこで、選択規則では、取得可能情報としての全画面帯域が低い場合、すなわち、閾値未満の場合、疎な画素のタップ構造を、クラスタップのタップ構造として選択することを規定することができる。

全画面の方向差分絶対値和は、水平（横）、垂直（縦）、斜めの方向に、エッジが多く含まれるシーンで大になり、かかる全画面の方向差分絶対値和によれば、注目画素のピクチャの主要な構造、すなわち、注目画素のピクチャに存在する主要なエッジ（構造線）を認識することができる。

クラスタップは、エッジの方向、及び、エッジに直交する方向に張る（エッジの方向、及び、エッジに直交する方向にある画素で構成する）ことにより、注目画素を適切に分類することができる。そこで、選択規則では、取得可能情報としてのピクチャに存在する主要なエッジの方向、及び、そのようなエッジに直交する方向の一方又は両方にある画素で構成されるタップ構造を、クラスタップのタップ構造として選択することを規定することができる。すなわち、選択規則では、例えば、水平、垂直、斜めの方向のうちの、全画面の方向差分絶対値和が最も大きい方向と、その方向に直交する方向とにある画素で構成されるタップ構造を、クラスタップのタップ構造として選択することを規定することができる。

全画面のフレーム間差分絶対値和は、時間方向に同じ絵柄が連続するシーンで小になり、かかる全画面のフレーム間差分絶対値和によれば、注目画素のピクチャの時間方向の相関を認識することができる。

注目画素のピクチャの時間方向の相関が大である場合、クラスタップのタップ構造として、前のピクチャで用いられたタップ構造と同一のタップ構造を、クラスタップのタップ構造として用いる（前と同じ設定を適用する）ことにより、前のピクチャと同様に、注目画素を適切に分類することができる。そこで、選択規則では、取得可能情報としての注目画素のピクチャの時間方向の相関が大である場合（閾値以上である場合）、前のピクチャで用いられたタップ構造と同一のタップ構造を、クラスタップのタップ構造として選択することを規定することができる。

注目画素の周辺の局所の画像特徴量としては、例えば、注目画素の周辺の局所のアクティビティや、局所の方向差分絶対値和、局所のフレーム間差分絶対値和等を採用することができる。

局所のアクティビティによれば、注目画素の周辺の局所の周波数帯域（局所帯域）を認識することができる。

局所帯域を用いた選択規則では、全画面帯域を用いた選択規則と同様に、局所帯域が高い場合、密な画素のタップ構造を、クラスタップのタップ構造として選択すること、及び、局所帯域が低い場合、疎な画素のタップ構造を、クラスタップのタップ構造として選択することを規定することができる。

局所の方向差分絶対値和によれば、注目画素の周辺の局所の（主要な）エッジを認識することができる。

局所のエッジを用いた選択規則では、ピクチャに存在する主要なエッジを用いた選択規則と同様に、局所のエッジの方向、及び、そのエッジに直交する方向の一方又は両方にある画素で構成されるタップ構造を、クラスタップのタップ構造として選択することを規定することができる。

局所のフレーム間差分絶対値和によれば、注目画素の周辺の局所の時間方向の相関を認識することができる。

局所の時間方向の相関を用いた選択規則では、ピクチャの時間方向の相関を用いた選択規則と同様に、局所の時間方向の相関が大である場合、前のピクチャで用いられたタップ構造と同一のタップ構造を、クラスタップのタップ構造として選択することを規定することができる。

注目画素の符号化情報については、例えば、注目画素（のブロック）のピクチャタイプや、動きベクトル(MV)、イントラ予測の情報等を、選択規則に用いることができる。

例えば、選択規則では、注目画素のピクチャタイプがPピクチャ又はBピクチャである場合には、そのPピクチャ又はBピクチャのインター予測で参照するIピクチャで用いられたタップ構造と同一のタップ構造を、クラスタップのタップ構造として選択する（前と同じ設定を適用する）ことを規定することができる。

時間方向に同じ絵柄が連続するシーンでは、Pピクチャ又はBピクチャのインター予測で参照するIピクチャで用いられたタップ構造と同一のタップ構造を、クラスタップのタップ構造として選択することにより、圧縮効率の悪化を抑制して、注目画素を適切に分類することができる。

また、例えば、選択規則では、注目画素の動きベクトルに応じて、注目画素に映るオブジェクトと同一のオブジェクトが映る（と推測される）前のピクチャの画素で用いられたタップ構造と同一のタップ構造を、クラスタップのタップ構造として選択する（前と同じ設定を適用する）ことを規定することができる。

時間方向に連続して、同一のオブジェクトが存在するシーンでは、注目画素に映るオブジェクトと同一のオブジェクトが映る前のピクチャの画素で用いられたタップ構造と同一のタップ構造を、クラスタップのタップ構造として選択することにより、圧縮効率の悪化を抑制して、注目画素を適切に分類することができる。

さらに、例えば、選択規則では、イントラ予測の情報から得られる、注目画素の周辺の局所の（主要な）エッジの方向に応じて、そのエッジの方向、及び、そのエッジに直交する方向にある画素で構成されるタップ構造を、クラスタップのタップ構造として選択することを規定することができる。

ここで、例えば、AVCやHEVCでは、イントラ予測の情報として、イントラ予測に用いられた画素が存在する方向を表す方向情報が、ブロックごとに伝送される。注目画素の周辺の局所のエッジの方向（空間的な方向情報）は、方向情報の統計処理等を行うことで取得することができる。

なお、上述の全画面の方向差分絶対値和や、局所の方向差分絶対値和でも、エッジの方向を認識することができるが、これらの方向差分絶対値和は、画素値を用いた画素レベルの処理を行って求める必要がある。これに対して、イントラ予測の情報としての方向情報によれば、画素レベルの処理を行わずに、エッジの方向を取得（認識）することができる。

＜学習装置３３１の構成例＞

図３１は、図２９の学習装置３３１の構成例を示すブロック図である。

なお、図中、図１１の学習装置１３１の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図３１において、学習装置３３１は、学習部１５２、タップ構造選択部３５１、記憶部３５３、評価値算出部３５４、及び、選択部３５５を有する。

したがって、学習装置３３１は、学習部１５２を有する点で、図１１の学習装置１３１と共通する。

但し、学習装置３３１は、タップ構造選択部１５１、記憶部１５３、評価値算出部１５４、及び、選択部１５５に代えて、タップ構造選択部３５１、記憶部３５３、評価値算出部３５４、及び、選択部３５５を有する点で、図１１の学習装置１３１と相違する。

タップ構造選択部３５１は、例えば、あらかじめ決められた複数の選択規則の候補（の情報）を記憶しており、その複数の選択規則の候補を、順次、注目選択規則として選択する。そして、タップ構造選択部３５１は、注目選択規則を表す選択規則を、記憶部３５３に供給する。

また、タップ構造選択部３５１には、生徒データとしての復号途中画像、及び、符号化情報が供給される。

タップ構造選択部３５１は、復号途中画像、及び、符号化情報の一方又は両方を、取得可能情報として用い、注目選択規則に従って、あらかじめ決められている複数のタップ構造の中から１つのタップ構造を、注目タップ構造として選択する。そして、タップ構造選択部３５１は、注目タップ構造を表すタップ構造情報を、学習部１５２（のタップ選択部１６２）に供給する。

学習部１５２では、タップ構造選択部３５１からのタップ構造情報が表す注目タップ構造のクラスタップを用いたタップ係数学習が、図１１の場合と同様に行われ、クラスごとのタップ係数が求められる。

したがって、図３１では、学習部１５２において、タップ構造選択部３５１に記憶された複数の選択規則に従って選択されるタップ構造それぞれについて、タップ係数学習が行われ、クラスごとのタップ係数が求められる。

そして、学習部１５２が、複数の選択規則それぞれについて、タップ係数学習を行うことにより得られるクラスごとのタップ係数は、記憶部３５３に供給される。

記憶部３５３は、タップ構造選択部３５１から供給される、注目選択規則に選択された選択規則と、学習部１５２から供給される注目選択規則についてのクラスごとのタップ係数とを対応付けて記憶する。

評価値算出部３５４は、タップ構造選択部３５１に記憶された複数の選択規則それぞれについて、その選択規則に従って選択されるタップ構造のクラスタップをクラス分類に用いる適切さを表すタップ構造評価値を求め、選択部３５５に供給する。

評価値算出部３５４には、学習部１５２に供給されるのと同様の生徒データとしての復号途中画像、教師データとしての元画像、及び、符号化情報が供給される。

評価値算出部３５４は、算出部１７２及び画像変換部３７１を有する。

したがって、評価値算出部３５４は、算出部１７２を有する点で、図１１の評価値算出部１５４と同様に構成される。

但し、評価値算出部３５４は、画像変換部１７１に代えて、画像変換部３７１を有する点で、図１１の評価値算出部１５４と相違する。

画像変換部３７１は、評価値算出部３５４に供給される復号途中画像を第１の画像として、クラス分類適応処理を行うことにより、第１の画像としての復号途中画像を、第２の画像としての元画像に相当する相当画像に変換し、算出部１７２に供給する。

すなわち、画像変換部３７１は、記憶部３５３に記憶された複数の選択規則それぞれについて、選択規則と、その選択規則に対応付けられているクラスごとのタップ係数とを用いて、クラス分類適応処理を行う。

具体的には、画像変換部３７１は、記憶部３５３に記憶されている複数の選択規則それぞれについて、その選択規則に従い、復号途中画像や符号化情報を用いて、クラスタップのタップ構造を選択する。さらに、画像変換部３７１は、選択規則に従って選択したタップ構造のクラスタップを構成し、選択規則に対応付けられているクラスごとのタップ係数を用いたフィルタ処理（ここでは、例えば、式（１）の予測演算）を施すクラス分類適応処理を行う。

そして、画像変換部３７１は、複数の選択規則それぞれについて得られる相当画像を、算出部１７２に供給する。

算出部１７２では、画像変換部３７１からの、複数の選択規則それぞれについて、その選択規則に従って選択されたタップ構造のクラスタップを用いて得られた相当画像と、教師データとしての元画像とを用いて、図１１の場合と同様に、タップ構造評価値が求められ選択部３５５に供給される。

選択部３５５は、記憶部３５３に記憶された選択規則の中から、評価値算出部３５４（の算出部１７２）から供給されるタップ構造評価値が最良の選択規則を、最適選択規則として選択する。さらに、選択部３５５は、記憶部３５３に記憶されたクラスごとのタップ係数の中から、最適選択規則に対応付けられたクラスごとのタップ係数を選択する。

そして、選択部３５５は、最適選択規則と、最適選択規則に対応付けられたクラスごとのタップ係数とを、フィルタ情報生成部３３２に供給する。

なお、学習装置３３１において、最適選択規則と、その最適選択規則に対応付けられたクラスごとのタップ係数とを求める処理は、例えば、図２９で説明したタップ構造更新単位と同様の単位（タイミング）で行うことができる。

図３２は、図３１の画像変換部３７１の構成例を示すブロック図である。

なお、図中、図１７の画像変換部１７１の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図３２において、画像変換部３７１は、タップ選択部１８１ないし予測演算部１８５、及び、タップ構造選択部３８１を有する。

したがって、画像変換部３７１は、タップ選択部１８１ないし予測演算部１８５を有する点で、図１７の画像変換部１７１と共通する。

但し、画像変換部３７１は、タップ構造選択部３８１が新たに設けられている点で、図１７の画像変換部１７１と相違する。

画像変換部３７１には、学習部１５２（図３１）に供給されるのと同様の生徒データとしての復号途中画像、及び、符号化情報が供給される。画像変換部３７１では、生徒データとしての復号途中画像を用いるとともに、符号化情報を必要に応じて用いて、クラス分類適応処理が行われ、教師データとしての元画像に相当する相当画像が求められる。

但し、画像変換部３７１において、タップ構造選択部３８１及び係数取得部１８４には、記憶部３５３（図３１）に記憶された選択規則、及び、その選択規則に対応付けられたクラスごとのタップ係数が、それぞれ供給される。

タップ構造選択部３８１は、図３１のタップ構造選択部３５１と同様に、復号途中画像、及び、符号化情報の一方又は両方を、取得可能情報として用い、記憶部３５３からの選択規則に従って、クラスタップのタップ構造を選択し、そのタップ構造を表すタップ構造情報を、タップ選択部１８２に供給する。

タップ選択部１８２は、タップ構造選択部３８１からのタップ構造情報が表すタップ構造のクラスタップを構成する。

係数取得部１８４は、記憶部３５３（図３１）からのクラスごとのタップ係数を記憶し、そのクラスごとのタップ係数から、注目画素のクラスのタップ係数を取得して、予測演算部１８５に供給する。

＜学習装置３３１の処理＞

図３３は、図３１の学習装置３３１の処理の例を説明するフローチャートである。

ステップＳ２１１において、タップ構造選択部３５１は、あらかじめ決められた複数の選択規則の候補の中で、まだ、注目選択規則としていない選択規則の候補の１つを、注目選択規則として選択する。そして、タップ構造選択部３５１は、注目選択規則を表す選択規則を、記憶部３５３に供給（出力）し、処理は、ステップＳ２１１からステップＳ２１２に進む。

ステップＳ２１２では、タップ構造選択部３５１は、復号途中画像、及び、符号化情報の一方又は両方を、取得可能情報として用い、注目選択規則に従って、例えば、あらかじめ決められている複数のタップ構造の中から１つのタップ構造を、注目タップ構造として選択する。そして、タップ構造選択部３５１は、注目タップ構造を表すタップ構造情報を、学習部１５２のタップ選択部１６２に供給（出力）し、処理は、ステップＳ２１２からステップＳ２１３に進む。

ステップＳ２１３では、学習部１５２が、生徒データとしての復号途中画像、及び、教師データとしての元画像を用いるとともに、符号化情報を必要に応じて用いて、タップ係数学習を行い、クラスごとのタップ係数を求める。

学習部１５２でのタップ係数学習では、クラス分類が、タップ構造選択部３５１からタップ選択部１６２に供給される注目選択規則に従って選択されたタップ構造のクラスタップを用いて行われ、そのようなクラス分類により得られるクラスに対するタップ係数が求められる。

学習部１５２は、注目選択規則に従って選択されたタップ構造のクラスタップを用いたクラス分類により得られるクラスに対するクラスごとのタップ係数を、記憶部３５３に供給し、処理は、ステップＳ２１３からステップＳ２１４に進む。

ステップＳ２１４では、記憶部３５３は、タップ構造選択部３５１からの注目選択規則と、学習部１５２からの、注目選択規則に従って選択されたタップ構造のクラスタップを用いたクラス分類により得られるクラスごとのタップ係数とを対応付けて記憶し、処理は、ステップＳ２１５に進む。

ステップＳ２１５では、タップ構造選択部３５１は、あらかじめ決められた複数の選択規則の候補の中で、まだ、注目選択規則としていない選択規則の候補があるかどうかを判定する。

ステップＳ２１５において、あらかじめ決められた複数の選択規則の候補の中で、まだ、注目選択規則としていない選択規則の候補があると判定された場合、処理は、ステップＳ２１１に戻り、以下、同様の処理が繰り返される。

また、ステップＳ２１５において、あらかじめ決められた複数の選択規則の候補の中で、注目選択規則としていない選択規則の候補がないと判定された場合、すなわち、あらかじめ決められた複数の選択規則（の候補）それぞれについて、選択規則と、その選択規則に従って選択されたタップ構造のクラスタップを用いたクラス分類により得られるクラスごとのタップ係数とが対応付けられて、記憶部３５３に記憶された場合、処理は、ステップＳ２１６に進む。

ステップＳ２１６では、評価値算出部３５４において、画像変換部３７１が、記憶部３５３に記憶された複数の選択規則（タップ構造選択部３５１に記憶されている複数の選択規則（の候補））それぞれについて、その選択規則と、その選択規則に対応付けられているクラスごとのタップ係数とを用い、生徒データとしての復号途中画像を対象に、クラス分類適応処理を行って、教師データとしての元画像に相当する相当画像を求める。

さらに、評価値算出部３５４では、算出部１７２が、複数の選択規則それぞれについて、その選択規則に対応付けられているクラスごとのタップ係数を用いて得られた相当画像のS/Nに対応する値等を、タップ構造評価値として求め、選択部３５５に供給する。

そして、処理は、ステップＳ２１６からステップＳ２１７に進み、選択部３５５は、記憶部３５３に記憶された選択規則の中から、評価値算出部３５４の算出部１７２から供給されるタップ構造評価値が最良の選択規則を、最適選択規則として選択する。さらに、選択部３５５は、記憶部３５３に記憶されたクラスごとのタップ係数の中から、最適選択規則に対応付けられたクラスごとのタップ係数を選択する。

選択部３５５は、最適選択規則と、最適選択規則に対応付けられたクラスごとのタップ係数とを、フィルタ情報生成部３３２に供給し、処理は終了する。

＜画像変換装置３３３の構成例＞

図３４は、図２９の画像変換装置３３３の構成例を示すブロック図である。

なお、図中、図１９の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図３４において、画像変換装置３３３は、タップ選択部１９１ないし予測演算部１９５、及び、タップ構造選択部３９１を有する。

したがって、画像変換装置３３３は、タップ選択部１９１ないし予測演算部１９５を有する点で、図１９の画像変換装置１３３と共通する。

但し、画像変換装置３３３は、タップ構造選択部３９１が新たに設けられている点で、図１９の画像変換装置１３３と相違する。

画像変換装置３３３には、第１の画像としての復号途中画像、及び、符号化情報が供給される。画像変換装置３３３では、第１の画像としての復号途中画像を用いるとともに、符号化情報を必要に応じて用いて、図３２の画像変換部３７１と同様のクラス分類適応処理が行われ、元画像に相当する第２の画像としてのフィルタ後画像が求められる。

但し、画像変換装置３３３において、タップ構造選択部３９１及び係数取得部１９４には、フィルタ情報生成部３３２（図２９）からフィルタ情報が供給される。

タップ構造選択部３９１は、図３１のタップ構造選択部３５１や、図３２のタップ構造選択部３８１と同様に、復号途中画像、及び、符号化情報の一方又は両方を、取得可能情報として用い、フィルタ情報生成部３３２からのフィルタ情報に含まれる選択規則（最適選択規則）に従って、クラスタップのタップ構造を選択し、そのタップ構造を表すタップ構造情報を、タップ選択部１９２に供給する。

タップ選択部１９２は、タップ構造選択部３９１からのタップ構造情報が表すタップ構造のクラスタップ、すなわち、最適選択規則に従って選択されたタップ構造のクラスタップを構成する。

係数取得部１９４は、フィルタ情報生成部３３２からのフィルタ情報に含まれるクラスごとのタップ係数を記憶し、そのクラスごとのタップ係数から、注目画素のクラスのタップ係数を取得して、予測演算部１９５に供給する。

なお、フィルタ情報生成部３３２から画像変換装置３３３に供給されるフィルタ情報には、図２９で説明したように、コピー情報を含ませることができる。

フィルタ情報生成部３３２から画像変換装置３３３に供給された最新のフィルタ情報に含まれるコピー情報がコピーモード（ここでは、選択規則及びクラスごとのタップ係数として、直前の選択規則及びタップ係数の更新時と同一の選択規則及びクラスごとのタップ係数を用いること）を表していない場合、タップ選択部１９２は、フィルタ情報生成部３３２から画像変換装置３３３に供給された前回のフィルタ情報に含まれる選択規則に従って選択されたタップ構造に代えて、最新のフィルタ情報に含まれる選択規則に従って選択されたタップ構造を、クラスタップのタップ構造として採用する。

一方、最新のフィルタ情報に含まれるコピー情報がコピーモードを表す場合、タップ選択部１９２は、前回のフィルタ情報に含まれる選択規則に従って選択されたタップ構造を、そのまま、クラスタップのタップ構造として採用する。

以上のように、最新のフィルタ情報に含まれるコピー情報がコピーモードを表す場合には、直前のクラスタップのタップ構造、及び、クラスごとのタップ係数が維持される。

＜符号化処理＞

図３５は、図２８の符号化装置１１の符号化処理の例を説明するフローチャートである。

符号化装置１１において、クラス分類適応フィルタ３１１の学習装置３３１（図２９）は、図１０の学習装置１３１と同様に、そこに供給される復号途中画像のうちの、例えば、複数のフレーム、１フレーム、ブロック等のタップ構造更新単位の復号途中画像を生徒データとするとともに、その復号途中画像に対応する元画像を教師データとして、随時、タップ係数学習を行っている。そして、学習装置３３１は、ステップＳ２３１において、図２０のステップＳ３１と同様に、クラスタップのタップ構造の更新タイミングであるかどうかを判定する。

ステップＳ２３１において、クラスタップのタップ構造の更新タイミングでないと判定された場合、処理は、ステップＳ２３２ないしＳ２３４をスキップして、ステップＳ２３５に進む。

また、ステップＳ２３１において、クラスタップのタップ構造の更新タイミングであると判定された場合、処理は、ステップＳ２３２に進む。

ステップＳ２３２では、フィルタ情報生成部３３２（図２９）は、学習装置３３１がタップ係数学習により生成する最新の選択規則及びクラスごとのタップ係数（又はコピー情報）、すなわち、最適選択規則、及び、最適選択規則に対応付けられたクラスごとのタップ係数を含むフィルタ情報を生成し、画像変換装置３３３（図２９）及び可逆符号化部１０６（図２８）に供給して、処理は、ステップＳ２３３に進む。

ステップＳ２３３では、画像変換装置３３３は、フィルタ情報生成部３３２からのフィルタ情報に従って、タップ構造選択部３９１で用いる選択規則、及び、係数取得部１９４に記憶されるクラスごとのタップ係数を更新し、処理は、ステップＳ２３４に進む。

ステップＳ２３４では、可逆符号化部１０６は、フィルタ情報生成部３３２から供給されるフィルタ情報を、伝送対象に設定して、処理は、ステップＳ２３５に進む。伝送対象に設定されたフィルタ情報は、後述するステップＳ２４８において符号化データに含められて伝送される。

なお、図２０のステップＳ３２ないしＳ３４と同様に、ステップＳ３２２ないしＳ３２４の処理は、元画像の時間方向の相関が低い場合の更新タイミングで行うことができる。

ステップＳ２３５ないしＳ２５０では、図２０のステップＳ３５ないしＳ５０とそれぞれ同様の元画像の予測符号化処理が行われる。

但し、ステップＳ２４６のクラス分類適応処理では、フィルタ情報生成部３３２で生成されたフィルタ情報に含まれる選択規則（最適選択規則）に従って、クラスタップのタップ構造が選択される。さらに、ステップＳ２４６のクラス分類適応処理は、フィルタ情報生成部３３２で生成されたフィルタ情報に含まれるクラスごとのタップ係数を用いて行われる。

また、ステップＳ２４８では、可逆符号化部１０６は、図２０のステップＳ４８と同様に、量子化係数、符号化情報、及び、フィルタ情報を符号化するが、そのフィルタ情報には、選択規則とクラスごとのタップ係数とが含まれる。

したがって、可逆符号化部１０６で得られる符号化データには、量子化係数、符号化情報、及び、フィルタ情報としての選択規則とクラスごとのタップ係数とが含まれる。そして、かかる符号化データは、ステップＳ２４９で、図２０のステップＳ４９で説明したように、蓄積バッファ１０７から、適宜読み出されて伝送される。

図３６は、図３５のステップＳ２４６で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ３１１の画像変換装置３３３（図３４）では、ステップＳ２６１において、タップ選択部１９１が、図２１のステップＳ６１と同様に、演算部１１０から供給される復号途中画像から、注目画素を選択し、処理は、ステップＳ２６２に進む。

ステップＳ２６２では、タップ選択部１９１が、図２１のステップＳ６２と同様に、演算部１１０から供給される復号途中画像から、注目画素についての予測タップとする画素を選択し、予測タップを構成する。そして、タップ選択部１９１は、予測タップを、予測演算部１９５に供給して、処理は、ステップＳ２６３に進む。

ステップＳ２６３では、タップ構造選択部３９１が、フィルタ情報生成部３３２（図２９）からのフィルタ情報に含まれる選択規則に従い、演算部１１０から供給される復号途中画像等を用いて、クラスタップのタップ構造を選択し、そのタップ構造を表すタップ構造情報を、タップ選択部１９２に出力して、処理は、ステップＳ２６４に進む。

ステップＳ２６４では、タップ選択部１９２が、タップ構造選択部３９１からのタップ構造情報に従い、そのタップ構造情報が表すタップ構造のクラスタップを構成する。そして、タップ選択部１９２は、クラスタップを、クラス分類部１９３に供給する。

すなわち、タップ構造選択部３９１が用いる選択規則は、直前に行われた図３５のステップＳ２３３で更新されており、タップ選択部１９２では、更新後の選択規則に従って選択されたタップ構造のクラスタップを構成して、クラス分類部１９３に供給する。

その後、処理は、ステップＳ２６４からステップＳ２６５に進み、クラス分類部１９３は、注目画素についてのクラスタップを用いるとともに、注目画素についての符号化情報を必要に応じて用いて、注目画素のクラス分類を行う。そして、クラス分類部１９３は、クラス分類により得られる注目画素のクラスを、係数取得部１９４に供給して、処理は、ステップＳ２６５からステップＳ２６６に進む。

係数取得部１９４は、フィルタ情報生成部３３２から供給されるフィルタ情報に含まれるクラスごとのタップ係数、すなわち、タップ選択部１９２で構成されたクラスタップのタップ構造を選択する選択規則に対応付けられたクラスごとのタップ係数を、直前に行われた図３５のステップＳ２３３で行われるタップ係数の更新によって記憶している。ステップＳ２６６では、係数取得部１９４は、記憶しているクラスごとのタップ係数から、クラス分類部１９３から供給される注目画素のクラスのタップ係数を取得し、予測演算部１９５に供給して、処理は、ステップＳ２６７に進む。

ステップＳ２６７ないしＳ２６９では、図２１のステップＳ６６ないしＳ６８とそれぞれ同様の処理が行われ、処理はリターンする。

＜復号装置１２の第２の構成例＞

図３７は、図１の復号装置１２の第２の構成例を示すブロック図である。

なお、図中、図２２の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図３７において、復号装置１２は、蓄積バッファ２０１、可逆復号部２０２、逆量子化部２０３、逆直交変換部２０４、演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、フレームメモリ２１０、選択部２１１、イントラ予測部２１２、動き予測補償部２１３、及び、選択部２１４を有する。さらに、復号装置１２は、クラス分類適応フィルタ４０１を有する。

したがって、図３７の復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、及び、フレームメモリ２１０ないし選択部２１４を有する点で、図２２の場合と共通する。

但し、図３７の復号装置１２は、クラス分類適応フィルタ２０６に代えて、クラス分類適応フィルタ４０１を有する点で、図２２の場合と相違する。

クラス分類適応フィルタ４０１は、クラス分類適応フィルタ２０６と同様に、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF処理を行う。

すなわち、クラス分類適応フィルタ４０１は、演算部２０５からの復号途中画像を第１の画像として、可逆復号部２０２からのフィルタ情報に含まれるクラスごとのタップ係数を用いたクラス分類適応処理（による画像変換）を、可逆復号部２０２からの符号化情報を必要に応じて用いて行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）出力する。

なお、クラス分類適応フィルタ４０１は、クラス分類適応処理において、クラス分類に用いるクラスタップのタップ構造を、可逆復号部２０２からのフィルタ情報に含まれる選択規則に従い、取得可能情報としての演算部２０５からの復号途中画像や、可逆復号部２０２からの符号化情報を用いて選択する。

＜クラス分類適応フィルタ４０１の構成例＞

図３８は、図３７のクラス分類適応フィルタ４０１の構成例を示すブロック図である。

図３８において、クラス分類適応フィルタ４０１は、画像変換装置４３１を有する。

画像変換装置４３１には、演算部２０５（図３７）から復号途中画像が供給されるとともに、可逆復号部２０２からフィルタ情報、及び、符号化情報が供給される。

画像変換装置４３１は、図２９の画像変換装置３３３と同様に、復号途中画像を第１の画像として、フィルタ情報に含まれる選択規則に従って選択されるタップ構造のクラスタップを用いたクラス分類を行い、フィルタ情報に含まれるクラスごとのタップ係数を用いたフィルタ処理としての予測演算を行うクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、並べ替えバッファ２０７及びフレームメモリ２１０（図３７）に供給する。

なお、画像変換装置４３１は、クラス分類適応処理において、図２９の画像変換装置３３３と同様に、クラス分類を、必要に応じて、符号化情報を用いて行う。

＜画像変換装置４３１の構成例＞

図３９は、図３８の画像変換装置４３１の構成例を示すブロック図である。

なお、図中、図２４の画像変換装置２３１の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図３９において、画像変換装置４３１は、タップ選択部２４１ないし予測演算部２４５、及び、タップ構造選択部４５１を有する。

したがって、画像変換装置４３１は、タップ選択部２４１ないし予測演算部２４５を有する点で、図２４の画像変換装置２３１と共通する。

但し、画像変換装置４３１は、タップ構造選択部４５１が新たに設けられている点で、図２４の画像変換装置２３１と相違する。

画像変換装置４３１には、可逆復号部２０２（図３７）から第１の画像としての復号途中画像、及び、符号化情報が供給される。画像変換装置４３１では、第１の画像としての復号途中画像を用いるとともに、符号化情報を必要に応じて用いて、図３４の画像変換装置３３３と同様のクラス分類適応処理が行われ、元画像に相当する第２の画像としてのフィルタ後画像が求められる。

すなわち、画像変換装置４３１において、タップ構造選択部４５１及び係数取得部２４４には、可逆復号部２０２（図３７）からフィルタ情報が供給される。

タップ構造選択部４５１は、図３４のタップ構造選択部３９１と同様に、復号途中画像、及び、符号化情報の一方又は両方を、取得可能情報として用い、可逆復号部２０２からのフィルタ情報に含まれる選択規則（最適選択規則）に従って、クラスタップのタップ構造を選択し、そのタップ構造を表すタップ構造情報を、タップ選択部２４２に供給する。

タップ選択部２４２は、タップ構造選択部４５１からのタップ構造情報が表すタップ構造のクラスタップ、すなわち、最適選択規則に従って選択されたタップ構造のクラスタップを構成する。

係数取得部２４４は、可逆復号部２０２からのフィルタ情報に含まれるクラスごとのタップ係数を記憶し、そのクラスごとのタップ係数から、注目画素のクラスのタップ係数を取得して、予測演算部１９５に供給する。

なお、可逆復号部２０２から画像変換装置４３１に供給されるフィルタ情報には、図２９で説明したように、クラスごとのタップ係数及び選択規則に代えて、又は、クラスごとのタップ係数及び選択規則とともに、コピー情報を含ませることができる。

可逆復号部２０２から画像変換装置４３１に供給された最新のフィルタ情報に含まれるコピー情報がコピーモードを表していない場合、タップ選択部２４２は、可逆復号部２０２から画像変換装置４３１に供給された前回のフィルタ情報に含まれる選択規則に従って選択されたタップ構造に代えて、最新のフィルタ情報に含まれる選択規則に従って選択されたタップ構造を、クラスタップのタップ構造として採用する。

一方、最新のフィルタ情報に含まれるコピー情報がコピーモードを表す場合、タップ選択部２４２は、前回のフィルタ情報に含まれるタップ構造を、そのまま、クラスタップのタップ構造として採用する。

＜復号処理＞

図４０は、図３７の復号装置１２の復号処理の例を説明するフローチャートである。

ステップＳ３１１ないしＳ３１５において、図２５のステップＳ１１１ないしＳ１１５とそれぞれ同様の処理が行われる。

そして、ステップＳ３１５において、クラスタップのタップ構造の更新タイミングでないと判定された場合、処理は、ステップＳ３１６をスキップして、ステップＳ３１７に進む。

また、ステップＳ３１５において、クラスタップのタップ構造の更新タイミングであると判定された場合、処理は、ステップＳ３１６に進む。

ステップＳ３１６では、画像変換装置４３１は、直前のステップＳ３１４で取得したフィルタ情報に従って、タップ構造選択部４５１で用いる選択規則、及び、係数取得部２４４に記憶されるクラスごとのタップ係数を更新し、処理は、ステップＳ３１７に進む。

ステップＳ３１７ないしＳ３２５では、図２５のステップＳ１１７ないしＳ１２５とそれぞれ同様の処理が行われる。

但し、ステップＳ３２２のクラス分類適応処理では、可逆復号部２０２から供給されるフィルタ情報に含まれる選択規則（最適選択規則）に従って、クラスタップのタップ構造が選択される。さらに、ステップＳ３２２のクラス分類適応処理は、可逆復号部２０２から供給されるフィルタ情報に含まれるクラスごとのタップ係数を用いて行われる。

図４１は、図４０のステップＳ３２２で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ４０１の画像変換装置４３１（図３９）では、ステップＳ３３１において、タップ選択部２４１が、図２６のＳ１３１と同様に、演算部２０５（図３７）から供給される復号途中画像（としてのブロック）の画素から、注目画素を選択し、処理は、ステップＳ３３２に進む。

ステップＳ３３２において、タップ選択部２４１が、図２６のステップＳ１３２と同様に、演算部２０５から供給される復号途中画像から、注目画素についての予測タップとする画素を選択し、予測タップを構成する。そして、タップ選択部２４１は、予測タップを、予測演算部２４５に供給して、処理は、ステップＳ３３２からステップＳ３３３に進む。

ステップＳ３３３では、タップ構造選択部４５１が、可逆復号部２０２（図３７）からのフィルタ情報に含まれる選択規則に従い、演算部２０５から供給される復号途中画像等を用いて、クラスタップのタップ構造を選択する。さらに、タップ構造選択部４５１は、選択規則に従って選択したクラスタップのタップ構造を表すタップ構造情報を、タップ選択部２４２に出力し、処理は、ステップＳ３３４に進む。

ステップＳ３３４では、タップ選択部２４２が、演算部２０５から供給される復号途中画像から、注目画素についてのクラスタップとする画素を選択し、これにより、タップ構造選択部４５１からのタップ構造情報が表すタップ構造のクラスタップを構成する。そして、タップ選択部２４２は、クラスタップを、クラス分類部２４３に供給する。

すなわち、タップ構造選択部４５１が用いる選択規則は、直前に行われた図４０のステップＳ３１６で更新されており、タップ選択部２４２では、更新後の選択規則に従って選択されたタップ構造のクラスタップを構成して、クラス分類部２４３に供給する。

その後、処理は、ステップＳ３３４からステップＳ３３５に進み、クラス分類部２４３は、注目画素についてのクラスタップを用いるとともに、注目画素についての符号化情報を必要に応じて用いて、注目画素のクラス分類を行う。そして、クラス分類部２４３は、クラス分類により得られる注目画素のクラスを、係数取得部２４４に供給して、処理は、ステップＳ３３５からステップＳ３３６に進む。

係数取得部２４４は、可逆復号部２０２（図３７）から供給されるフィルタ情報に含まれるクラスごとのタップ係数を、直前に行われた図４０のステップＳ３１６のタップ係数の更新によって記憶している。ステップＳ３３６では、係数取得部２４４は、記憶しているクラスごとのタップ係数から、クラス分類部２４３から供給される注目画素のクラスのタップ係数を取得し、予測演算部２４５に供給して、処理は、ステップＳ３３７に進む。

ステップＳ３３７ないしＳ３３９では、図２６のステップＳ１３６ないしＳ１３８とそれぞれ同様の処理が行われ、処理はリターンする。

ここで、図９の符号化装置１１及び図２２の復号装置１２の第１の構成例では、タップ構造情報に従い、そのタップ構造情報が表すタップ構造に、クラスタップのタップ構造を制御する。

以上のように、符号化装置１１及び復号装置１２において、タップ構造情報に従い、そのタップ構造情報が表すタップ構造に、クラスタップのタップ構造を制御するタップ構造の制御モードを、モード１ということとする。

また、図２８の符号化装置１１及び図３７の復号装置１２の第２の構成例では、選択規則に従い、取得可能情報を用いて選択されたタップ構造に、クラスタップのタップ構造を制御する。

以上のように、符号化装置１１及び復号装置１２において、選択規則に従い、取得可能情報を用いて選択されたタップ構造に、クラスタップのタップ構造を制御するタップ構造の制御モードを、モード２ということとする。

フィルタ情報には、制御モードを表すモード情報（例えば、１ビットのフラグ等）を含めることができる。さらに、符号化装置１１では、制御モードを、適宜、モード１及び２のうちの一方から他方に切り替え、復号装置１２では、フィルタ情報に含まれる制御モードに従って、制御モードを切り替えることができる。

また、上述のモード２では、複数の選択規則のうちの、タップ構造評価値が最良の選択規則を、最適選択規則として、フィルタ情報に含めて、符号化装置１１から復号装置１２に伝送することとしたが、符号化装置１１及び復号装置１２で用いる選択規則は、あらかじめ固定の規則に決定しておくことができる。この場合、符号化装置１１及び復号装置１２では、あらかじめ決定された選択規則に従い、取得可能情報を用いて、クラスタップのタップ構造を選択する。この場合、選択規則は、フィルタ情報に含めて伝送する必要はない。

また、モード２において、選択規則を、あらかじめ決定しておく場合には、その選択規則に従い、取得可能情報を用いてタップ構造を選択して、クラスタップのタップ構造を更新するタイミングは、あらかじめ決定されたタイミングに固定することができる。この場合、符号化装置１１及び復号装置１２において、あらかじめタップ係数を共有しておけば、その後は、あらかじめ決定された固定のタイミングで、あらかじめ決定された固定の選択規則に従い、クラスタップのタップ構造を更新すれば良いので、フィルタ情報を、符号化装置１１から復号装置１２に伝送する必要がない。

なお、符号化装置１１において、フィルタ情報を伝送する場合には、復号装置１２は、フィルタ情報の受信に応じて、クラスタップのタップ構造の更新タイミングを認識することができる。この場合、フィルタ情報は、クラスタップのタップ構造の更新タイミングを報知する情報として機能する。符号化装置１１から復号装置１２に対して、更新タイミングを報知しない場合、更新タイミングは、固定のタイミングにあらかじめ決めておく必要がある。

また、上述の場合には、注目画素のクラス分類を行うことにより得られる注目画素のクラスに対応するフィルタ処理として、注目画素のクラスのタップ係数を用いた式（１）の予測演算を採用したが、注目画素のクラスに対応するフィルタ処理としては、式（１）の予測演算以外の任意のフィルタ処理を採用することができる。すなわち、クラス分類によって分類し得る各クラスに、そのクラスに対応するフィルタを用意しておき、注目画素のクラスに対応するフィルタ処理としては、注目画素のクラスに対応するフィルタによるフィルタリングを行うことができる。

なお、本実施の形態では、説明を簡単にするために、符号化装置１１から復号装置１２に提供するフィルタ情報には、タップ係数そのものを含めることとしたが、フィルタ情報には、タップ係数そのものに代えて、種係数及びパラメータzを含めることができる。タップ係数は、種係数及びパラメータzから求めることができるので、種係数及びパラメータzは、タップ係数と等価な情報であり、本明細書では、フィルタ情報としてのタップ係数には、タップ係数そのものの他、種係数及びパラメータzが含まれる。タップ係数として、種係数及びパラメータzを採用する場合、パラメータzとしては、例えば、取得可能情報を採用することができる。

＜多視点画像符号化・復号システムへの適用＞

上述した一連の処理は、多視点画像符号化・復号システムに適用することができる。

図４２は、多視点画像符号化方式の一例を示す図である。

図４２に示されるように、多視点画像は、複数の視点（ビュー（view））の画像を含む。この多視点画像の複数のビューは、他のビューの情報を利用せずに自身のビューの画像のみを用いて符号化・復号を行うベースビューと、他のビューの情報を利用して符号化・復号を行うノンベースビューとによりなる。ノンベースビューの符号化・復号は、ベースビューの情報を利用するようにしても良いし、他のノンベースビューの情報を利用するようにしてもよい。

図４２の例のような多視点画像を符号化・復号する場合、多視点画像は、視点毎に符号化される。そして、そのようにして得られた符号化データを復号する場合、各視点の符号化データは、それぞれ（すなわち視点毎に）復号される。このような各視点の符号化・復号に対して、以上の実施の形態において説明した方法を適用してもよい。このようにすることにより、S/N及び圧縮効率を、大きく改善することができる。つまり、多視点画像の場合も同様に、S/N及び圧縮効率を、大きく改善することができる。

＜多視点画像符号化・復号システム＞

図４３は、上述した多視点画像符号化・復号を行う多視点画像符号化・復号システムの、多視点画像符号化装置を示す図である。

図４３に示されるように、多視点画像符号化装置１０００は、符号化部１００１、符号化部１００２、及び多重化部１００３を有する。

符号化部１００１は、ベースビュー画像を符号化し、ベースビュー画像符号化ストリームを生成する。符号化部１００２は、ノンベースビュー画像を符号化し、ノンベースビュー画像符号化ストリームを生成する。多重化部１００３は、符号化部１００１において生成されたベースビュー画像符号化ストリームと、符号化部１００２において生成されたノンベースビュー画像符号化ストリームとを多重化し、多視点画像符号化ストリームを生成する。

図４４は、上述した多視点画像復号を行う多視点画像復号装置を示す図である。

図４４に示されるように、多視点画像復号装置１０１０は、逆多重化部１０１１、復号部１０１２、及び復号部１０１３を有する。

逆多重化部１０１１は、ベースビュー画像符号化ストリームとノンベースビュー画像符号化ストリームとが多重化された多視点画像符号化ストリームを逆多重化し、ベースビュー画像符号化ストリームと、ノンベースビュー画像符号化ストリームとを抽出する。復号部１０１２は、逆多重化部１０１１により抽出されたベースビュー画像符号化ストリームを復号し、ベースビュー画像を得る。復号部１０１３は、逆多重化部１０１１により抽出されたノンベースビュー画像符号化ストリームを復号し、ノンベースビュー画像を得る。

例えば、このような多視点画像符号化・復号システムにおいて、多視点画像符号化装置１０００の符号化部１００１及び符号化部１００２として、以上の実施の形態において説明した符号化装置１１を適用してもよい。このようにすることにより、多視点画像の符号化においても、以上の実施の形態において説明した方法を適用することができる。すなわち、S/N及び圧縮効率を大きく改善することができる。また例えば、多視点画像復号装置１０１０の復号部１０１２及び復号部１０１３として、以上の実施の形態において説明した復号装置１２を適用してもよい。このようにすることにより、多視点画像の符号化データの復号においても、以上の実施の形態において説明した方法を適用することができる。すなわち、S/N及び圧縮効率を大きく改善することができる。

＜階層画像符号化・復号システムへの適用＞

また、上述した一連の処理は、階層画像符号化（スケーラブル符号化）・復号システムに適用することができる。

図４５は、階層画像符号化方式の一例を示す図である。

階層画像符号化（スケーラブル符号化）は、画像データを、所定のパラメータについてスケーラビリティ（scalability）機能を有するように、画像を複数レイヤ化（階層化）し、レイヤ毎に符号化するものである。階層画像復号（スケーラブル復号）は、その階層画像符号化に対応する復号である。

図４５に示されるように、画像の階層化においては、スケーラビリティ機能を有する所定のパラメータを基準として１の画像が複数の画像（レイヤ）に分割される。つまり、階層化された画像（階層画像）は、その所定のパラメータの値が互いに異なる複数の階層（レイヤ）の画像を含む。この階層画像の複数のレイヤは、他のレイヤの画像を利用せずに自身のレイヤの画像のみを用いて符号化・復号を行うベースレイヤと、他のレイヤの画像を利用して符号化・復号を行うノンベースレイヤ（エンハンスメントレイヤとも称する）とによりなる。ノンベースレイヤは、ベースレイヤの画像を利用するようにしても良いし、他のノンベースレイヤの画像を利用するようにしてもよい。

一般的に、ノンベースレイヤは、冗長性が低減されるように、自身の画像と、他のレイヤの画像との差分画像のデータ（差分データ）により構成される。例えば、１の画像をベースレイヤとノンベースレイヤ（エンハンスメントレイヤとも称する）に２階層化した場合、ベースレイヤのデータのみで元の画像よりも低品質な画像が得られ、ベースレイヤのデータとノンベースレイヤのデータを合成することで、元の画像（すなわち高品質な画像）が得られる。

このように画像を階層化することにより、状況に応じて多様な品質の画像を容易に得ることができる。例えば携帯電話のような、処理能力の低い端末に対しては、ベースレイヤ（base layer）のみの画像圧縮情報を伝送し、空間時間解像度の低い、或いは、画質の良くない動画像を再生し、テレビやパーソナルコンピュータのような、処理能力の高い端末に対しては、ベースレイヤ（base layer）に加えて、エンハンスメントレイヤ（enhancement layer）の画像圧縮情報を伝送し、空間時間解像度の高い、或いは、画質の高い動画像を再生するといったように、トランスコード処理を行うことなく、端末やネットワークの能力に応じた画像圧縮情報を、サーバから送信することが可能となる。

図４５の例のような階層画像を符号化・復号する場合、階層画像は、レイヤ毎に符号化される。そして、そのようにして得られた符号化データを復号する場合、各レイヤの符号化データは、それぞれ（すなわちレイヤ毎に）復号される。このような各レイヤの符号化・復号に対して、以上の実施の形態において説明した方法を適用してもよい。このようにすることにより、S/N及び圧縮効率を大きく改善することができる。つまり、階層画像の場合も同様に、S/N及び圧縮効率を大きく改善することができる。

＜スケーラブルなパラメータ＞
このような階層画像符号化・階層画像復号（スケーラブル符号化・スケーラブル復号）において、スケーラビリティ（scalability）機能を有するパラメータは、任意である。例えば、空間解像度をそのパラメータとしてもよい（spatial scalability）。このスペーシャルスケーラビリティ（spatial scalability）の場合、レイヤ毎に画像の解像度が異なる。

また、このようなスケーラビリティ性を持たせるパラメータとして、他には、例えば、時間解像度を適用しても良い（temporal scalability）。このテンポラルスケーラビリティ（temporal scalability）の場合、レイヤ毎にフレームレートが異なる。

さらに、このようなスケーラビリティ性を持たせるパラメータとして、例えば、信号雑音比（SNR（Signal to Noise ratio））を適用しても良い（SNR scalability）。このSNRスケーラビリティ（SNR scalability）の場合、レイヤ毎にSN比が異なる。

スケーラビリティ性を持たせるパラメータは、上述した例以外であっても、もちろんよい。例えば、ベースレイヤ（base layer）が８ビット（bit）画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、10ビット（bit）画像が得られるビット深度スケーラビリティ（bit-depth scalability）がある。

また、ベースレイヤ（base layer）が4:2:0フォーマットのコンポーネント画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、4:2:2フォーマットのコンポーネント画像が得られるクロマスケーラビリティ（chroma scalability）がある。

＜階層画像符号化・復号システム＞

図４６は、上述した階層画像符号化・復号を行う階層画像符号化・復号システムの、階層画像符号化装置を示す図である。

図４６に示されるように、階層画像符号化装置１０２０は、符号化部１０２１、符号化部１０２２、及び多重化部１０２３を有する。

符号化部１０２１は、ベースレイヤ画像を符号化し、ベースレイヤ画像符号化ストリームを生成する。符号化部１０２２は、ノンベースレイヤ画像を符号化し、ノンベースレイヤ画像符号化ストリームを生成する。多重化部１０２３は、符号化部１０２１において生成されたベースレイヤ画像符号化ストリームと、符号化部１０２２において生成されたノンベースレイヤ画像符号化ストリームとを多重化し、階層画像符号化ストリームを生成する。

図４７は、上述した階層画像復号を行う階層画像復号装置を示す図である。

図４７に示されるように、階層画像復号装置１０３０は、逆多重化部１０３１、復号部１０３２、及び復号部１０３３を有する。

逆多重化部１０３１は、ベースレイヤ画像符号化ストリームとノンベースレイヤ画像符号化ストリームとが多重化された階層画像符号化ストリームを逆多重化し、ベースレイヤ画像符号化ストリームと、ノンベースレイヤ画像符号化ストリームとを抽出する。復号部１０３２は、逆多重化部１０３１により抽出されたベースレイヤ画像符号化ストリームを復号し、ベースレイヤ画像を得る。復号部１０３３は、逆多重化部１０３１により抽出されたノンベースレイヤ画像符号化ストリームを復号し、ノンベースレイヤ画像を得る。

例えば、このような階層画像符号化・復号システムにおいて、階層画像符号化装置１０２０の符号化部１０２１及び符号化部１０２２として、以上の実施の形態において説明した符号化装置１１を適用してもよい。このようにすることにより、階層画像の符号化においても、以上の実施の形態において説明した方法を適用することができる。すなわち、S/N及び圧縮効率を大きく改善することができる。また例えば、階層画像復号装置１０３０の復号部１０３２及び復号部１０３３として、以上の実施の形態において説明した復号装置１２を適用してもよい。このようにすることにより、階層画像の符号化データの復号においても、以上の実施の形態において説明した方法を適用することができる。すなわち、S/N及び圧縮効率を大きく改善することができる。

＜コンピュータ＞

上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

図４８は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

図４８に示されるコンピュータ１１００において、CPU（Central Processing Unit）１１０１、ROM（Read Only Memory）１１０２、RAM（Random Access Memory）１１０３は、バス１１０４を介して相互に接続されている。

バス１１０４にはまた、入出力インタフェース１１１０も接続されている。入出力インタフェース１１１０には、入力部１１１１、出力部１１１２、記憶部１１１３、通信部１１１４、及びドライブ１１１５が接続されている。

入力部１１１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子等よりなる。出力部１１１２は、例えば、ディスプレイ、スピーカ、出力端子等よりなる。記憶部１１１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリ等よりなる。通信部１１１４は、例えば、ネットワークインタフェースよりなる。ドライブ１１１５は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブルメディア８２１を駆動する。

以上のように構成されるコンピュータでは、CPU１１０１が、例えば、記憶部１１１３に記憶されているプログラムを、入出力インタフェース１１１０及びバス１１０４を介して、RAM１１０３にロードして実行することにより、上述した一連の処理が行われる。RAM１１０３にはまた、CPU１１０１が各種の処理を実行する上において必要なデータ等も適宜記憶される。

コンピュータ（CPU１１０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア８２１に記録して適用することができる。その場合、プログラムは、リムーバブルメディア８２１をドライブ１１１５に装着することにより、入出力インタフェース１１１０を介して、記憶部１１１３にインストールすることができる。

また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部１１１４で受信し、記憶部１１１３にインストールすることができる。

その他、このプログラムは、ROM１１０２や記憶部１１１３に、あらかじめインストールしておくこともできる。

＜本技術の応用＞

上述した実施の形態に係る符号化装置１１や復号装置１２は、例えば、衛星放送、ケーブルＴＶ等の有線放送、インターネット上での配信、及びセルラー通信による端末への配信等における送信機や受信機、又は、光ディスク、磁気ディスク及びフラッシュメモリ等の媒体に画像を記録する記録装置や、これら記憶媒体から画像を再生する再生装置等の、様々な電子機器に応用され得る。以下、４つの応用例について説明する。

＜第１の応用例：テレビジョン受像機＞

図４９は、上述した実施の形態を適用したテレビジョン装置の概略的な構成の一例を示す図である。

テレビジョン装置１２００は、アンテナ１２０１、チューナ１２０２、デマルチプレクサ１２０３、デコーダ１２０４、映像信号処理部１２０５、表示部１２０６、音声信号処理部１２０７、スピーカ１２０８、外部インタフェース（I/F）部１２０９、制御部１２１０、ユーザインタフェース（I/F）部１２１１、及びバス１２１２を備える。

チューナ１２０２は、アンテナ１２０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ１２０２は、復調により得られた符号化ビットストリームをデマルチプレクサ１２０３へ出力する。すなわち、チューナ１２０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置１２００における伝送部としての役割を有する。

デマルチプレクサ１２０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ１２０４へ出力する。また、デマルチプレクサ１２０３は、符号化ビットストリームからEPG（Electronic Program Guide）等の補助的なデータを抽出し、抽出したデータを制御部１２１０に供給する。なお、デマルチプレクサ１２０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

デコーダ１２０４は、デマルチプレクサ１２０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ１２０４は、復号処理により生成される映像データを映像信号処理部１２０５へ出力する。また、デコーダ１２０４は、復号処理により生成される音声データを音声信号処理部１２０７へ出力する。

映像信号処理部１２０５は、デコーダ１２０４から入力される映像データを再生し、表示部１２０６に映像を表示させる。また、映像信号処理部１２０５は、ネットワークを介して供給されるアプリケーション画面を表示部１２０６に表示させてもよい。また、映像信号処理部１２０５は、映像データについて、設定に応じて、例えばノイズ除去等の追加的な処理を行ってもよい。さらに、映像信号処理部１２０５は、例えばメニュー、ボタン又はカーソル等のGUI（Graphical User Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

表示部１２０６は、映像信号処理部１２０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD（Organic ElectroLuminescence Display）（有機ELディスプレイ）等）の映像面上に映像又は画像を表示する。

音声信号処理部１２０７は、デコーダ１２０４から入力される音声データについてD/A変換及び増幅等の再生処理を行い、スピーカ１２０８から音声を出力させる。また、音声信号処理部１２０７は、音声データについてノイズ除去等の追加的な処理を行ってもよい。

外部インタフェース部１２０９は、テレビジョン装置１２００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース部１２０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ１２０４により復号されてもよい。すなわち、外部インタフェース部１２０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置１２００における伝送部としての役割を有する。

制御部１２１０は、CPU等のプロセッサ、並びにRAM及びROM等のメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータ等を記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置１２００の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部１２１１から入力される操作信号に応じて、テレビジョン装置１２００の動作を制御する。

ユーザインタフェース部１２１１は、制御部１２１０と接続される。ユーザインタフェース部１２１１は、例えば、ユーザがテレビジョン装置１２００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部等を有する。ユーザインタフェース部１２１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部１２１０へ出力する。

バス１２１２は、チューナ１２０２、デマルチプレクサ１２０３、デコーダ１２０４、映像信号処理部１２０５、音声信号処理部１２０７、外部インタフェース部１２０９及び制御部１２１０を相互に接続する。

このように構成されたテレビジョン装置１２００において、デコーダ１２０４が、上述した復号装置１２の機能を有するようにしてもよい。つまり、デコーダ１２０４が、符号化データを、以上の実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、テレビジョン装置１２００は、S/N及び圧縮効率を大きく改善することができる。

また、このように構成されたテレビジョン装置１２００において、映像信号処理部１２０５が、例えば、デコーダ１２０４から供給される画像データを符号化し、得られた符号化データを、外部インタフェース部１２０９を介してテレビジョン装置１２００の外部に出力させることができるようにしてもよい。そして、その映像信号処理部１２０５が、上述した符号化装置１１の機能を有するようにしてもよい。つまり、映像信号処理部１２０５が、デコーダ１２０４から供給される画像データを、以上の実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、テレビジョン装置１２００は、S/N及び圧縮効率を大きく改善することができる。

＜第２の応用例：携帯電話機＞

図５０は、上述した実施の形態を適用した携帯電話機の概略的な構成の一例を示す図である。

携帯電話機１２２０は、アンテナ１２２１、通信部１２２２、音声コーデック１２２３、スピーカ１２２４、マイクロホン１２２５、カメラ部１２２６、画像処理部１２２７、多重分離部１２２８、記録再生部１２２９、表示部１２３０、制御部１２３１、操作部１２３２、及びバス１２３３を備える。

アンテナ１２２１は、通信部１２２２に接続される。スピーカ１２２４及びマイクロホン１２２５は、音声コーデック１２２３に接続される。操作部１２３２は、制御部１２３１に接続される。バス１２３３は、通信部１２２２、音声コーデック１２２３、カメラ部１２２６、画像処理部１２２７、多重分離部１２２８、記録再生部１２２９、表示部１２３０、及び制御部１２３１を相互に接続する。

携帯電話機１２２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録等の動作を行う。

音声通話モードにおいて、マイクロホン１２２５により生成されるアナログ音声信号は、音声コーデック１２２３に供給される。音声コーデック１２２３は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック１２２３は、圧縮後の音声データを通信部１２２２へ出力する。通信部１２２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部１２２２は、生成した送信信号を、アンテナ１２２１を介して基地局（図示せず）へ送信する。また、通信部１２２２は、アンテナ１２２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部１２２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック１２２３へ出力する。音声コーデック１２２３は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック１２２３は、生成した音声信号をスピーカ１２２４に供給して音声を出力させる。

また、データ通信モードにおいて、例えば、制御部１２３１は、操作部１２３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部１２３１は、文字を表示部１２３０に表示させる。また、制御部１２３１は、操作部１２３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部１２２２へ出力する。通信部１２２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部１２２２は、生成した送信信号を、アンテナ１２２１を介して基地局（図示せず）へ送信する。また、通信部１２２２は、アンテナ１２２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部１２２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部１２３１へ出力する。制御部１２３１は、表示部１２３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部１２２９に供給し、その記憶媒体に書き込ませる。

記録再生部１２２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリ等の内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB（Universal Serial Bus）メモリ、又はメモリカード等の外部装着型の記憶媒体であってもよい。

また、撮影モードにおいて、例えば、カメラ部１２２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部１２２７へ出力する。画像処理部１２２７は、カメラ部１２２６から入力される画像データを符号化し、符号化ストリームを記録再生部１２２９に供給し、その記憶媒体に書き込ませる。

さらに、画像表示モードにおいて、記録再生部１２２９は、記憶媒体に記録されている符号化ストリームを読み出して画像処理部１２２７へ出力する。画像処理部１２２７は、記録再生部１２２９から入力される符号化ストリームを復号し、画像データを表示部１２３０に供給し、その画像を表示させる。

また、テレビ電話モードにおいて、例えば、多重分離部１２２８は、画像処理部１２２７により符号化された映像ストリームと、音声コーデック１２２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部１２２２へ出力する。通信部１２２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部１２２２は、生成した送信信号を、アンテナ１２２１を介して基地局（図示せず）へ送信する。また、通信部１２２２は、アンテナ１２２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部１２２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部１２２８へ出力する。多重分離部１２２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部１２２７、音声ストリームを音声コーデック１２２３へ出力する。画像処理部１２２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部１２３０に供給され、表示部１２３０により一連の画像が表示される。音声コーデック１２２３は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック１２２３は、生成した音声信号をスピーカ１２２４に供給して音声を出力させる。

このように構成された携帯電話機１２２０において、例えば画像処理部１２２７が、上述した符号化装置１１の機能を有するようにしてもよい。つまり、画像処理部１２２７が、画像データを、以上の実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、携帯電話機１２２０は、S/N及び圧縮効率を大きく改善することができる。

また、このように構成された携帯電話機１２２０において、例えば画像処理部１２２７が、上述した復号装置１２の機能を有するようにしてもよい。つまり、画像処理部１２２７が、符号化データを、以上の実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、携帯電話機１２２０は、S/N及び圧縮効率を大きく改善することができる。

＜第３の応用例：記録再生装置＞

図５１は、上述した実施の形態を適用した記録再生装置の概略的な構成の一例を示す図である。

記録再生装置１２４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置１２４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置１２４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置１２４０は、音声データ及び映像データを復号する。

記録再生装置１２４０は、チューナ１２４１、外部インタフェース（I/F）部１２４２、エンコーダ１２４３、HDD（Hard Disk Drive）部１２４４、ディスクドライブ１２４５、セレクタ１２４６、デコーダ１２４７、OSD（On-Screen Display）部１２４８、制御部１２４９、及びユーザインタフェース（I/F）部１２５０を備える。

チューナ１２４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ１２４１は、復調により得られた符号化ビットストリームをセレクタ１２４６へ出力する。すなわち、チューナ１２４１は、記録再生装置１２４０における伝送部としての役割を有する。

外部インタフェース部１２４２は、記録再生装置１２４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース部１２４２は、例えば、IEEE（Institute of Electrical and Electronic Engineers）1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェース等であってよい。例えば、外部インタフェース部１２４２を介して受信される映像データ及び音声データは、エンコーダ１２４３へ入力される。すなわち、外部インタフェース部１２４２は、記録再生装置１２４０における伝送部としての役割を有する。

エンコーダ１２４３は、外部インタフェース部１２４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ１２４３は、符号化ビットストリームをセレクタ１２４６へ出力する。

HDD部１２４４は、映像及び音声等のコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、HDD部１２４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

ディスクドライブ１２４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ１２４５に装着される記録媒体は、例えばDVD（Digital Versatile Disc）ディスク（DVD-Video、DVD-RAM（DVD - Random Access Memory）、DVD-R（DVD - Recordable）、DVD-RW（DVD - Rewritable）、DVD+R（DVD + Recordable）、DVD+RW（DVD + Rewritable）等）又はBlu-ray（登録商標）ディスク等であってよい。

セレクタ１２４６は、映像及び音声の記録時には、チューナ１２４１又はエンコーダ１２４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD１２４４又はディスクドライブ１２４５へ出力する。また、セレクタ１２４６は、映像及び音声の再生時には、HDD１２４４又はディスクドライブ１２４５から入力される符号化ビットストリームをデコーダ１２４７へ出力する。

デコーダ１２４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ１２４７は、生成した映像データをOSD部１２４８へ出力する。また、デコーダ１２４７は、生成した音声データを外部のスピーカへ出力する。

OSD部１２４８は、デコーダ１２４７から入力される映像データを再生し、映像を表示する。また、OSD部１２４８は、表示する映像に、例えばメニュー、ボタン又はカーソル等のGUIの画像を重畳してもよい。

制御部１２４９は、CPU等のプロセッサ、並びにRAM及びROM等のメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータ等を記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置１２４０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部１２５０から入力される操作信号に応じて、記録再生装置１２４０の動作を制御する。

ユーザインタフェース部１２５０は、制御部１２４９と接続される。ユーザインタフェース部１２５０は、例えば、ユーザが記録再生装置１２４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部等を有する。ユーザインタフェース部１２５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部１２４９へ出力する。

このように構成された記録再生装置１２４０において、例えばエンコーダ１２４３が、上述した符号化装置１１の機能を有するようにしてもよい。つまり、エンコーダ１２４３が、画像データを、以上の実施の形態において説明方法で符号化するようにしてもよい。このようにすることにより、記録再生装置１２４０は、S/N及び圧縮効率を大きく改善することができる。

また、このように構成された記録再生装置１２４０において、例えばデコーダ１２４７が、上述した復号装置１２の機能を有するようにしてもよい。つまり、デコーダ１２４７が、符号化データを、以上の実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、記録再生装置１２４０は、S/N及び圧縮効率を大きく改善することができる。

＜第４の応用例：撮像装置＞

図５２は、上述した実施の形態を適用した撮像装置の概略的な構成の一例を示す図である。

撮像装置１２６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

撮像装置１２６０は、光学ブロック１２６１、撮像部１２６２、信号処理部１２６３、画像処理部１２６４、表示部１２６５、外部インタフェース（I/F）部１２６６、メモリ部１２６７、メディアドライブ１２６８、OSD部１２６９、制御部１２７０、ユーザインタフェース（I/F）部１２７１、及びバス１２７２を備える。

光学ブロック１２６１は、撮像部１２６２に接続される。撮像部１２６２は、信号処理部１２６３に接続される。表示部１２６５は、画像処理部１２６４に接続される。ユーザインタフェース部１２７１は、制御部１２７０に接続される。バス１２７２は、画像処理部１２６４、外部インタフェース部１２６６、メモリ部１２６７、メディアドライブ１２６８、OSD部１２６９、及び制御部１２７０を相互に接続する。

光学ブロック１２６１は、フォーカスレンズ及び絞り機構等を有する。光学ブロック１２６１は、被写体の光学像を撮像部１２６２の撮像面に結像させる。撮像部１２６２は、CCD（Charge Coupled Device）又はCMOS（Complementary Metal Oxide Semiconductor）等のイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部１２６２は、画像信号を信号処理部１２６３へ出力する。

信号処理部１２６３は、撮像部１２６２から入力される画像信号に対してニー補正、ガンマ補正、色補正等の種々のカメラ信号処理を行う。信号処理部１２６３は、カメラ信号処理後の画像データを画像処理部１２６４へ出力する。

画像処理部１２６４は、信号処理部１２６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部１２６４は、生成した符号化データを外部インタフェース部１２６６又はメディアドライブ１２６８へ出力する。また、画像処理部１２６４は、外部インタフェース部１２６６又はメディアドライブ１２６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部１２６４は、生成した画像データを表示部１２６５へ出力する。また、画像処理部１２６４は、信号処理部１２６３から入力される画像データを表示部１２６５へ出力して画像を表示させてもよい。また、画像処理部１２６４は、OSD部１２６９から取得される表示用データを、表示部１２６５へ出力する画像に重畳してもよい。

OSD部１２６９は、例えばメニュー、ボタン又はカーソル等のGUIの画像を生成して、生成した画像を画像処理部１２６４へ出力する。

外部インタフェース部１２６６は、例えばUSB入出力端子として構成される。外部インタフェース部１２６６は、例えば、画像の印刷時に、撮像装置１２６０とプリンタとを接続する。また、外部インタフェース部１２６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスク等のリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置１２６０にインストールされ得る。さらに、外部インタフェース部１２６６は、LAN又はインターネット等のネットワークに接続されるネットワークインタフェースとして構成されてもよい。すなわち、外部インタフェース部１２６６は、撮像装置１２６０における伝送部としての役割を有する。

メディアドライブ１２６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリ等の、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ１２６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD（Solid State Drive）のような非可搬性の記憶部が構成されてもよい。

制御部１２７０は、CPU等のプロセッサ、並びにRAM及びROM等のメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータ等を記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置１２６０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部１２７１から入力される操作信号に応じて、撮像装置１２６０の動作を制御する。

ユーザインタフェース部１２７１は、制御部１２７０と接続される。ユーザインタフェース部１２７１は、例えば、ユーザが撮像装置１２６０を操作するためのボタン及びスイッチ等を有する。ユーザインタフェース部１２７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部１２７０へ出力する。

このように構成された撮像装置１２６０において、例えば画像処理部１２６４が、上述した符号化装置１１の機能を有するようにしてもよい。つまり、画像処理部１２６４が、画像データを、以上の実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、撮像装置１２６０は、S/N及び圧縮効率を大きく改善することができる。

また、このように構成された撮像装置１２６０において、例えば画像処理部１２６４が、上述した復号装置１２の機能を有するようにしてもよい。つまり、画像処理部１２６４が、符号化データを、以上の実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、撮像装置１２６０は、S/N及び圧縮効率を大きく改善することができる。

＜その他の応用例＞

なお、本技術は、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択して使用する、例えばMPEG DASH等のようなHTTPストリーミングにも適用することができる。つまり、このような複数の符号化データ間で、符号化や復号に関する情報を共有することもできる。

また、以上においては、本技術を適用する装置やシステム等の例を説明したが、本技術は、これに限らず、このような装置又はシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI（Large Scale Integration）等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等（すなわち、装置の一部の構成）として実施することもできる。

＜ビデオセット＞

本技術をセットとして実施する場合の例について、図５３を参照して説明する。

図５３は、本技術を適用したビデオセットの概略的な構成の一例を示す図である。

近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、１機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する１セットとして実施を行う場合も多く見られるようになってきた。

図５３に示されるビデオセット１３００は、このような多機能化された構成であり、画像の符号化や復号（いずれか一方でもよいし、両方でも良い）に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。

図５３に示されるように、ビデオセット１３００は、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、及びフロントエンドモジュール１３１４等のモジュール群と、コネクティビティ１３２１、カメラ１３２２、及びセンサ１３２３等の関連する機能を有するデバイスとを有する。

モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。

図５３の例の場合、ビデオモジュール１３１１は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ１３３１、ビデオプロセッサ１３３２、ブロードバンドモデム１３３３、及びRFモジュール１３３４を有する。

プロセッサは、所定の機能を有する構成をSoC（System On a Chip）により半導体チップに集積したものであり、例えばシステムLSI（Large Scale Integration）等と称されるものもある。この所定の機能を有する構成は、論理回路（ハードウエア構成）であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム（ソフトウエア構成）であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路（ハードウエア構成）により実現し、その他の機能をCPUにおいて実行されるプログラム（ソフトウエア構成）により実現するようにしてもよい。

図５３のアプリケーションプロセッサ１３３１は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ１３３１において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ１３３２等、ビデオモジュール１３１１内外の構成を必要に応じて制御することもできる。

ビデオプロセッサ１３３２は、画像の符号化・復号（その一方若しくは両方）に関する機能を有するプロセッサである。

ブロードバンドモデム１３３３は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線（又はその両方）の広帯域通信により送信するデータ（デジタル信号）をデジタル変調する等してアナログ信号に変換したり、その広帯域通信により受信したアナログ信号を復調してデータ（デジタル信号）に変換したりする。ブロードバンドモデム１３３３は、例えば、ビデオプロセッサ１３３２が処理する画像データ、画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報を処理する。

RFモジュール１３３４は、アンテナを介して送受信されるRF（Radio Frequency）信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール１３３４は、ブロードバンドモデム１３３３により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール１３３４は、フロントエンドモジュール１３１４を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。

なお、図５３において点線１３４１に示されるように、アプリケーションプロセッサ１３３１とビデオプロセッサ１３３２を、一体化し、１つのプロセッサとして構成されるようにしてもよい。

外部メモリ１３１２は、ビデオモジュール１３１１の外部に設けられた、ビデオモジュール１３１１により利用される記憶デバイスを有するモジュールである。この外部メモリ１３１２の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM（Dynamic Random Access Memory）のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。

パワーマネージメントモジュール１３１３は、ビデオモジュール１３１１（ビデオモジュール１３１１内の各構成）への電力供給を管理し、制御する。

フロントエンドモジュール１３１４は、RFモジュール１３３４に対してフロントエンド機能（アンテナ側の送受信端の回路）を提供するモジュールである。図５３に示されるように、フロントエンドモジュール１３１４は、例えば、アンテナ部１３５１、フィルタ１３５２、及び増幅部１３５３を有する。

アンテナ部１３５１は、無線信号を送受信するアンテナ及びその周辺の構成を有する。アンテナ部１３５１は、増幅部１３５３から供給される信号を無線信号として送信し、受信した無線信号を電気信号（RF信号）としてフィルタ１３５２に供給する。フィルタ１３５２は、アンテナ部１３５１を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール１３３４に供給する。増幅部１３５３は、RFモジュール１３３４から供給されるRF信号を増幅し、アンテナ部１３５１に供給する。

コネクティビティ１３２１は、外部との接続に関する機能を有するモジュールである。コネクティビティ１３２１の物理構成は、任意である。例えば、コネクティビティ１３２１は、ブロードバンドモデム１３３３が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。

例えば、コネクティビティ１３２１が、Bluetooth（登録商標）、IEEE 802.11（例えばWi-Fi（Wireless Fidelity、登録商標））、NFC（Near Field Communication）、IrDA（InfraRed Data Association）等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ１３２１が、USB（Universal Serial Bus）、HDMI（登録商標）（High-Definition Multimedia Interface）等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ１３２１が、アナログ入出力端子等のその他のデータ（信号）伝送機能等を有するようにしてもよい。

なお、コネクティビティ１３２１が、データ（信号）の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ１３２１が、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ（リムーバブルメディアのドライブだけでなく、ハードディスク、SSD（Solid State Drive）、NAS（Network Attached Storage）等も含む）を有するようにしてもよい。また、コネクティビティ１３２１が、画像や音声の出力デバイス（モニタやスピーカ等）を有するようにしてもよい。

カメラ１３２２は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ１３２２の撮像により得られた画像データは、例えば、ビデオプロセッサ１３３２に供給されて符号化される。

センサ１３２３は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ１３２３により検出されたデータは、例えば、アプリケーションプロセッサ１３３１に供給されてアプリケーション等により利用される。

以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。

以上のような構成のビデオセット１３００において、後述するようにビデオプロセッサ１３３２に本技術を適用することができる。したがって、ビデオセット１３００は、本技術を適用したセットとして実施することができる。

＜ビデオプロセッサの構成例＞

図５４は、本技術を適用したビデオプロセッサ１３３２（図５３）の概略的な構成の一例を示す図である。

図５４の例の場合、ビデオプロセッサ１３３２は、ビデオ信号及びオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータ及びオーディオデータを復号し、ビデオ信号及びオーディオ信号を再生出力する機能とを有する。

図５４に示されるように、ビデオプロセッサ１３３２は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、フレームメモリ１４０５、及びメモリ制御部１４０６を有する。また、ビデオプロセッサ１３３２は、エンコード・デコードエンジン１４０７、ビデオES（Elementary Stream）バッファ１４０８Ａ及び１４０８Ｂ、並びに、オーディオESバッファ１４０９Ａ及び１４０９Ｂを有する。さらに、ビデオプロセッサ１３３２は、オーディオエンコーダ１４１０、オーディオデコーダ１４１１、多重化部（MUX（Multiplexer））１４１２、逆多重化部（DMUX（Demultiplexer））１４１３、及びストリームバッファ１４１４を有する。

ビデオ入力処理部１４０１は、例えばコネクティビティ１３２１（図５３）等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第１画像拡大縮小部１４０２は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第２画像拡大縮小部１４０３は、画像データに対して、ビデオ出力処理部１４０４を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第１画像拡大縮小部１４０２と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部１４０４は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ１３２１等に出力する。

フレームメモリ１４０５は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、及びエンコード・デコードエンジン１４０７によって共用される画像データ用のメモリである。フレームメモリ１４０５は、例えばDRAM等の半導体メモリとして実現される。

メモリ制御部１４０６は、エンコード・デコードエンジン１４０７からの同期信号を受けて、アクセス管理テーブル１４０６Ａに書き込まれたフレームメモリ１４０５へのアクセススケジュールに従ってフレームメモリ１４０５に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル１４０６Ａは、エンコード・デコードエンジン１４０７、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３等で実行される処理に応じて、メモリ制御部１４０６により更新される。

エンコード・デコードエンジン１４０７は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン１４０７は、フレームメモリ１４０５から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ１４０８Ａに順次書き込む。また、例えば、ビデオESバッファ１４０８Ｂからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ１４０５に順次書き込む。エンコード・デコードエンジン１４０７は、これらの符号化や復号において、フレームメモリ１４０５を作業領域として使用する。また、エンコード・デコードエンジン１４０７は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部１４０６に対して同期信号を出力する。

ビデオESバッファ１４０８Ａは、エンコード・デコードエンジン１４０７によって生成されたビデオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。ビデオESバッファ１４０８Ｂは、逆多重化部（DMUX）１４１３から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン１４０７に供給する。

オーディオESバッファ１４０９Ａは、オーディオエンコーダ１４１０によって生成されたオーディオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。オーディオESバッファ１４０９Ｂは、逆多重化部（DMUX）１４１３から供給されたオーディオストリームをバッファリングして、オーディオデコーダ１４１１に供給する。

オーディオエンコーダ１４１０は、例えばコネクティビティ１３２１等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3（AudioCode number 3）方式等の所定の方式で符号化する。オーディオエンコーダ１４１０は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ１４０９Ａに順次書き込む。オーディオデコーダ１４１１は、オーディオESバッファ１４０９Ｂから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ１３２１等に供給する。

多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法（すなわち、多重化により生成されるビットストリームのフォーマット）は任意である。また、この多重化の際に、多重化部（MUX）１４１２は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部（MUX）１４１２は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ（ファイルデータ）に変換する。

逆多重化部（DMUX）１４１３は、多重化部（MUX）１４１２による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部（DMUX）１４１３は、ストリームバッファ１４１４から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する（ビデオストリームとオーディオストリームとを分離する）。つまり、逆多重化部（DMUX）１４１３は、逆多重化によりストリームのフォーマットを変換（多重化部（MUX）１４１２による変換の逆変換）することができる。例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等から供給されたトランスポートストリームを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１により各種記録媒体から読み出されたファイルデータを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。

ストリームバッファ１４１４は、ビットストリームをバッファリングする。例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等に供給する。

また、例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１等に供給し、各種記録媒体に記録させる。

さらに、ストリームバッファ１４１４は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

また、ストリームバッファ１４１４は、例えばコネクティビティ１３２１等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

次に、このような構成のビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１等からビデオプロセッサ１３３２に入力されたビデオ信号は、ビデオ入力処理部１４０１において４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式のデジタル画像データに変換され、フレームメモリ１４０５に順次書き込まれる。このデジタル画像データは、第１画像拡大縮小部１４０２又は第２画像拡大縮小部１４０３に読み出されて、４：２：０Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式へのフォーマット変換及び拡大縮小処理が行われ、再びフレームメモリ１４０５に書き込まれる。この画像データは、エンコード・デコードエンジン１４０７によって符号化され、ビデオストリームとしてビデオESバッファ１４０８Ａに書き込まれる。

また、コネクティビティ１３２１等からビデオプロセッサ１３３２に入力されたオーディオ信号は、オーディオエンコーダ１４１０によって符号化され、オーディオストリームとして、オーディオESバッファ１４０９Ａに書き込まれる。

ビデオESバッファ１４０８Ａのビデオストリームと、オーディオESバッファ１４０９Ａのオーディオストリームは、多重化部（MUX）１４１２に読み出されて多重化され、トランスポートストリーム若しくはファイルデータ等に変換される。多重化部（MUX）１４１２により生成されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークに出力される。また、多重化部（MUX）１４１２により生成されたファイルデータは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１等に出力され、各種記録媒体に記録される。

また、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークからビデオプロセッサ１３３２に入力されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。また、例えばコネクティビティ１３２１等において各種記録媒体から読み出され、ビデオプロセッサ１３３２に入力されたファイルデータは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。つまり、ビデオプロセッサ１３３２に入力されたトランスポートストリーム又はファイルデータは、逆多重化部（DMUX）１４１３によりビデオストリームとオーディオストリームとに分離される。

オーディオストリームは、オーディオESバッファ１４０９Ｂを介してオーディオデコーダ１４１１に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ１４０８Ｂに書き込まれた後、エンコード・デコードエンジン１４０７により順次読み出されて復号されてフレームメモリ１４０５に書き込まれる。復号された画像データは、第２画像拡大縮小部１４０３によって拡大縮小処理されて、フレームメモリ１４０５に書き込まれる。そして、復号された画像データは、ビデオ出力処理部１４０４に読み出されて、４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、エンコード・デコードエンジン１４０７に、上述した実施の形態に係る本技術を適用すればよい。つまり、例えば、エンコード・デコードエンジン１４０７が、上述した符号化装置１１の機能若しくは復号装置１２の機能又はその両方を有するようにしてもよい。このようにすることにより、ビデオプロセッサ１３３２は、上述した実施の形態の符号化装置１１や復号装置１２と同様の効果を得ることができる。

なお、エンコード・デコードエンジン１４０７において、本技術（すなわち、符号化装置１１の機能若しくは復号装置１２の機能又はその両方）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

＜ビデオプロセッサの他の構成例＞

図５５は、本技術を適用したビデオプロセッサ１３３２の概略的な構成の他の例を示す図である。

図５５の例の場合、ビデオプロセッサ１３３２は、ビデオデータを所定の方式で符号化・復号する機能を有する。

より具体的には、図５５に示されるように、ビデオプロセッサ１３３２は、制御部１５１１、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及び内部メモリ１５１５を有する。また、ビデオプロセッサ１３３２は、コーデックエンジン１５１６、メモリインタフェース１５１７、多重化・逆多重化部（MUX DMUX）１５１８、ネットワークインタフェース１５１９、及びビデオインタフェース１５２０を有する。

制御部１５１１は、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６等、ビデオプロセッサ１３３２内の各処理部の動作を制御する。

図５５に示されるように、制御部１５１１は、例えば、メインCPU１５３１、サブCPU１５３２、及びシステムコントローラ１５３３を有する。メインCPU１５３１は、ビデオプロセッサ１３３２内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU１５３１は、そのプログラム等に従って制御信号を生成し、各処理部に供給する（つまり、各処理部の動作を制御する）。サブCPU１５３２は、メインCPU１５３１の補助的な役割を果たす。例えば、サブCPU１５３２は、メインCPU１５３１が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ１５３３は、メインCPU１５３１及びサブCPU１５３２が実行するプログラムを指定する等、メインCPU１５３１及びサブCPU１５３２の動作を制御する。

ディスプレイインタフェース１５１２は、制御部１５１１の制御の下、画像データを例えばコネクティビティ１３２１等に出力する。例えば、ディスプレイインタフェース１５１２は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、又はデジタルデータの画像データのまま、コネクティビティ１３２１のモニタ装置等に出力する。

ディスプレイエンジン１５１３は、制御部１５１１の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。

画像処理エンジン１５１４は、制御部１５１１の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。

内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６により共用される、ビデオプロセッサ１３３２の内部に設けられたメモリである。内部メモリ１５１５は、例えば、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６の間で行われるデータの授受に利用される。例えば、内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、又はコーデックエンジン１５１６から供給されるデータを格納し、必要に応じて（例えば、要求に応じて）、そのデータを、ディスプレイエンジン１５１３、画像処理エンジン１５１４、又はコーデックエンジン１５１６に供給する。この内部メモリ１５１５は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM（Static Random Access Memory）のような比較的（例えば外部メモリ１３１２と比較して）小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。

コーデックエンジン１５１６は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン１５１６が対応する符号化・復号の方式は任意であり、その数は１つであってもよいし、複数であってもよい。例えば、コーデックエンジン１５１６は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化又は符号化データの復号を行うようにしてもよい。

図５５に示される例において、コーデックエンジン１５１６は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video１５４１、AVC/H.264１５４２、HEVC/H.265１５４３、HEVC/H.265(Scalable)１５４４、HEVC/H.265(Multi-view)１５４５、及びMPEG-DASH１５５１を有する。

MPEG-2 Video１５４１は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.264１５４２は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265１５４３は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)１５４４は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)１５４５は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。

MPEG-DASH１５５１は、画像データをMPEG-DASH（MPEG-Dynamic Adaptive Streaming over HTTP）方式で送受信する機能ブロックである。MPEG-DASHは、HTTP（HyperText Transfer Protocol）を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の１つとする。MPEG-DASH１５５１は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2 Video１５４１乃至HEVC/H.265(Multi-view)１５４５を利用する。

メモリインタフェース１５１７は、外部メモリ１３１２用のインタフェースである。画像処理エンジン１５１４やコーデックエンジン１５１６から供給されるデータは、メモリインタフェース１５１７を介して外部メモリ１３１２に供給される。また、外部メモリ１３１２から読み出されたデータは、メモリインタフェース１５１７を介してビデオプロセッサ１３３２（画像処理エンジン１５１４若しくはコーデックエンジン１５１６）に供給される。

多重化・逆多重化部（MUX DMUX）１５１８は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、複数のデータを１つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、１つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部（MUX DMUX）１５１８は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部（MUX DMUX）１５１８は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ（ファイルデータ）に変換することができる。もちろん、逆多重化によりその逆変換も可能である。

ネットワークインタフェース１５１９は、例えばブロードバンドモデム１３３３やコネクティビティ１３２１等向けのインタフェースである。ビデオインタフェース１５２０は、例えばコネクティビティ１３２１やカメラ１３２２等向けのインタフェースである。

次に、このようなビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース１５１９を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、例えば、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてファイルデータに変換され、ビデオインタフェース１５２０を介して例えばコネクティビティ１３２１等に出力され、各種記録媒体に記録される。

さらに、例えば、コネクティビティ１３２１等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース１５２０を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてトランスポートストリームに変換され、ネットワークインタフェース１５１９を介して例えばコネクティビティ１３２１やブロードバンドモデム１３３３等に供給され図示せぬ他の装置に伝送される。

なお、ビデオプロセッサ１３３２内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ１５１５や外部メモリ１３１２を利用して行われる。また、パワーマネージメントモジュール１３１３は、例えば制御部１５１１への電力供給を制御する。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、コーデックエンジン１５１６に、上述した実施の形態に係る本技術を適用すればよい。つまり、例えば、コーデックエンジン１５１６が、上述した符号化装置１１の機能若しくは復号装置１２の機能又はその両方を有するようにすればよい。このようにすることにより、ビデオプロセッサ１３３２は、上述した符号化装置１１や復号装置１２と同様の効果を得ることができる。

なお、コーデックエンジン１５１６において、本技術（すなわち、符号化装置１１や復号装置１２の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

以上にビデオプロセッサ１３３２の構成を２例示したが、ビデオプロセッサ１３３２の構成は任意であり、上述した２例以外のものであってもよい。また、このビデオプロセッサ１３３２は、１つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する３次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。

＜装置への適用例＞
ビデオセット１３００は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット１３００は、テレビジョン装置１２００（図４９）、携帯電話機１２２０（図５０）、記録再生装置１２４０（図５１）、撮像装置１２６０（図５２）等に組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、上述した符号化装置１１や復号装置１２と同様の効果を得ることができる。

なお、上述したビデオセット１３００の各構成の一部であっても、ビデオプロセッサ１３３２を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ１３３２のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線１３４１により示されるプロセッサやビデオモジュール１３１１等を、本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、及びフロントエンドモジュール１３１４を組み合わせ、本技術を適用したビデオユニット１３６１として実施することもできる。いずれの構成の場合であっても、上述した符号化装置１１や復号装置１２と同様の効果を得ることができる。

つまり、ビデオプロセッサ１３３２を含むものであればどのような構成であっても、ビデオセット１３００の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ１３３２、点線１３４１により示されるプロセッサ、ビデオモジュール１３１１、又は、ビデオユニット１３６１を、テレビジョン装置１２００（図４９）、携帯電話機１２２０（図５０）、記録再生装置１２４０（図５１）、撮像装置１２６０（図５２）等に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット１３００の場合と同様に、上述した符号化装置１１や復号装置１２と同様の効果を得ることができる。

＜その他＞
なお、本明細書では、各種情報が、符号化データ（ビットストリーム）に多重化されて、符号化側から復号側へ伝送される例について説明したが、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化データに多重化されることなく、符号化データと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、例えば、符号化データに含まれる画像（スライス若しくはブロック等、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。すなわち、この符号化データ（画像）に関連付けられた情報は、符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、この符号化データ（画像）に関連付けられた情報は、符号化データ（画像）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。さらに、画像とその画像に対応する情報とが、例えば、複数フレーム、１フレーム、又はフレーム内の一部分等の任意の単位で互いに関連付けられるようにしてもよい。

また、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えばフラグ情報と画像に関する情報の符号化データとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

また、例えば、１つの装置（又は処理部）として説明した構成を分割し、複数の装置（又は処理部）として構成するようにしてもよい。逆に、以上において複数の装置（又は処理部）として説明した構成をまとめて１つの装置（又は処理部）として構成されるようにしてもよい。また、各装置（又は各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（又は処理部）の構成の一部を他の装置（又は他の処理部）の構成に含めるようにしてもよい。

また、例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、例えば、上述したプログラムは、任意の装置において実行することができる。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

また、例えば、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

なお、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

なお、本明細書において複数説明した本技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術を、他の実施の形態において説明した本技術と組み合わせて実施することもできる。また、上述した任意の本技術を、上述していない他の技術と併用して実施することもできる。

また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

なお、本技術は、以下の構成をとることができる。

＜１＞
予測符号化の残差と予測画像とを加算することにより得られる第１の画像の処理対象画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類に用いられるクラスタップとなる画素を、前記第１の画像から選択することにより、前記クラスタップを構成するクラスタップ選択部と、
前記クラスタップを用いて、前記処理対象画素のクラス分類を行うクラス分類部と、
前記第１の画像に、前記処理対象画素のクラスに対応するフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成するフィルタ処理部と
を備え、
前記クラスタップ選択部は、前記クラスタップのタップ構造を、複数のタップ構造の中から選択されたタップ構造に更新する
画像処理装置。
＜２＞
前記フィルタ処理に関するフィルタ情報を伝送する伝送部をさらに備える
＜１＞に記載の画像処理装置。
＜３＞
前記フィルタ処理部は、
前記第１の画像の前記処理対象画素に対応する前記第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素を、前記第１の画像から選択することにより、前記予測タップを構成する予測タップ選択部と、
前記第１の画像に相当する生徒画像と、前記第１の画像に対応する元画像に相当する教師画像とを用いた学習により求められた、前記クラスごとの、前記予測演算に用いられるタップ係数のうちの、前記処理対象画素のクラスのタップ係数を取得するタップ係数取得部と、
前記処理対象画素のクラスのタップ係数と、前記処理対象画素の前記予測タップとを用いた前記予測演算を行うことにより、前記対応画素の画素値を求める演算部と
を有する
＜２＞に記載の画像処理装置。
＜４＞
前記フィルタ情報は、前記クラスごとのタップ係数を含む
＜３＞に記載の画像処理装置。
＜５＞
前記フィルタ情報は、前記複数のタップ構造の中から選択されたタップ構造を表すタップ構造情報を含む
＜２＞ないし＜４＞のいずれかに記載の画像処理装置。
＜６＞
前記複数のタップ構造それぞれを前記クラス分類に用いる適切さを表すタップ構造評価値に応じて、前記複数のタップ構造の中から、前記クラスタップのタップ構造を選択する選択部をさらに備える
＜２＞ないし＜５＞のいずれかに記載の画像処理装置。
＜７＞
前記予測符号化により得られる符号化データから取得可能な取得可能情報を用いて、前記複数のタップ構造の中から前記クラスタップのタップ構造を選択する選択規則に従い、前記複数のタップ構造の中から、前記クラスタップのタップ構造を選択するタップ構造選択部をさらに備える
＜２＞ないし＜５＞のいずれかに記載の画像処理装置。
＜８＞
前記フィルタ情報は、前記選択規則を含む
＜７＞に記載の画像処理装置。
＜９＞
前記取得可能情報は、前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方である
＜７＞又は＜８＞に記載の画像処理装置。
＜１０＞
前記フィルタ情報は、前記クラスタップのタップ構造として、直前のタップ構造の更新時と同一のタップ構造を用いるかどうかを表すコピー情報を含む
＜２＞ないし＜９＞のいずれかに記載の画像処理装置。
＜１１＞
前記フィルタ処理に関するフィルタ情報を受け取る受け取り部をさらに備える
＜１＞に記載の画像処理装置。
＜１２＞
前記フィルタ処理部は、
前記第１の画像の前記処理対象画素に対応する前記第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素を、前記第１の画像から選択することにより、前記予測タップを構成する予測タップ選択部と、
前記第１の画像に相当する生徒画像と、前記第１の画像に対応する元画像に相当する教師画像とを用いた学習により求められた、前記クラスごとの、前記予測演算に用いられるタップ係数のうちの、前記処理対象画素のクラスのタップ係数を取得するタップ係数取得部と、
前記処理対象画素のクラスのタップ係数と、前記処理対象画素の前記予測タップとを用いた前記予測演算を行うことにより、前記対応画素の画素値を求める演算部と
を有する
＜１１＞に記載の画像処理装置。
＜１３＞
前記フィルタ情報は、前記クラスごとのタップ係数を含み、
前記タップ係数取得部は、前記フィルタ情報に含まれる前記クラスごとのタップ係数から、前記処理対象画素のクラスのタップ係数を取得する
＜１２＞に記載の画像処理装置。
＜１４＞
前記フィルタ情報は、前記複数のタップ構造の中から選択されたタップ構造を表すタップ構造情報を含み、
前記クラスタップ選択部は、前記クラスタップのタップ構造を、前記フィルタ情報に含まれる前記タップ構造情報が表すタップ構造に更新する
＜１１＞ないし＜１３＞のいずれかに記載の画像処理装置。
＜１５＞
前記フィルタ情報は、前記複数のタップ構造の中から前記クラスタップのタップ構造を選択する選択規則を含み、
前記予測符号化により得られる符号化データから取得可能な取得可能情報を用いて、前記選択規則に従い、前記複数のタップ構造の中から、前記クラスタップのタップ構造を選択するタップ構造選択部をさらに備える
＜１１＞ないし＜１３＞のいずれかに記載の画像処理装置。
＜１６＞
前記取得可能情報は、前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方である
＜１５＞に記載の画像処理装置。
＜１７＞
前記フィルタ情報は、前記クラスタップのタップ構造として、直前のタップ構造の更新時と同一のタップ構造を用いるかどうかを表すコピー情報を含み、
前記クラスタップ選択部は、前記フィルタ情報に含まれる前記コピー情報に応じて、前記クラスタップのタップ構造として、直前のタップ構造の更新時と同一のタップ構造を選択する
＜１１＞ないし＜１６＞に記載のいずれかに記載の画像処理装置。
＜１８＞
前記フィルタ処理部は、ILF(In Loop Filter)を構成するDF(Deblocking Filter)，SAO(Sample Adaptive Offset)、及び、ALF(Adaptive Loop Filter)のうちの１以上として機能する
＜１＞ないし＜１７＞に記載のいずれかに記載の画像処理装置。
＜１９＞
予測符号化の残差と予測画像とを加算することにより得られる第１の画像の処理対象画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類に用いられるクラスタップとなる画素を、前記第１の画像から選択することにより、前記クラスタップを構成することと、
前記クラスタップを用いて、前記処理対象画素のクラス分類を行うことと、
前記第１の画像に、前記処理対象画素のクラスに対応するフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成することと
を含み、
前記クラスタップのタップ構造を、複数のタップ構造の中から選択されたタップ構造に更新する
画像処理方法。

１１符号化装置，１２復号装置，２１，２２タップ選択部，２３クラス分類部，２４係数取得部，２５予測演算部，３０学習装置，３１教師データ生成部，３２生徒データ生成部，３３学習部，４１，４２タップ選択部，４３クラス分類部，４４足し込み部，４５係数算出部，６１パラメータ生成部，６２生徒データ生成部，６３学習部，７１足し込み部，７２係数算出部，８１，８２足し込み部，８３係数算出部，１０１ A/D変換部，１０２並べ替えバッファ，１０３演算部，１０４直交変換部，１０５量子化部，１０６可逆符号化部，１０７蓄積バッファ，１０８逆量子化部，１０９逆直交変換部，１１０演算部，１１１クラス分類適応フィルタ，１１２フレームメモリ，１１３選択部，１１４イントラ予測部，１１５動き予測補償部，１１６予測画像選択部，１１７レート制御部，１３１学習装置，１３２フィルタ情報生成部，１３３画像変換装置，１５１タップ構造選択部，１５２学習部，１５３記憶部，１５４評価値算出部，１５５選択部，１６１，１６２タップ選択部，１６３クラス分類部，１６４足し込み部，１６５係数算出部，１７１画像変換部，１７２算出部，１８０フィルタ処理部，１８１，１８２タップ選択部，１８３クラス分類部，１８４係数取得部，１８５予測演算部，１９０フィルタ処理部，１９１，１９２タップ選択部，１９３クラス分類部，１９４係数取得部，１９５予測演算部，２０１蓄積バッファ，２０２可逆復号部，２０３逆量子化部，２０４逆直交変換部，２０５演算部，２０６クラス分類適応フィルタ，２０７並べ替えバッファ，２０８ D/A変換部，２１０フレームメモリ，２１１選択部，２１２イントラ予測部，２１３動き予測補償部，２１４選択部，２３１画像変換装置，２４０フィルタ処理部，２４１，２４２タップ選択部，２４３クラス分類部，２４４係数取得部，２４５予測演算部，３１１クラス分類適応フィルタ，３３１学習装置，３３２フィルタ情報生成部，３３３画像変換装置，３５１タップ構造選択部，３５３記憶部，３５４評価値算出部，３５５選択部，３７１画像変換部，３８１，３９１タップ構造選択部，４０１クラス分類適応フィルタ，４３１画像変換装置，４５１タップ構造選択部

Claims

予測符号化の残差と予測画像とを加算することにより得られる第１の画像の処理対象画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類に用いられるクラスタップとなる画素を、前記第１の画像から選択することにより、前記クラスタップを構成するクラスタップ選択部と、
前記クラスタップを用いて、前記処理対象画素のクラス分類を行うクラス分類部と、
前記第１の画像に、前記処理対象画素のクラスに対応するフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成するフィルタ処理部と
を備え、
前記クラスタップ選択部は、前記クラスタップのタップ構造を、複数のタップ構造の中から選択されたタップ構造に更新する
画像処理装置。
前記フィルタ処理に関するフィルタ情報を伝送する伝送部をさらに備える
請求項１に記載の画像処理装置。
前記フィルタ処理部は、
前記第１の画像の前記処理対象画素に対応する前記第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素を、前記第１の画像から選択することにより、前記予測タップを構成する予測タップ選択部と、
前記第１の画像に相当する生徒画像と、前記第１の画像に対応する元画像に相当する教師画像とを用いた学習により求められた、前記クラスごとの、前記予測演算に用いられるタップ係数のうちの、前記処理対象画素のクラスのタップ係数を取得するタップ係数取得部と、
前記処理対象画素のクラスのタップ係数と、前記処理対象画素の前記予測タップとを用いた前記予測演算を行うことにより、前記対応画素の画素値を求める演算部と
を有する
請求項２に記載の画像処理装置。
前記フィルタ情報は、前記クラスごとのタップ係数を含む
請求項３に記載の画像処理装置。
前記フィルタ情報は、前記複数のタップ構造の中から選択されたタップ構造を表すタップ構造情報を含む
請求項２に記載の画像処理装置。
前記複数のタップ構造それぞれを前記クラス分類に用いる適切さを表すタップ構造評価値に応じて、前記複数のタップ構造の中から、前記クラスタップのタップ構造を選択する選択部をさらに備える
請求項２に記載の画像処理装置。
前記予測符号化により得られる符号化データから取得可能な取得可能情報を用いて、前記複数のタップ構造の中から前記クラスタップのタップ構造を選択する選択規則に従い、前記複数のタップ構造の中から、前記クラスタップのタップ構造を選択するタップ構造選択部をさらに備える
請求項２に記載の画像処理装置。
前記フィルタ情報は、前記選択規則を含む
請求項７に記載の画像処理装置。
前記取得可能情報は、前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方である
請求項７に記載の画像処理装置。
前記フィルタ情報は、前記クラスタップのタップ構造として、直前のタップ構造の更新時と同一のタップ構造を用いるかどうかを表すコピー情報を含む
請求項２に記載の画像処理装置。
前記フィルタ処理に関するフィルタ情報を受け取る受け取り部をさらに備える
請求項１に記載の画像処理装置。
前記フィルタ処理部は、
前記第１の画像の前記処理対象画素に対応する前記第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素を、前記第１の画像から選択することにより、前記予測タップを構成する予測タップ選択部と、
前記第１の画像に相当する生徒画像と、前記第１の画像に対応する元画像に相当する教師画像とを用いた学習により求められた、前記クラスごとの、前記予測演算に用いられるタップ係数のうちの、前記処理対象画素のクラスのタップ係数を取得するタップ係数取得部と、
前記処理対象画素のクラスのタップ係数と、前記処理対象画素の前記予測タップとを用いた前記予測演算を行うことにより、前記対応画素の画素値を求める演算部と
を有する
請求項１１に記載の画像処理装置。
前記フィルタ情報は、前記クラスごとのタップ係数を含み、
前記タップ係数取得部は、前記フィルタ情報に含まれる前記クラスごとのタップ係数から、前記処理対象画素のクラスのタップ係数を取得する
請求項１２に記載の画像処理装置。
前記フィルタ情報は、前記複数のタップ構造の中から選択されたタップ構造を表すタップ構造情報を含み、
前記クラスタップ選択部は、前記クラスタップのタップ構造を、前記フィルタ情報に含まれる前記タップ構造情報が表すタップ構造に更新する
請求項１１に記載の画像処理装置。
前記フィルタ情報は、前記複数のタップ構造の中から前記クラスタップのタップ構造を選択する選択規則を含み、
前記予測符号化により得られる符号化データから取得可能な取得可能情報を用いて、前記選択規則に従い、前記複数のタップ構造の中から、前記クラスタップのタップ構造を選択するタップ構造選択部をさらに備える
請求項１１に記載の画像処理装置。
前記取得可能情報は、前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方である
請求項１５に記載の画像処理装置。
前記フィルタ情報は、前記クラスタップのタップ構造として、直前のタップ構造の更新時と同一のタップ構造を用いるかどうかを表すコピー情報を含み、
前記クラスタップ選択部は、前記フィルタ情報に含まれる前記コピー情報に応じて、前記クラスタップのタップ構造として、直前のタップ構造の更新時と同一のタップ構造を選択する
請求項１１に記載の画像処理装置。
前記フィルタ処理部は、ILF(In Loop Filter)を構成するDF(Deblocking Filter)，SAO(Sample Adaptive Offset)、及び、ALF(Adaptive Loop Filter)のうちの１以上として機能する
請求項１に記載の画像処理装置。
予測符号化の残差と予測画像とを加算することにより得られる第１の画像の処理対象画素を、複数のクラスのうちのいずれかのクラスに分類するクラス分類に用いられるクラスタップとなる画素を、前記第１の画像から選択することにより、前記クラスタップを構成することと、
前記クラスタップを用いて、前記処理対象画素のクラス分類を行うことと、
前記第１の画像に、前記処理対象画素のクラスに対応するフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成することと
を含み、
前記クラスタップのタップ構造を、複数のタップ構造の中から選択されたタップ構造に更新する
画像処理方法。