WO2018216688A1

WO2018216688A1 - 動画像符号化装置及び動画像復号装置、フィルタ装置

Info

Publication number: WO2018216688A1
Application number: PCT/JP2018/019654
Authority: WO
Inventors: 友子青野; 知宏猪飼
Original assignee: シャープ株式会社
Priority date: 2017-05-26
Filing date: 2018-05-22
Publication date: 2018-11-29
Also published as: US20200213619A1; JP2020120141A

Abstract

対象ブロックの上側ブロックの参照画素は、色差成分において対象ブロックの２画素毎に１画素（第１の参照画素）をメモリに格納し、メモリに格納しない画素（第２の参照画素）は、第１の参照画素から補間することで導出し、予測手段は、第１の参照画素と第２の参照画素を参照して、対象ブロックの色差成分の各画素のイントラ予測値を算出する。

Description

動画像符号化装置及び動画像復号装置、フィルタ装置

　本発明は、画像復号装置、及び画像符号化装置に関する。

　動画像を効率的に伝送または記録するために、動画像を符号化することによって符号化データを生成する画像符号化装置、及び、当該符号化データを復号することによって復号画像を生成する画像復号装置が用いられている。

　具体的な動画像符号化方式としては、例えば、H.264/AVCやHEVC（High-Efficiency Video Coding）にて提案されている方式などが挙げられる。

　このような動画像符号化方式においては、動画像を構成する画像（ピクチャ）は、画像を分割することにより得られるスライス、スライスを分割することにより得られる符号化ツリーユニット（CTU：Coding Tree Unit）、符号化ツリーユニットを分割することで得られる符号化単位（符号化ユニット（Coding Unit：CU）と呼ばれることもある）、及び、符号化単位を分割することより得られるブロックである予測ユニット（PU）、変換ユニット（TU）からなる階層構造により管理され、CUごとに符号化／復号される。

　また、このような動画像符号化方式においては、通常、入力画像を符号化／復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像（原画像）から減算して得られる予測残差（「差分画像」または「残差画像」と呼ぶこともある）が符号化される。予測画像の生成方法としては、画面間予測（インター予測）、及び、画面内予測（イントラ予測）が挙げられる（非特許文献１）。

　また、入出力画像のフォーマットは、輝度成分に対し色差成分の解像度を1/4に落とした4:2:0フォーマットが一般的に使用されている。しかし、近年、特に業務用機器を中心として、高画質化が要求され、輝度成分と色差成分の解像度が等しい4:4:4フォーマットの使用が増えてきている。図7に4:2:0および4:4:4フォーマットの画素位置を示す。図7(a)の4:4:4フォーマットは、輝度成分(Y)、および色差成分(Cb、Cr)が、水平・垂直方向とも同じ画素位置にあり、同じ解像度を持つフォーマットである。図7(b)の4:2:0フォーマットは、色差成分の存在する画素位置が輝度成分に比べ、水平・垂直方向とも1/2、つまり解像度が半分のフォーマットである。そのため、画像の符号化あるいは復号処理で使用するツールのいくつかは、4:4:4フォーマットを扱う場合、4:2:0フォーマットで必要なメモリより大きなメモリを必要とする（非特許文献２）。

　今後、通信の伝送容量や記録メディアの蓄積容量の向上に伴い、4:4:4フォーマットの使用は業務用機器から民生用機器へ拡大すると予想される。

"Algorithm Description of Joint Exploration Test Model 5", JVET-E1001, Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 12-20 January 2017 ITU-T H.265(04/2015) SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisual services - Coding of moving video High efficiency video coding

　上記で説明したように、画像の符号化あるいは復号処理で使用するツールのいくつかは、4:4:4フォーマットを扱う場合、4:2:0フォーマットで必要なメモリより大きなメモリを必要とする。そのため、4:2:0フォーマットのみに準拠した機器では4:4:4フォーマットのコンテンツを復号することはできない。非特許文献２では、コンテンツ（符号化データ）にプロファイル情報を格納し、符号化データが4:4:4フォーマットであるか、4:2:0フォーマットであるかを画像復号装置に通知することで、あらかじめ画像復号装置が符号化データを再生できるかどうかを判断し、再生できる符号化データのみ復号することができるしくみを記載している。

　しかしながら、4:4:4フォーマットのコンテンツの普及が進むに伴い、4:2:0フォーマット準拠の機器でも4:4:4フォーマットのコンテンツを復号する要求が高まっている。4:2:0フォーマット準拠の画像復号装置で4:4:4フォーマットの符号化データを復号できない最大の原因は、参照画像を格納するラインメモリのサイズである。民生用機器は必要最小限のメモリしか持っていない場合が多いため、4:2:0フォーマット準拠の画像復号装置は4:4:4フォーマットの符号化データを復号する場合、必要量の半分しか色差成分のラインメモリを持ち合わせていない。

　そこで、本発明は、上記の課題に鑑みてなされたものであり、その目的は、4:2:0フォーマットおよび4:4:4フォーマットで復号処理に必要なラインメモリサイズを共通化し、4:4:4フォーマットの符号化データを再生する場合に必要なメモリサイズを削減することである。

　本発明の一態様に係る画像符号化装置は、前記入力動画像の１画面を複数の画素からなるブロックに分割する手段と、前記ブロックを単位として、対象ブロックの隣接ブロックの画素（参照画素）を参照し、イントラ予測を行い、予測画素値を算出する予測手段と、前記入力動画像から前記予測画素値を減算し、予測誤差を算出する手段と、前記予測誤差を変換、量子化し、量子化変換係数を出力する手段と、前記量子化変換係数を可変長符号化する手段とを備え、前記予測手段は、イントラ予測を実施する対象ブロックの左側のブロックの画素と、上側のブロックの画素とを参照し、色差成分において、前記上側のブロックの参照画素は、対象ブロックの２画素毎に１画素（第１の参照画素）を参照し、残りの１画素（第２の参照画素）は、第１の参照画素から補間することで導出し、前記予測手段は、第１の参照画素と第２の参照画素を参照して、対象ブロックの色差成分の各画素のイントラ予測値を算出することを特徴とする。

　本発明の一態様に係る画像復号装置は、複数の画素からなるブロックを処理単位として、符号化データを可変長復号して量子化変換係数を出力する手段と、量子化変換係数を逆量子化、逆変換して予測誤差を出力する手段と、前記ブロックを単位として、対象ブロックの隣接ブロックの画素（参照画素）を参照し、イントラ予測を行い、予測画素値を算出する予測手段と、前記予測画素値と前記予測誤差を加算する手段とを備え、前記予測手段は、イントラ予測を実施する対象ブロックの左側のブロックの画素と、上側のブロックの画素とを参照し、色差成分において、前記上側のブロックの参照画素は、対象ブロックの２画素毎に１画素（第１の参照画素）を参照し、残りの１画素（第２の参照画素）は、第１の参照画素から補間することで導出し、前記予測手段は、第１の参照画素と第２の参照画素を参照して、対象ブロックの色差成分の各画素のイントラ予測値を算出することを特徴とする。

　本発明の一態様によれば、4:2:0フォーマット準拠の画像復号装置で4:4:4フォーマットの符号化データを復号することができる。

本発明の一実施形態に係る画像伝送システムの構成を示す概略図である。本発明の一実施形態に係る符号化ストリームのデータの階層構造を示す図である。 PU分割モードのパターンを示す図である。（ａ）～（ｈ）は、それぞれ、PU分割モードが、2Nx2N、2NxN、2NxnU、2NxnD、Nx2N、nLx2N、nRx2N、及び、NxNの場合のパーティション形状について示している。参照ピクチャ及び参照ピクチャリストの一例を示す概念図である。本発明の一実施形態に係る画像復号装置の構成を示すブロック図である。本発明の一実施形態に係る画像符号化装置の構成を示すブロック図である。 4:2:0および4:4:4フォーマットを説明する図である。本発明の一実施形態に係る画像符号化装置を搭載した送信装置、及び、画像復号装置を搭載した受信装置の構成について示した図である。（ａ）は、画像符号化装置を搭載した送信装置を示しており、（ｂ）は、画像復号装置を搭載した受信装置を示している。本発明の一実施形態に係る画像符号化装置を搭載した記録装置、及び、画像復号装置を搭載した再生装置の構成について示した図である。（ａ）は、画像符号化装置を搭載した記録装置を示しており、（ｂ）は、画像復号装置を搭載した再生装置を示している。イントラ予測の対象画素と参照画素を説明する図である。イントラ予測の参照メモリを説明する図である。ループフィルタの対象画素と参照画素を説明する図である。ループフィルタの対象画素と参照画素を説明する図である。ループフィルタの参照メモリを説明する図である。参照メモリへのアクセスを説明するフローチャートである。 4:2:0フォーマットの画像を格納する参照メモリの課題を示す図である。イントラ予測における内部メモリと参照メモリの関係を示す図である。イントラ予測における内部メモリと参照メモリの関係を示す図である。本発明の一実施形態の参照メモリへのアクセスを説明するフローチャートである。本発明の一実施形態の参照メモリに格納する画素を説明する図である。本発明の一実施形態の参照メモリに格納されていない画素の補間方法を説明する図である。ループフィルタの参照メモリの一例を示す図である。本発明の一実施形態の参照メモリへの画像の格納方法を示す図である。本発明の一実施形態のループフィルタのフィルタリング方法を説明する図である。本発明の一実施形態のループフィルタの別のフィルタリング方法を説明する図である。本発明の一実施形態のALFのフィルタリング方法を説明する別の図である。 ALFのフィルタ形状を示す図である。 CTUとCUの関係を説明する図である。本発明の一実施形態の動作の一部を説明するフローチャートである。本発明の一実施形態のALFの参照メモリを説明する図である。

　　（実施形態１）
　以下、図面を参照しながら本発明の実施形態について説明する。

　図１は、本実施形態に係る画像伝送システム１の構成を示す概略図である。

　画像伝送システム１は、符号化対象画像を符号化した符号を伝送し、伝送された符号を復号し画像を表示するシステムである。画像伝送システム１は、画像符号化装置１１、ネットワーク２１、画像復号装置３１及び画像表示装置４１を含んで構成される。

　画像符号化装置１１には、単一レイヤもしくは複数レイヤの画像を示す画像Ｔが入力される。レイヤとは、ある時間を構成するピクチャが１つ以上ある場合に、複数のピクチャを区別するために用いられる概念である。たとえば、同一ピクチャを、画質や解像度の異なる複数のレイヤで符号化するとスケーラブル符号化になり、異なる視点のピクチャを複数のレイヤで符号化するとビュースケーラブル符号化となる。複数のレイヤのピクチャ間で予測（インターレイヤ予測、インタービュー予測）を行う場合には、符号化効率が大きく向上する。また予測を行わない場合（サイマルキャスト）の場合にも、符号化データをまとめることができる。

　ネットワーク２１は、画像符号化装置１１が生成した符号化ストリームＴｅを画像復号装置３１に伝送する。ネットワーク２１は、インターネット（internet）、広域ネットワーク（WAN:Wide Area Network）、小規模ネットワーク（LAN:Local Area Network）またはこれらの組み合わせである。ネットワーク２１は、必ずしも双方向の通信網に限らず、地上デジタル放送、衛星放送等の放送波を伝送する一方向の通信網であっても良い。また、ネットワーク２１は、DVD（Digital Versatile Disc）、BD（Blu-ray Disc:登録商標）等の符号化ストリームTeを記録した記憶媒体で代替されても良い。

　画像復号装置３１は、ネットワーク２１が伝送した符号化ストリームTeのそれぞれを復号し、それぞれ復号した１または複数の復号画像Tdを生成する。

　画像表示装置４１は、画像復号装置３１が生成した１または複数の復号画像Tdの全部または一部を表示する。画像表示装置４１は、例えば、液晶ディスプレイ、有機ＥＬ（Electro-luminescence）ディスプレイ等の表示デバイスを備える。また、空間スケーラブル符号化、ＳＮＲスケーラブル符号化では、画像復号装置３１、画像表示装置４１が高い処理能力を有する場合には、画質の高い拡張レイヤ画像を表示し、より低い処理能力しか有しない場合には、拡張レイヤほど高い処理能力、表示能力を必要としないベースレイヤ画像を表示する。

　　＜演算子＞
　本明細書で用いる演算子を以下に記載する。

　>>は右ビットシフト、<<は左ビットシフト、&はビットワイズAND、|はビットワイズOR、|=はOR代入演算子である。

　x ? y : zは、xが真（0以外）の場合にy、xが偽（0）の場合にzをとる３項演算子である。

　Clip3(a, b, c) は、cをa以上b以下の値にクリップする関数であり、c<aの場合にはaを返し、c>bの場合にはbを返し、その他の場合にはcを返す関数である（ただし、a<=b）。

　　＜符号化ストリームTeの構造＞
　本実施形態に係る画像符号化装置１１及び画像復号装置３１の詳細な説明に先立って、画像符号化装置１１によって生成され、画像復号装置３１によって復号される符号化ストリームTeのデータ構造について説明する。

　図２は、符号化ストリームTeにおけるデータの階層構造を示す図である。符号化ストリームTeは、例示的に、シーケンス、及びシーケンスを構成する複数のピクチャを含む。図２の（ａ）～（ｆ）は、それぞれ、シーケンスSEQを既定する符号化ビデオシーケンス、ピクチャPICTを規定する符号化ピクチャ、スライスSを規定する符号化スライス、スライスデータを規定する符号化スライスデータ、符号化スライスデータに含まれる符号化ツリーユニット、符号化ツリーユニットに含まれる符号化ユニット（Coding Unit；CU）を示す図である。

　　（符号化ビデオシーケンス）
　符号化ビデオシーケンスでは、処理対象のシーケンスSEQを復号するために画像復号装置３１が参照するデータの集合が規定されている。シーケンスSEQは、図２の（ａ）に示すように、ビデオパラメータセット（Video Parameter Set）、シーケンスパラメータセットSPS（Sequence Parameter Set）、ピクチャパラメータセットPPS（Picture Parameter Set）、ピクチャPICT、及び、付加拡張情報SEI（Supplemental Enhancement Information）を含んでいる。ここで＃の後に示される値はレイヤIDを示す。図２では、#0と#1すなわちレイヤ０とレイヤ１の符号化データが存在する例を示すが、レイヤの種類及びレイヤの数はこれによらない。

　ビデオパラメータセットVPSは、複数のレイヤから構成されている動画像において、複数の動画像に共通する符号化パラメータの集合及び動画像に含まれる複数のレイヤ及び個々のレイヤに関連する符号化パラメータの集合が規定されている。

　シーケンスパラメータセットSPSでは、対象シーケンスを復号するために画像復号装置３１が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの幅や高さが規定される。なお、SPSは複数存在してもよい。その場合、PPSから複数のSPSの何れかを選択する。

　ピクチャパラメータセットPPSでは、対象シーケンス内の各ピクチャを復号するために画像復号装置３１が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの復号に用いられる量子化幅の基準値（pic_init_qp_minus26）や重み付き予測の適用を示すフラグ（weighted_pred_flag）が含まれる。なお、PPSは複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のPPSの何れかを選択する。

　　（符号化ピクチャ）
　符号化ピクチャでは、処理対象のピクチャPICTを復号するために画像復号装置３１が参照するデータの集合が規定されている。ピクチャPICTは、図２の（ｂ）に示すように、スライスS0～S_NS-1を含んでいる（ＮＳはピクチャPICTに含まれるスライスの総数）。

　なお、以下、スライスS0～S_NS-1のそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する符号化ストリームTeに含まれるデータであって、添え字を付している他のデータについても同様である。

　　（符号化スライス）
　符号化スライスでは、処理対象のスライスSを復号するために画像復号装置３１が参照するデータの集合が規定されている。スライスSは、図２の（ｃ）に示すように、スライスヘッダSH、及び、スライスデータSDATAを含んでいる。

　スライスヘッダSHには、対象スライスの復号方法を決定するために画像復号装置３１が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報（slice_type）は、スライスヘッダSHに含まれる符号化パラメータの一例である。

　スライスタイプ指定情報により指定可能なスライスタイプとしては、（１）符号化の際にイントラ予測のみを用いるIスライス、（２）符号化の際に単方向予測、または、イントラ予測を用いるPスライス、（３）符号化の際に単方向予測、双方向予測、または、イントラ予測を用いるBスライスなどが挙げられる。なお、インター予測は、単予測、双予測に限定されず、より多くの参照ピクチャを用いて予測画像を生成してもよい。以下、P、Bスライスと呼ぶ場合には、インター予測を用いることができるブロックを含むスライスを指す。

　なお、スライスヘッダSHには、上記符号化ビデオシーケンスに含まれる、ピクチャパラメータセットPPSへの参照（pic_parameter_set_id）を含んでいても良い。

　　（符号化スライスデータ）
　符号化スライスデータでは、処理対象のスライスデータSDATAを復号するために画像復号装置３１が参照するデータの集合が規定されている。スライスデータSDATAは、図２の（ｄ）に示すように、符号化ツリーユニット（CTU:Coding Tree Unit、CTUブロック）を含んでいる。CTUは、スライスを構成する固定サイズ（例えば64x64）のブロックであり、最大符号化単位（LCU:Largest Coding Unit）と呼ぶこともある。

　　（符号化ツリーユニット）
　図２の（ｅ）に示すように、処理対象の符号化ツリーユニットを復号するために画像復号装置３１が参照するデータの集合が規定されている。符号化ツリーユニットは、再帰的な４分木分割（QT分割）または２分木分割（BT分割）により符号化処理の基本的な単位である符号化ユニット（CU:Coding Unit）に分割される。再帰的な４分木分割または２分木分割により得られる木構造を符号化ツリー（CT:Coding Tree）、木構造のノードのことを符号化ノード（CN:Coding Node）と称する。４分木及び２分木の中間ノードは、符号化ノードであり、符号化ツリーユニット自身も最上位の符号化ノードとして規定される。

　CTは、CT情報として、QT分割を行うか否かを示すQT分割フラグ（cu_split_flag）、及びBT分割の分割方法を示すBT分割モード（split_bt_mode）を含む。cu_split_flag及び／又はsplit_bt_modeは符号化ノードCNごとに伝送される。cu_split_flagが１の場合には、符号化ノードCNは４つの符号化ノードCNに分割される。cu_split_flagが０の場合、split_bt_modeが１の場合には、符号化ノードCNは２つの符号化ノードCNに水平分割される。split_bt_modeが２の場合には、符号化ノードCNは２つの符号化ノードCNに垂直分割される。split_bt_modeが０の場合には、符号化ノードCNは分割されず、１つの符号化ユニットCUをノードとして持つ。符号化ユニットCUは符号化ノードの末端ノード（リーフノード）であり、これ以上分割されない。

　また、符号化ツリーユニットCTUのサイズが64x64画素の場合には、符号化ユニットのサイズは、64x64画素、64x32画素、32x64画素、32x32画素、64x16画素、16x64画素、32x16画素、16x32画素、16x16画素、64x8画素、8x64画素、32x8画素、8x32画素、16x8画素、8x16画素、8x8画素、64x4画素、4x64画素、32x4画素、4x32画素、16x4画素、4x16画素、8x4画素、4x8画素、及び、4x4画素の何れかをとり得る。

　　（符号化ユニット）
　図２の（ｆ）に示すように、処理対象の符号化ユニットを復号するために画像復号装置３１が参照するデータの集合が規定されている。具体的には、符号化ユニットは、予測ツリー、変換ツリー、CUヘッダCUHから構成される。CUヘッダでは予測モード、分割方法（PU分割モード）等が規定される。

　予測ツリーでは、符号化ユニットを１または複数に分割した各予測ユニット（PU）の予測パラメータ（参照ピクチャインデックス、動きベクトル等）が規定される。別の表現でいえば、予測ユニットは、符号化ユニットを構成する１または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた１または複数の予測ユニットを含む。なお、以下では、予測ユニットをさらに分割した予測単位を「サブブロック」と呼ぶ。サブブロックは、複数の画素によって構成されている。予測ユニットとサブブロックのサイズが等しい場合には、予測ユニット中のサブブロックは１つである。予測ユニットがサブブロックのサイズよりも大きい場合には、予測ユニットは、サブブロックに分割される。たとえば予測ユニットが8x8、サブブロックが4x4の場合には、予測ユニットは水平に２分割、垂直に２分割からなる、４つのサブブロックに分割される。

　予測処理は、この予測ユニット（サブブロック）ごとに行ってもよい。

　予測ツリーにおける分割の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との２つがある。イントラ予測とは、同一ピクチャ内の予測であり、インター予測とは、互いに異なるピクチャ間（例えば、表示時刻間、レイヤ画像間）で行われる予測処理を指す。

　イントラ予測の場合、分割方法は、2Nx2N（符号化ユニットと同一サイズ）と、NxNとがある。

　また、インター予測の場合、分割方法は、符号化データのPU分割モード（part_mode）により符号化され、2Nx2N（符号化ユニットと同一サイズ）、2NxN、2NxnU、2NxnD、Nx2N、nLx2N、nRx2N、及び、NxNなどがある。なお、2NxN、Nx2Nは1:1の対称分割を示し、
2NxnU、2NxnD及びnLx2N、nRx2Nは、1:3、3:1の非対称分割を示す。CUに含まれるPUを順にPU0、PU1、PU2、PU3と表現する。

　図３の（ａ）～（ｈ）に、それぞれのPU分割モードにおけるパーティションの形状（PU分割の境界の位置）を具体的に図示している。図３の（ａ）は、2Nx2Nのパーティションを示し、（ｂ）、（ｃ）、（ｄ）は、それぞれ、2NxN、2NxnU、及び、2NxnDのパーティション（横長パーティション）を示す。（ｅ）、（ｆ）、（ｇ）は、それぞれ、Nx2N、nLx2N、nRx2Nである場合のパーティション（縦長パーティション）を示し、（ｈ）は、NxNのパーティションを示す。なお、横長パーティションと縦長パーティションを総称して長方形パーティション、2Nx2N、NxNを総称して正方形パーティションと呼ぶ。

　また、変換ツリーにおいては、符号化ユニットが１または複数の変換ユニットに分割され、各変換ユニットの位置とサイズとが規定される。別の表現でいえば、変換ユニットは、符号化ユニットを構成する１または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた１または複数の変換ユニットを含む。

　変換ツリーにおける分割には、符号化ユニットと同一のサイズの領域を変換ユニットとして割り付けるものと、上述したCUの分割と同様、再帰的な４分木分割によるものがある。

　変換処理は、この変換ユニットごとに行われる。

　　（予測パラメータ）
　予測ユニット（PU：Prediction Unit）の予測画像は、PUに付随する予測パラメータによって導出される。予測パラメータには、イントラ予測の予測パラメータもしくはインター予測の予測パラメータがある。

　　（参照ピクチャリスト）
　参照ピクチャリストは、参照ピクチャメモリ３０６に記憶された参照ピクチャからなるリストである。図４は、参照ピクチャ及び参照ピクチャリストの一例を示す概念図である。図４の（ａ）において、矩形はピクチャ、矢印はピクチャの参照関係、横軸は時間、矩形中のI、P、Bは各々イントラピクチャ、単予測ピクチャ、双予測ピクチャ、矩形中の数字は復号順を示す。図に示すように、ピクチャの復号順は、I0、P1、B2、B3、B4であり、表示順は、I0、B3、B2、B4、P1である。図４の（ｂ）に、参照ピクチャリストの例を示す。参照ピクチャリストは、参照ピクチャの候補を表すリストであり、１つのピクチャ（スライス）が１つ以上の参照ピクチャリストを有してもよい。

　　（マージ予測とAMVP予測）
　予測パラメータの復号（符号化）方法には、マージ予測（merge）モードとAMVP（Adaptive Motion Vector Prediction、適応動きベクトル予測）モードがある、マージフラグmerge_flagは、これらを識別するためのフラグである。マージモードは、予測リスト利用フラグpredFlagLX（またはインター予測識別子inter_pred_idc）、参照ピクチャインデックスrefIdxLX、動きベクトルmvLXを符号化データに含めずに、既に処理した近傍PUの予測パラメータから導出する用いるモードである。AMVPモードは、インター予測識別子inter_pred_idc、参照ピクチャインデックスrefIdxLX、動きベクトルmvLXを符号化データに含めるモードである。なお、動きベクトルmvLXは、予測ベクトルmvpLXを識別する予測ベクトルインデックスmvp_LX_idxと差分ベクトルmvdLXとして符号化される。

　　（動きベクトル）
　動きベクトルmvLXは、異なる２つのピクチャ上のブロック間のずれ量を示す。動きベクトルmvLXに関する予測ベクトル、差分ベクトルを、それぞれ予測ベクトルmvpLX、差分ベクトルmvdLXと呼ぶ。

　　（インター予測識別子inter_pred_idcと予測リスト利用フラグpredFlagLX）
　インター予測識別子inter_pred_idcと、予測リスト利用フラグpredFlagL0、predFlagL1の関係は以下のとおりであり、相互に変換可能である。

　inter_pred_idc = （predFlagL1<<１） + predFlagL0
　predFlagL0 = inter_pred_idc & １
　predFlagL1 = inter_pred_idc >> １
　　（イントラ予測モード）
　輝度イントラ予測モードIntraPredModeYは67モードであり、プレーナ予測（0）、DC予測（1）、方向予測（2～66）に対応する。色差イントラ予測モードIntraPredModeCは上記の67モードにCCLM（Colour Component Linear Mode）を加えた68モードである。

　図10(a)は、対象ブロックX（ブロックはCU、PU、TUであってもよい）とその左上、上、右上、左の隣接ブロックAL、A、AR、Lを示す図である。図10(b)は、4:2:0フォーマットにおける、M*Nサイズの対象ブロックXの各画素x[m,n]（m=0..M-1、n=0..N-1）、およびその隣接ブロック中の、イントラ予測時に参照する参照画素r[-1,n]、r[m,-1]（m=0..2M-1、n=-1..2N-1）を示す図である。4:2:0フォーマットの場合、輝度対象ブロックは外側の実線のブロック、色差対象ブロックは内側の破線のブロックのサイズである。従って、色差対象ブロックの場合、各画素x[m,n]（m=0..M/2-1、n=0..N/2-1）、および参照画素r[-1,n]、r[m,-1]（m=0..M-1、n=-1..N-1）である。なお、以降では色差成分のブロックサイズ(M/2,N/2)を(M2,N2)と表現する。

　プレーナ予測の予測画素値は下式で算出する。

　　predSamples[m,n]=((M-1-m)*r[-1,n]+(m+1)*r[M,-1]+M/2)>>log2(M)+((N-1-n)*r[m,-1]+(n+1)*r[-1,N]+N/2)>>log2(N)　（式１）
　DC予測の予測画素値は下式で算出する。

　　　　　　　　　　　M-1　　　　　　　　　　　N-1
　　predSamples[m,n]=(Σr[m,-1]+M/2)>>log2(M)+(Σr[-1,n]+N/2)>>log2(N)　（式２）
　　　　　　　　　　　m=0　　　　　　　　　　　n=0
　方向予測の予測画素値は下式で算出する。

　　predSamples[m,n]=(w*r[m+d,-1]+(W-w)*r[m+d+1,-1]+W/2)>>log2(W)　（式３）
ここで、dは予測方向に応じた画素位置の変位であり、wは重み係数である。Wは例えば重みの和であり例えば32、64、128である。

　デブロッキングフィルタは、ブロック境界を介して互いに隣接する輝度成分の画素のデブロック前画素値の差が予め定められた閾値よりも小さい場合に、当該ブロック境界に対して、輝度および色差成分の画素にデブロッキング処理を施すことによって、当該ブロック境界付近の画像の平滑化を行う。

　図12(a)は水平方向に境界を接する２つの色差成分のブロックP（画素値はp[m,n]）、Q（画素値はq[m,n]）を示す。デブロッキングフィルタを施すと判定された場合、デブロッキングフィルタは、ブロック境界からT画素以下の画素を参照し、斜線で示すフィルタ対象画素p[m,0]、q[m,0]の画素値を下式で補正することによって、ブロック歪を除去する。以下ではT=4、参照画素はp[m,1],p[m,0],q[m,0],q[m,1]の例を説明する。

　　Δ= Clip3(-tc,tc,(((q[m,0]-p[m,0])<<2)+p[m,1]-q[m,1]+4)>>3)
　　p[m,0] = Clip1(p[m,0]+Δ)　　　　　　　　　　　　　　　　　　（式４）
　　q[m,0] = Clip1(q[m,0]-Δ)
ここでtcはあらかじめ定められた閾値、Clip1(x)は0<=x<=色差の最大値、を表す。

　SAOは主にデブロッキングフィルタ後に適用するフィルタであり、リンギング歪や量子化歪を除去する効果がある。SAOはCTU単位の処理であり、画素値をいくつかのカテゴリに分類して、カテゴリ毎に画素単位にオフセットを加減算するフィルタである。SAOのエッジオフセット（EO）処理は、対象画素と隣接画素（参照画素）との大小関係に応じて画素値に加算するオフセット値を決定する。

　図12(b)は水平方向に境界を接する２つの色差成分のブロックP（画素値はp[m,n]）、Q（画素値はq[m,n]）を示す。EO処理は、斜線で示すEO対象画素p[m,0]に対し、縦方向、横方向、左上右下の斜め方向、右上左下の斜め方向に接する(p[m,1],q[m,0])、(p[m-1,0],p[m+1,0])、(p[m-1,1],q[m+1,0])、(p[m+1,1],q[m-1,0])の中から符号化データで通知される画素を参照して、オフセットoffsetPを選択し、p[m,0]にオフセットを加減算することによって、リンギング、量子化歪を除去する。同様に、図12(c)は斜線で示すEO処理対象画素q[m,0]に対し、縦方向、横方向、左上右下の斜め方向、右上左下の斜め方向に接する(p[m,0],q[m,1])、(q[m-1,0],q[m+1,0])、(p[m-1,0],q[m+1,1])、(p[m+1,0],q[m-1,1])の中から符号化データで通知される画素を参照して、オフセットoffsetQを選択し、q[m,0]にオフセットを加減算することによって、リンギング、量子化歪を除去する。

　　p[m,0] = p[m,0]+offsetP　（式５）
　　q[m,0] = q[m,0]+offsetQ
　ＡＬＦは、ＡＬＦ前復号画像に対して、符号化データＴｅから復号されたＡＬＦパラメータＡＬＦＰを用いた適応的フィルタ処理を施すことによって、ＡＬＦ済復号画像を生成する。

　図12(d)～(g)は水平方向に境界を接する２つの色差成分のブロックP（画素値はp[m,n]）、Q（画素値はq[m,n]）でのALF処理を示す図である。ALFは、斜線で示すALF対象画素p[m,1]、p[m,0]、q[m,0]、q[m,1]に対し、菱形形状のSxSタップのフィルタをかけることで画質を向上させる。以下ではS=5の場合について説明する。つまり、図12(d)～(g)に示す5ライン分の隣接画素を参照する。

　図13は、ループフィルタで参照する参照画素を格納するメモリを説明する図である。図13(a)はデブロッキングフィルタおよびSAO(EO)の色差成分の参照画素を格納するメモリ、図13(b)はALFが加わった場合の色差成分の参照画素を格納するメモリである。これらは対象ブロックの１ブロック行前に復号したブロックの復号画素が格納されたラインメモリである。4:2:0フォーマットの場合、このメモリには、width*heightサイズの画像のwidth画素数/2*ライン数分の色差成分の参照画素が格納される。例えば4K(3840*2160)画像では、デブロッキングフィルタおよびSAO(EO)の色差成分の参照画素は、図13(a)に示すように2ライン分の参照画素が格納されるので、Cb、Cr成分各々1920画素*2である。さらにALFが処理される場合は、図13(b)に示すように4ライン分の参照画素が格納されるので、Cb、Cr成分各々1920画素*4である。

　　（画像復号装置の構成）
　次に、本実施形態に係る画像復号装置３１の構成について説明する。図５は、本実施形態に係る画像復号装置３１の構成を示す概略図である。画像復号装置３１は、エントロピー復号部３０１、予測パラメータ復号部（予測画像復号装置）３０２、ループフィルタ３０５、参照ピクチャメモリ３０６、予測パラメータメモリ３０７、予測画像生成部（予測画像生成装置）３０８、逆量子化・逆変換部３１１、及び加算部３１２を含んで構成される。なお、画像符号化装置１１に合わせ、画像復号装置３１にループフィルタ３０５が含まれない構成もある。

　また、予測パラメータ復号部３０２は、インター予測パラメータ復号部３０３及びイントラ予測パラメータ復号部３０４を含んで構成される。予測画像生成部３０８は、インター予測画像生成部３０９及びイントラ予測画像生成部３１０を含んで構成される。

　エントロピー復号部３０１は、外部から入力された符号化ストリームTeに対してエントロピー復号を行って、個々の符号（シンタックス要素）を分離し復号する。分離された符号には、予測画像を生成するための予測パラメータ及び、差分画像を生成するための残差情報などがある。

　エントロピー復号部３０１は、分離した符号の一部を予測パラメータ復号部３０２に出力する。分離した符号の一部とは、例えば、予測モードpredMode、PU分割モードpart_mode、マージフラグmerge_flag、マージインデックスmerge_idx、インター予測識別子inter_pred_idc、参照ピクチャインデックスref_Idx_lX、予測ベクトルインデックスmvp_LX_idx、差分ベクトルmvdLXである。どの符号を復号するかの制御は、予測パラメータ復号部３０２の指示に基づいて行われる。エントロピー復号部３０１は、量子化係数を逆量子化・逆変換部３１１に出力する。この量子化係数は、符号化処理において、残差信号に対してDCT（Discrete Cosine Transform、離散コサイン変換）、DST（Discrete Sine Transform、離散サイン変換）、KLT（Karyhnen Loeve Transform、カルーネンレーベ変換）等の周波数変換を行い量子化して得られる係数である。

　インター予測パラメータ復号部３０３は、エントロピー復号部３０１から入力された符号に基づいて、予測パラメータメモリ３０７に記憶された予測パラメータを参照してインター予測パラメータを復号する。

　インター予測パラメータ復号部３０３は、復号したインター予測パラメータを予測画像生成部３０８に出力し、また予測パラメータメモリ３０７に記憶する。

　イントラ予測パラメータ復号部３０４は、エントロピー復号部３０１から入力された符号に基づいて、予測パラメータメモリ３０７に記憶された予測パラメータを参照してイントラ予測パラメータを復号する。イントラ予測パラメータとは、CUを１つのピクチャ内で予測する処理で用いるパラメータ、例えば、イントラ予測モードIntraPredModeである。イントラ予測パラメータ復号部３０４は、復号したイントラ予測パラメータを予測画像生成部３０８に出力し、また予測パラメータメモリ３０７に記憶する。

　ループフィルタ３０５は、加算部３１２が生成したCUの復号画像に対し、デブロッキングフィルタ３１３、サンプル適応オフセット（SAO）３１４、適応ループフィルタ（ALF）３１５等のフィルタを施す。なお、ループフィルタ３０５は画像符号化装置と対になっていれば、必ずしも上記３種類のフィルタを含まなくてもよく、例えばデブロッキングフィルタ３１３のみの構成であってもよい。

　参照ピクチャメモリ３０６は、加算部３１２が生成したCUの復号画像を、復号対象のピクチャ及びCU毎に予め定めた位置に記憶する。

　予測パラメータメモリ３０７は、予測パラメータを、復号対象のピクチャ及び予測ユニット（もしくはサブブロック、固定サイズブロック、ピクセル）毎に予め定めた位置に記憶する。具体的には、予測パラメータメモリ３０７は、インター予測パラメータ復号部３０３が復号したインター予測パラメータ、イントラ予測パラメータ復号部３０４が復号したイントラ予測パラメータ及びエントロピー復号部３０１が分離した予測モードpredModeを記憶する。記憶されるインター予測パラメータには、例えば、予測リスト利用フラグpredFlagLX（インター予測識別子inter_pred_idc）、参照ピクチャインデックスrefIdxLX、動きベクトルmvLXがある。

　予測画像生成部３０８には、エントロピー復号部３０１から入力された予測モードpredModeが入力され、また予測パラメータ復号部３０２から予測パラメータが入力される。また、予測画像生成部３０８は、参照ピクチャメモリ３０６から参照ピクチャを読み出す。予測画像生成部３０８は、予測モードpredModeが示す予測モードで、入力された予測パラメータと読み出した参照ピクチャ（参照ピクチャブロック）を用いてPUもしくはサブブロックの予測画像を生成する。

　ここで、予測モードpredModeがインター予測モードを示す場合、インター予測画像生成部３０９は、インター予測パラメータ復号部３０３から入力されたインター予測パラメータと読み出した参照ピクチャ（参照ピクチャブロック）を用いてインター予測によりPUもしくはサブブロックの予測画像を生成する。

　インター予測画像生成部３０９は、予測リスト利用フラグpredFlagLXが１である参照ピクチャリスト（L0リスト、もしくはL1リスト）に対し、参照ピクチャインデックスrefIdxLXで示される参照ピクチャから、復号対象PUを基準として動きベクトルmvLXが示す位置にある参照ピクチャブロックを参照ピクチャメモリ３０６から読み出す。インター予測画像生成部３０９は、読み出した参照ピクチャブロックをもとに予測を行ってPUの予測画像を生成する。インター予測画像生成部３０９は、生成したPUの予測画像を加算部３１２に出力する。ここで、参照ピクチャブロックとは、参照ピクチャ上の画素の集合（通常矩形であるのでブロックと呼ぶ）であり、PUもしくはサブブロックの予測画像を生成するために参照する領域である。

　予測モードpredModeがイントラ予測モードを示す場合、イントラ予測画像生成部３１０は、イントラ予測パラメータ復号部３０４から入力されたイントラ予測パラメータと読み出した参照ピクチャを用いてイントラ予測を行う。具体的には、イントラ予測画像生成部３１０は、復号対象のピクチャであって、既に復号されたブロック（PU）のうち、復号対象ブロックから予め定めた範囲にある隣接ブロックを参照ピクチャメモリ３０６（フレームメモリ、参照メモリ）から内部メモリ（内部参照メモリ）に読み出す。

　参照ピクチャメモリ３０６は、復号画像を保持するためのフレームメモリと、イントラ予測やループフィルタ用に部分画像のみを保持するメモリ（コラムメモリ、ラインメモリ）、CTUブロック内部の部分画像を保持するメモリに分かれても良い。以下、参照メモリと記載する場合には、主に、イントラ予測やループフィルタ用に部分画像のみを保持するメモリのことを指す。

　図11は、イントラ予測で参照する参照画素を後続のブロックの予測のために格納する参照メモリ（コラムメモリ、ラインメモリ）を説明する図である。図11(a)は、4:2:0フォーマット準拠の画像復号装置において、輝度成分の参照画素を格納する参照メモリ、図11(b)は色差成分の参照画素を格納する参照メモリである。図11(a)において、(a-1)は輝度対象ブロックの左側の参照画素r[-1,-1]～r[-1,2N-1]を格納するメモリ、(a-2)は上側の参照画素r[0,-1]～r[M-1,-1]を格納するメモリである。(b-1)は色差対象ブロックの左側の参照画素r[-1,-1]～r[-1,N-1]を格納するメモリ、(b-2)は上側の参照画素r[0,-1]～r[M2-1,-1]を格納するメモリである。対象ブロックの左側の参照画素を格納するメモリ(a-1)、(b-1)は、１つ前に復号したブロックの復号画素が格納され、ブロックの処理が終了する毎に更新されるコラムメモリである。対象ブロックの上側の参照画素を格納するメモリ(a-2)、(b-2)は、１ブロック行前に復号したブロックの復号画素が格納されたラインメモリである。コラムメモリは複数の列、ラインメモリは複数のラインを保持してもよい。例えば、width*heightサイズの画像において、輝度成分はwidth画素数*ライン数分、色差成分はwidth/2画素数*ライン数分の参照画素が参照メモリのラインメモリに格納される。例えば4K(3840*2160)画像で１ライン分の参照画素が格納される4:2:0フォーマットの場合、輝度成分は3840画素、色差成分はCb、Cr成分各々1920画素である。

　なお、図の例では、処理するブロックサイズが固定の場合を説明したが、可変ブロックサイズであったり、再帰的なツリー分割（四分木ツリーや二分木ツリー）によるものであってもよい。例えば、CTUブロックを再帰的に分割する場合、参照メモリとしては、対象ブロックが含まれるCTU内部用参照メモリと、CTU境界をまたいで参照するためのCTU外部用参照メモリから構成する。対象ブロックが参照する隣接画像がCTUブロック内にある場合、CTU内部用メモリから参照し、対象ブロックが参照する隣接画像がCTUブロック内にない場合、CTU外部用参照メモリから参照する。CTU外部用参照メモリは、１つ前に復号したCTUブロックの復号画素が格納され、ブロックの処理が終了する毎に更新されるコラムメモリと、１CTUブロック行前に復号したブロックの復号画素が格納されたラインメモリを用いる。

　内部メモリは、好適には、高速にアクセスできるメモリであり、参照ピクチャメモリの内容をコピーして用いる。予め定めた範囲とは、復号対象ブロックがいわゆるラスタースキャンの順序で順次移動する場合、例えば、左、左上、上、右上の隣接ブロックのうちのいずれかであり、イントラ予測モードによって異なる。ラスタースキャンの順序とは、各ピクチャにおいて、上端から下端まで各行について、順次左端から右端まで移動させる順序である。

　イントラ予測画像生成部３１０は、読み出した隣接ブロックについてイントラ予測モードIntraPredModeが示す予測モードで予測を行ってブロックの予測画像を生成する。イントラ予測画像生成部３１０は、生成したブロックの予測画像を加算部３１２に出力する。

　図14(a)は、イントラ予測に伴う参照メモリに格納された参照画素へのアクセスを説明するフローチャートである。イントラ予測画像生成部310は、参照メモリから対象ブロックの予測に必要な参照画素を読み出し、イントラ予測画像生成部310の（図示されない）内部メモリに格納する（S1402）。イントラ予測画像生成部310は、内部メモリに格納された参照画素を用いてイントラ予測を実施する（S1404）。対象ブロックの再構成処理（S1406）が終了した後、画像復号装置31は、対象ブロックの一番下のラインを参照メモリに格納する（S1408）。画像復号装置31は、対象ブロックが画面の最後のブロックかどうかをチェックし（S1410）、最後のブロックでない場合（S1410でN）、次のブロックの処理に移り（S1412）、S1402からの処理を繰り返す。最後のブロックの場合（S1410でY）、処理を終了する。参照メモリへのアクセスに関しては画像符号化装置11、画像復号装置31とも共通の処理であり、後述の画像符号化装置11の説明では、上記の画像復号装置31を画像符号化装置11に読み替え、再構成処理を局部復号時の再構成処理と読み替えるだけであるので、説明を省略する。

　逆量子化・逆変換部３１１は、エントロピー復号部３０１から入力された量子化変換係数を逆量子化し、逆DST、逆KLT等の逆周波数変換を行い、予測残差信号を算出する。逆量子化・逆変換部３１１は、算出した残差信号を加算部３１２に出力する。

　加算部３１２は、インター予測画像生成部３０９またはイントラ予測画像生成部３１０から入力されたブロックの予測画像と逆量子化・逆変換部３１１から入力された残差信号を画素毎に加算して、ブロックの復号画像を生成する。加算部３１２は、生成したブロックの復号画像をデブロッキングフィルタ３１３、SAO（サンプル適応オフセット）部３１４、またはＡＬＦ３１５の少なくとも何れかに出力する。

　デブロッキングフィルタ３１３は、加算部の出力であるブロックの復号画像に対し、デブロッキング処理を施し、デブロック済復号画像として出力する。

　SAO部３１４は、加算部３１２の出力画像、またはデブロッキングフィルタ３１３より出力されたデブロック済復号画像に対して、符号化データＴｅから復号されたオフセットを用いたオフセットフィルタ処理を施し、SAO済復号画像として出力する。

　ＡＬＦ３１５は、加算部３１２の出力画像、デブロック済復号画像、またはSAO済復号画像に対して、符号化データＴｅから復号されたＡＬＦパラメータＡＬＦＰを用いた適応的フィルタ処理を施し、ＡＬＦ済復号画像を生成する。ＡＬＦ済復号画像は、復号画像Ｔｄとして外部に出力されると共に、エントロピー復号部３０１によって符号化データＴｅから復号されたＰＯＣ情報と関連付けて参照ピクチャメモリ３０６に格納される。

　図14(b)は、ループフィルタに伴う参照メモリに格納された参照画素へのアクセスを説明するフローチャートである。ループフィルタ305は、参照メモリから対象ブロックの予測に必要な参照画素を読み出し、ループフィルタ305の（図示されない）内部メモリに格納する（S1414）。ループフィルタ305は、内部メモリに格納された参照画素を用いてデブロッキングフィルタ、SAO、ALF等のループフィルタ処理を実施する（S1416）。ループフィルタ処理が終了した後、画像復号装置31（あるいはループフィルタ305）は、対象ブロックの一番のラインから所定数のラインを参照メモリに格納する（S1420）。画像復号装置31は、対象ブロックが画面の最後のブロックかどうかをチェックし（S1422）、最後のブロックでない場合（S1422でN）、次のブロックの処理に移り（S1424）、S1414からの処理を繰り返す。最後のブロックの場合（S1422でY）、処理を終了する。参照メモリへのアクセスに関しては画像符号化装置11、画像復号装置31とも共通の処理であり、後述の画像符号化装置11の説明では、上記の画像復号装置31を画像符号化装置11に読み替え、ループフィルタ305をループフィルタ107と読み替えるだけであるので、説明を省略する。

　　（画像符号化装置の構成）
　次に、本実施形態に係る画像符号化装置１１の構成について説明する。図６は、本実施形態に係る画像符号化装置１１の構成を示すブロック図である。画像符号化装置１１は、予測画像生成部１０１、減算部１０２、変換・量子化部１０３、エントロピー符号化部１０４、逆量子化・逆変換部１０５、加算部１０６、ループフィルタ１０７、予測パラメータメモリ（予測パラメータ記憶部、フレームメモリ）１０８、参照ピクチャメモリ（参照画像記憶部、フレームメモリ）１０９、符号化パラメータ決定部１１０、予測パラメータ符号化部１１１を含んで構成される。予測パラメータ符号化部１１１は、インター予測パラメータ符号化部１１２及びイントラ予測パラメータ符号化部１１３を含んで構成される。なお、画像符号化装置１１はループフィルタ１０７が含まれない構成であってもよい。

　予測画像生成部１０１は画像Ｔの各ピクチャについて、そのピクチャを分割した領域である符号化ユニットCU毎に予測ユニットPUの予測画像Ｐを生成する。ここで、予測画像生成部１０１は、予測パラメータ符号化部１１１から入力された予測パラメータに基づいて参照ピクチャメモリ１０９から復号済のブロックを読み出す。予測パラメータ符号化部１１１から入力された予測パラメータとは、例えばインター予測の場合、動きベクトルである。予測画像生成部１０１は、対象PUを起点として動きベクトルが示す参照画像上の位置にあるブロックを読み出す。またイントラ予測の場合、予測パラメータとは例えばイントラ予測モードである。イントラ予測モードで使用する隣接ブロック（PU）の画素値を参照ピクチャメモリ１０９から読み出し、ブロックの予測画像Pを生成する。予測画像生成部１０１は、読み出した参照ピクチャブロックについて複数の予測方式のうちの１つの予測方式を用いてブロックの予測画像Ｐを生成する。予測画像生成部１０１は、生成したブロックの予測画像Ｐを減算部１０２に出力する。

　なお、予測画像生成部１０１は、既に説明した予測画像生成部３０８と同じく、インター予測画像生成部３０９およびイントラ予測画像生成部３１０を備え、同じ動作をするためここでの説明を省略する。

　予測画像生成部１０１は、予測パラメータ符号化部から入力されたパラメータを用いて、参照ピクチャメモリから読み出した参照ブロックの画素値をもとにPU（ブロック）の予測画像Pを生成する。予測画像生成部１０１で生成した予測画像は減算部１０２、加算部１０６に出力される。

　減算部１０２は、予測画像生成部１０１から入力されたPUの予測画像Ｐの信号値を、画像Ｔの対応するPUの画素値から減算して、残差信号を生成する。減算部１０２は、生成した残差信号を変換・量子化部１０３に出力する。

　変換・量子化部１０３は、減算部１０２から入力された予測残差信号に対し周波数変換を行い、算出した変換係数を量子化して量子化係数を求める。変換・量子化部１０３は、求めた量子化係数をエントロピー符号化部１０４及び逆量子化・逆変換部１０５に出力する。

　エントロピー符号化部１０４には、変換・量子化部１０３から量子化係数が入力され、予測パラメータ符号化部１１１から予測パラメータが入力される。入力される予測パラメータには、例えば、参照ピクチャインデックスref_Idx_lX、予測ベクトルインデックスmvp_LX_idx、差分ベクトルmvdLX、予測モードpred_mode_flag、及びマージインデックスmerge_idx等の符号がある。

　エントロピー符号化部１０４は、入力された分割情報、予測パラメータ、量子化変換係数等をエントロピー符号化して符号化ストリームTeを生成し、生成した符号化ストリームTeを外部に出力する。

　逆量子化・逆変換部１０５は、画像復号装置における、逆量子化・逆変換部３１１（図５）と同じであり、変換・量子化部１０３から入力された量子化係数を逆量子化して変換係数を求める。逆量子化・逆変換部１０５は、求めた変換係数について逆変換を行い、残差信号を算出する。逆量子化・逆変換部１０５は、算出した残差信号を加算部１０６に出力する。

　加算部１０６は、予測画像生成部１０１から入力されたPU（ブロック）の予測画像Ｐの信号値と逆量子化・逆変換部１０５から入力された残差信号の信号値を画素毎に加算して、復号画像を生成する。加算部１０６は、生成した復号画像を参照ピクチャメモリ１０９に記憶する。

　ループフィルタ１０７は加算部１０６が生成した復号画像に対し、デブロッキングフィルタ１１４、サンプル適応オフセット（SAO）１１５、適応ループフィルタ（ALF）１１６を施す。なお、ループフィルタ１０７は、必ずしも上記３種類のフィルタを含まなくてもよく、例えばデブロッキングフィルタ１１４のみの構成であってもよい。

　予測パラメータメモリ１０８は、符号化パラメータ決定部１１０が生成した予測パラメータを、符号化対象のピクチャ及びCU毎に予め定めた位置に記憶する。

　参照ピクチャメモリ１０９は、ループフィルタ１０７が生成した復号画像を、符号化対象のピクチャ及びCU毎に予め定めた位置に記憶する。

　符号化パラメータ決定部１１０は、符号化パラメータの複数のセットのうち、１つのセットを選択する。符号化パラメータとは、上述したQTBT分割パラメータや予測パラメータやこれらに関連して生成される符号化の対象となるパラメータである。予測画像生成部１０１は、これらの符号化パラメータのセットの各々を用いてPUの予測画像Ｐを生成する。

　符号化パラメータ決定部１１０は、複数のセットの各々について情報量の大きさと符号化誤差を示すRDコスト値を算出する。RDコスト値は、例えば、符号量と二乗誤差に係数λを乗じた値との和である。符号量は、量子化残差と符号化パラメータをエントロピー符号化して得られる符号化ストリームTeの情報量である。二乗誤差は、減算部１０２において算出された残差信号の残差値の二乗値についての画素間の総和である。係数λは、予め設定されたゼロよりも大きい実数である。符号化パラメータ決定部１１０は、算出したRDコスト値が最小となる符号化パラメータのセットを選択する。これにより、エントロピー符号化部１０４は、選択した符号化パラメータのセットを符号化ストリームTeとして外部に出力し、選択されなかった符号化パラメータのセットを出力しない。符号化パラメータ決定部１１０は決定した符号化パラメータを予測パラメータメモリ１０８に記憶する。

　予測パラメータ符号化部１１１は、符号化パラメータ決定部１１０から入力されたパラメータから、符号化するための形式を導出し、エントロピー符号化部１０４に出力する。符号化するための形式の導出とは、例えば動きベクトルと予測ベクトルから差分ベクトルを導出することである。また予測パラメータ符号化部１１１は、符号化パラメータ決定部１１０から入力されたパラメータから予測画像を生成するために必要なパラメータを導出し、予測画像生成部１０１に出力する。予測画像を生成するために必要なパラメータとは、例えばサブブロック単位の動きベクトルである。

　インター予測パラメータ符号化部１１２は、符号化パラメータ決定部１１０から入力された予測パラメータに基づいて、差分ベクトルのようなインター予測パラメータを導出する。インター予測パラメータ符号化部１１２は、予測画像生成部１０１に出力する予測画像の生成に必要なパラメータを導出する構成として、インター予測パラメータ復号部３０３がインター予測パラメータを導出する構成と一部同一の構成を含む。また、イントラ予測パラメータ符号化部１１３は、予測画像生成部１０１に出力する予測画像の生成に必要な予測パラメータを導出する構成として、イントラ予測パラメータ復号部３０４がイントラ予測パラメータを導出する構成と、一部同一の構成を含む。

　イントラ予測パラメータ符号化部１１３は、符号化パラメータ決定部１１０から入力されたイントラ予測モードIntraPredModeから、符号化するための形式（例えばMPM_idx、rem_intra_luma_pred_mode等）を導出する。

　上記で説明したように、4:4:4フォーマットと4:2:0フォーマットで必要なメモリは、輝度成分は同じであるが、色差成分は4:2:0フォーマットに比べ、4:4:4フォーマットは縦横に各々2倍のメモリが必要である。特に図11で説明したように、対象ブロックの左側の参照画素を格納するメモリ（コラム）は１CTUの高さ分だけ保持すればよいので、4:4:4フォーマットとなることで色差画素のCTUの高さが2倍になっても、大きな問題ではない。しかし、対象ブロックの上側の参照画素を格納するラインメモリは、画像の幅に比例したサイズが必要であるため、コストへの影響が大きい。例えば4K画像で、1ライン格納する場合は4:2:0フォーマットではCb、Crとも1920画素必要であったが、4:4:4フォーマットでは3840画素必要である。2ライン格納する場合は4:2:0フォーマットではCb、Crとも3840画素必要であったが、4:4:4フォーマットでは7680画素必要である。4ライン格納する場合は4:2:0フォーマットではCb、Crとも7680画素必要であったが、4:4:4フォーマットでは15360画素必要である。画像サイズが8Kになると、各々この2倍のメモリが必要である。このラインメモリサイズの増加は画像復号装置の設計に大きな影響を及ぼす。

　以下では、4:2:0フォーマットで必要なサイズのラインメモリで、4:4:4フォーマットの処理を可能にする技術を説明する。

　（イントラ予測）
　4:4:4フォーマットの符号化データをイントラ予測する場合に、本明細書の画像復号装置において、色差成分の参照画素を参照メモリから参照する場合の一例を図15(a)に示す。符号化データが4:4:4フォーマットであるので、色差成分の対象ブロックX（画素x[m,n]、m=0..M-1,n=0..N-1）は輝度成分と同じサイズ(M*N)の画素を持つ。対象ブロックの左側の参照画素はr[-1,n]、上側の参照画素はr[m,-1]である（m=0..2M-1,n=-1..2N-1）。4:2:0フォーマット用のラインメモリで復号可能とする本明細書の画像復号装置の一つの構成例では、対象ブロックの上側の参照画素を格納する参照メモリ（ラインメモリ）から半分の画素のみを参照する。すなわち、図15(a)のように、対象ブロックの上側では偶数位置r[2m,-1]の参照画素はラインメモリから参照しない。これらの参照画素は、（式１）～（式３）を用いたイントラ予測値の算出に不可欠であるため、後述の方法により参照画素から導出する。

　実施形態１の画像符号化装置および画像復号装置の一例では、4:4:4フォーマットの画像の色差成分の場合、図16(a)に示すように、復号画素値x[m,N-1]を参照メモリに格納する時に、対象ブロックの１番下のラインのうち、奇数番目の復号画素x[2m+1,N-1]のみを格納する。そして、1ブロックライン下の対象ブロックを復号するために参照メモリを読み出す時は、奇数番目の位置[2m+1]を参照する。読み出した奇数番目の位置の参照画素r[2m+1,-1]を用いて偶数番目の位置の参照画素r[2m,-1]を補間する。参照メモリから読み出した参照画素r[2m+1,-1]と、補間したr[2m,-1]、および対象ブロックの左側の参照画素r[-1,n]を（式１）～（式３）に代入してイントラ予測値を算出する。以下では、２種類の参照メモリ、２次元配列refImg[,]と１次元配列z[]を用いて説明する。画像符号化装置は画像復号装置と同じく、奇数位置の画素のみを格納し、奇数位置の画素から偶数位置の画素を補間し、両者を用いてイントラ予測を実施するため、画像符号化装置と画像復号装置の間でミスマッチは発生しない。

　図17(a)は上記の動作を説明するフローチャートである。図中S1404、S1406、S1410、S1412は図14(a)と同じ動作であり、説明を省略する。イントラ予測画像生成部310は、参照メモリから対象ブロックの予測に必要な参照画素を読み出し、イントラ予測画像生成部310の（図示されない）内部メモリの奇数位置r[2m+1,-1](m=0..M2-1))に格納する（S1602）。

　　r[2m+1,-1] = refImg[xBlk+2m-1,yBlk-1]　(m=0..M2-1)
ここで、xBlk, yBlkは、対象ブロックの左上座標である。なお、参照メモリrefImgは、奇数位置のみメモリを有するような配列である。連続した配列z[]を用いる場合には、図16(b)に示すように、以下のように参照する。

　　r[2m+1,-1] = z[xBlk/2+m]　(m=0..M2-1)
ここでブロックが固定ブロックサイズMの場合には、ブロックのアドレスkを用いて、xBlk=M2*k*2として導出できる。

　イントラ予測画像生成部310は、内部メモリの奇数位置の参照画素を用いて偶数位置の参照画素を補間する(S1603)。例えば補間方法として平均値を用いることができる。

　　r[2m,-1] = (r[2m+1,-1]+r[2m-1,-1]+1)>>1
参照メモリから読み出した参照画素と、補間して生成した参照画素を用いてイントラ予測を実施する（S1404）。対象ブロックの再構成処理（S1406）が終了した後、画像符号化装置11あるいは画像復号装置31は、対象ブロックの一番下のラインの奇数番目の復号画素（図16(a)のx[2m+1,N-1]）を参照メモリrefImg、または、Zに格納する（S1608）。

　　refImg[xBlk+2m-1,yBlk+N-1] = x[2m+1,N-1]
　連続した配列z[]を用いる場合には、図16(b)に示すように、以下のように格納する。

　　z[xBlk/2+m] = x[2m+1,N-1]
　また、図16(d)～(f)に示すように、内部メモリの復号画素値x[m,N-1]を参照メモリに格納する時に、対象ブロックの１番下のラインのうち、偶数番目の復号画素のみを格納してもよい。そして、1ブロックライン下のブロックを復号するために参照メモリrefImg、または、Zから参照画素を読み出す時は、偶数番目の位置[2m,-1]を参照し、奇数番目の位置の参照画素r[2m+1,-1]を補間してもよい。この場合、上記フローチャートの説明は奇数画素と偶数画素を入れ替えればよい。

　以上説明したように、イントラ予測の参照画素として、水平方向に1/2の画素数の画素を格納し、残りの1/2は補間により生成することで、4:2:0フォーマットの符号化データを復号するための参照メモリを、ラインメモリとして有する画像復号装置で4:4:4フォーマットの符号化データを再生することができる。なお、本実施形態では、参照メモリのうちコラムメモリやフレームメモリを低減させる効果はないが、コラムメモリのサイズは小さく、フレームメモリは安価であるため、特に問題ではない。

　　（変形例１）
　実施形態１では（局所）復号後、色差成分のブロックの一番下のラインの奇数位置、あるいは偶数位置の画素を参照メモリに格納した。変形例１では、実施形態１とは異なる位置の色差成分を参照メモリに格納する例を説明する。

　変形例１では、内部メモリの復号画素値x[m,N-1]を参照メモリに格納する時に、対象ブロックの１番下のラインのうち、図18(a)に示す位置の復号画素x[4m,N-1]とx[4m+3,N-1]のみを格納する。

　　refImg[xBlk+4m,yBlk+N-1] = x[4m,N-1]
　　refImg[xBlk+4m+3,yBlk+N-1] = x[4m+3,N-1]
　連続した配列z[]を用いる場合には、図18(b)に示すように、以下のように格納する。

　　z[xBlk/2+m] = x[4m,N-1]
　　z[xBlk/2+m+1] = x[4m+3,N-1]
そして、1ブロックライン下のブロックを復号するために参照メモリrefImgから参照画素を読み出す時は、内部メモリの位置[4m,-1]と[4m+3,-1]に格納する。

　　r[4m,-1] = refImg[xBlk+4m,yBlk-1]　(m=0..M2/2-1)
　　r[4m+3,-1] = refImg[xBlk+4m+3,yBlk-1]　(m=0..M2/2-1)
　連続した配列z[]を用いる場合には、図18(c)に示すように、以下のように格納する。

　　r[4m,-1] = z[xBlk/2+m]
　　r[4m+3,-1] = z[xBlk/2+m+1]
次に、参照画素r[4m,-1]とr[4m+3,-1]を用いて、画素r[4m+1,-1]とr[4m+2,-1]を補間する。

　　r[4m+1,-1] = r[4m,-1]
　　r[4m+2,-1] = r[4m+3,-1]
　このように格納する画素位置を選んだ場合、左側ブロックの参照画素r[-1,-1]とのつながりが規則的でよいというメリットがある。また４画素幅のブロックの場合において、ブロックの境界画素を有することから、ブロックの性質をもっとも代表する画素値情報を得ることができる。

　　（変形例２）
　実施形態１では参照メモリに格納していない画素の補間方法として平均値を用いる例を明した。変形例２では、それ以外の補間方法を説明する。

　図19(a)～(c)は参照画素を格納する内部メモリを１次元配列ref[]として表現している。図中、ref[k] (k=0..2N+1) (図10(b)の２次元配列の内部メモリr[-1,2N-1]～r[-1,-1]に相当)までは対象ブロックの左側の参照画素であり、ref[k](k=2N+2..2N+2M-1) (図10(b)のr[0,-1]～r[2M-1,-1]に相当)は対象ブロックの上側の参照画素である。対象ブロックの上側の参照画素は、図19(a)、(b)では奇数位置を参照し偶数位置を参照しない、図19(c)では[4m,-1]、[4m+3,-1]を参照し、[4m+1,-1]、[4m+2,-1]を参照しない。参照しない画素は、参照メモリとして保持する必要はない。

　図19(a)は、偶数位置の画素値r[2m,-1]を奇数位置の画素からコピーする例である。

　　ref[2N+2m] = ref[2N+2m-1] (m=0..M2-1)
これは、２次元メモリの以下に相当する。

　　r[2m,-1] = r[2m-1,-1] (m=0..M2-1)
参照メモリの奇数位置の画素を、偶数位置の画素から補間（コピー）する例では下記となる。

　　ref[2N+2m+1] = ref[2N+2m]
これは、２次元メモリの以下に相当する。

　　r[2m+1,-1] = r[2m,-1] (m=0..M2-1)
　図19(b)は実施形態１と同様、参照メモリから参照しない画素値ref[2N+2m]を隣接画素の平均値で補間する構成例である。

　　ref[2N+2m] = (ref[2N+2m-1]+ref[2N+2m+1]+1)>>1 (m=0..M2-1)
これは、２次元メモリの以下に相当する。

　　r[2m,-1] = (r[2m-1,-1]+r[2m+1,-1]+1)>>1 (m=0..M2-1)
参照メモリに奇数位置の画素を参照しない構成では、補間（平均）は下記となる。

　　ref[2N+2m+1] = (ref[2N+2m]+ref[2N+2m+2]+1)>>1 (m=0..M2-1)
　　r[2m+1,-1] = (r[2m,-1]+r[2m+2,-1]+1)>>1 (m=0..M2-1)
また補間は近傍のL+1個の画素の重み付き平均でもよい。

　　　　　　　L/2
　　r[2m,-1] = Σw(i+L/2)*r[2(m+i)-1,-1]+0.5 （偶数位置の画素が未格納）
　　　　　　i=-L/2
　　Σw(i)=1
　　　　　　　　L/2
　　r[2m+1,-1] = Σw(i+L/2)*r[2(m+i),-1]+0.5 （奇数位置の画素が未格納）
　　　　　　　i=-L/2
　　Σw(i)=1
ここでw(i)は重み係数である。

　図19(c)は変形例１と同様、[4m,N-1]と[4m+3,N-1]の位置の画素を参照メモリから参照し、[4m+1,N-1]と[4m+2,N-1]の画素は参照メモリから参照しない場合に、画素値r[4m+1,-1]、r[4m+2,-1]を隣接画素からコピーする例である。

　　ref[2N+4m+1] = ref[2N+4m] (m=0..M2/2-1)
　　ref[2N+4m+2] = ref[2N+4m+3] (m=0..M2/2-1)
これは、２次元メモリの以下に相当する。

　　r[4m+1,-1] = r[4m,-1] (m=0..M2/2-1)
　　r[4m+2,-1] = r[4m+3,-1] (m=0..M2/2-1)
　なお、参照する画素を、参照メモリから読み出す処理は以下で示すことができる。図19(a)(b)の例には、
　　ref[2N+2m-1] = refImg[xBlk+2m-1,yBlk-1]
連続した１次元配列の場合は下記である。

　　ref[2N+2m-1]= z[xBlk/2+ｍ]
図19(c)の例には、
　　ref[2N+4m ] = refImg[xBlk+4m,yBlk-1]
　　ref[2N+4m+3] = refImg[xBlk+4m+3,yBlk-1]
連続した１次元配列の場合は下記である。

　　ref[2N+4m ] = z[xBlk/2+m]
　　ref[2N+4m+3] = z[xBlk/2+m+１]
　補間画素をコピーや平均で生成する方法は処理が簡略であるというメリットがある。補間に必要な画素数を増やし、重み係数を利用する方法は、処理はやや複雑だが、参照画素間の変化が滑らかになるので、画質が劣化しないというメリットがある。また後段で実施する参照画素フィルタと処理を共通化することで、処理量を増やさないこともできる。

　　（変形例３）
　変形例３は画像処理装置と画像復号装置がループフィルタの構成を有し、ループフィルタ用の参照メモリとイントラ予測用の参照メモリを共通に使用する例である。図12およびループフィルタで説明したように、ループフィルタを実施するためには少なくとも2ライン分の参照メモリが必要である。図20に示すように、4:2:0フォーマット用の2ライン分の参照メモリ(図20(a))を使用すれば、色差成分においても、4:4:4フォーマット用の1ライン分の参照画素を格納することができる(図20(b))。この場合、イントラ予測の処理の変更は不要である。ただし、ループフィルタと参照メモリを共通に使用するので、ループフィルタで使用する参照画素を1ライン分に変更する必要がある。

　　（変形例４）
　画像復号装置の復号処理をCTU単位で実施する場合、内部メモリにCTUの全情報を格納することができる。従って、イントラ予測の参照画素が同じCTUであれば、CTUの内部メモリから読み出すことができる。図26はCTUとその内部のCUを示す図である。図中、実線の矩形はCTU、破線の矩形はCUである。例えばCTU3を処理している場合、CU301は、上側の参照画素として、同じCTU3のCUであるCU300の画素にアクセスすることができる。しかしCU300は、上側の画素として、異なるCTU1のCUであるCU12の画素にアクセスすることはできない。異なるCTU1の画素は内部メモリには存在しないからである。このように、図26において太線をまたいで参照する処理は参照メモリに格納された画素を読み出す必要があり、実施形態１で説明した参照画素の制約を用いることができる。

　変形例４では、CTU境界では、上側CUの画素を参照するイントラ予測をオフにし、CTU内部のCU境界では上側CUの画素を参照するイントラ予測をオンにする。つまりCTU境界では、イントラ予測は左側CUの画素のみ参照する。

　図27は変形例４の動作を示すフローチャートである。画像符号化装置11あるいは画像復号装置31はCU境界がCTU境界か否かを判定する（S2702）。画像符号化装置11あるいは画像復号装置31は、CTU境界であれば（S2702でY）S2706に進み、CTU境界でなければ（S2702でN）S2704に進む。CTU境界でなければ、画像符号化装置11あるいは画像復号装置31は通常の上側CUおよび左側CUの画素を参照するイントラ予測をオンにする（S2704）。CTU境界ならば、画像符号化装置11あるいは画像復号装置31は、イントラ予測は左側の参照画素のみを参照する予測モードを使用する（S2706）。

　以上説明したように、CTU境界では、上側の参照画素を参照するイントラ予測をオフにすることによって、参照メモリに格納した画素を使用せず、イントラ予測を実施することができる。そのため、4:2:0フォーマットの符号化データを復号するための参照メモリを有する画像復号装置で4:4:4フォーマットの符号化データを復号することができる。

　　（変形例５）
　変形例５では参照メモリのサイズや格納方法に関わらず、色差成分のイントラ予測で参照する参照画素を規定する、実施形態１、変形例１～２の別の一例である。変形例５では水平方向の画素位置を輝度成分と同じ座標系（図10の(b)の輝度の座標系）で表す。そのため、4:2:0フォーマットでは、色差成分の画素位置は[2m,2n]と表され、4:4:4フォーマットでは、色差成分の画素位置は[m,n]と表される。

　イントラ予測では、ブロックの上側に位置する水平方向の参照画素として、図10(b)に示す奇数位置のr[2m-1,-1]のみを参照する。そして、r[2m,-1]を実施形態１、変形例１、変形例２のいずれかの方法で補間する。偶数位置の画素の算出に平均値を用いる場合は、
　　r[2m,-1] = (r[2m-1,-1]+r[2m+1,-1]+1)>>1
偶数位置の画素を奇数位置の参照画素からコピーする場合は
　　r[2m,-1] = r[2m-1,-1]
偶数位置の画素を重み付平均で算出する場合は
　　　　　　　L/2
　　r[2m,-1] = Σw(i+L/2)*r[2(m+i)-1,-1]+0.5
　　　　　　i=-L/2
　　Σw(i)=1
である。

　イントラ予測は、r[2m-1,-1]と補間したr[2m,-1]を（式１）～（式３）に代入してイントラ予測値を算出する。

　なお、水平方向の参照画素は、偶数位置r[2m,-1]を参照し、奇数位置r[2m+1,-1]を補間により算出してもよい。
奇数位置の画素の算出に平均値を用いる場合は、
　　r[2m+1,-1] = (r[2m,-1]+r[2m+2,-1]+1)>>1
奇数位置の画素を奇数位置の参照画素からコピーする場合は
　　r[2m+1,-1] = r[2m,-1]
偶数位置の画素を重み付平均で算出する場合は
　　　　　　　　L/2
　　r[2m+1,-1] = Σw(i+L/2)*r[2(m+i),-1]+0.5
　　　　　　　i=-L/2
　　Σw(i)=1
　また、r[4m,-1]、r[4m+3,-1]を参照し、r[4m+1,-1]、r[4m+2,-1]を補間により算出してもよい。

　　r[4m+1,-1] = r[4m,-1]
　　r[4m+2,-1] = r[4m+3,-1]
　このように参照画素に関する制約を導入することで、参照メモリのサイズや格納方法に関係なく、イントラ予測を実施することができる。また、参照画素に関する制約のみを規定するので、高速にアクセス可能な小サイズのメモリに参照する画素のみを格納してコストを削減する等の、実装の工夫が容易になる。

　　（実施形態２）
　（ループフィルタ）
　4:2:0フォーマット準拠の画像復号装置において、4:4:4フォーマットの符号化データのCTUブロック境界にループフィルタをかけるために、参照メモリから色差成分の参照画素を内部メモリに格納した状態の一例を図15(b)に示す。符号化データが4:4:4フォーマットであるので、色差成分の対象ブロックQ（画素q[m,n]、m=0..M-1,n=0..N-1）は輝度成分と同じサイズ(M*N)の画素を持つ。しかし、ループフィルタに必要な対象ブロックの1ブロックライン上のブロックP（画素p[m,n]、m=0..M-1,n=0..N-1）はブロックQに隣接する2ラインが参照メモリに格納されており、4:2:0フォーマットの色差成分は4:4:4フォーマットの色差成分の半分であるので、必要な画素の半分しか格納することができない。そのため、図15(b)では、ブロックPには偶数位置p[2m,0]、p[2m,1]の参照画素がないが、これらの参照画素は、ブロック境界の画素へのループフィルタ（デブロッキングフィルタ、SAOのEO、ALF）に不可欠である。さらに、ブロック境界に接する画素p[2m,0]は、フィルタをかける時に参照されるだけではなく、p[2m,0]自体にフィルタをかけ、画素値を変更する。一方、CTUブロック内部では、色差成分を格納するために必要なサイズのメモリを有している。

　そのため、実施形態２の画像符号化装置および画像復号装置では、4:2:0フォーマットの場合、または、4:4:4フォーマットでCTUブロック境界に隣接しない場合は、ブロック境界の上側２ラインを内部メモリから参照し、4:4:4フォーマットでCTUブロックに隣接する場合には、ブロック境界の上側1ラインを参照する。これにより、例えば、図21(a)～(c)に示すように、内部メモリの復号画素値p[m,N-1]、p[m,N-2]を参照メモリに格納する時に、4:4:4フォーマットのブロックPの１番下のラインの全画素を、水平方向の解像度が半分しかない4:2:0フォーマット用の色差成分の参照メモリ2ライン分を用いて格納することができる。4:2:0フォーマットでは、色差のループフィルタ用に2ライン分のラインメモリを保持しているので処理が可能である。つまり図21(b)の参照メモリZ（配列の要素z[]）には、k番目のブロックPの一番下のラインの画素を格納する。

　　z[xBlk +m] = p[m,0] 　(m=0..M-1)
　この処理は、２次元メモリで記載すると以下と等価である。

　　refImg [xBlk+m,yBlk+N-1] = p[m,0] 　(m=0..M-1)
そしてフィルタリングで参照するため、内部メモリに読み出す時は、図21(c)のように、参照メモリZの画素値を参照する。

　　p[m,0] = z[xBlk +m]　(m=0..M-1)
　この処理は、２次元メモリで記載すると以下と等価である。

　　p[m,0] = refImg[xBlk+m,yBlk-1]　(m=0..M-1)
内部メモリにおいて、ブロックPの下から2ライン目を参照しない構成では、CTUブロックの境界を越える場合に、ループフィルタの対象画素の算出方法、および参照画素を変更する。以下に詳細に説明する。

　（デブロッキングフィルタ、SAOのEO）
　図22(a)は、図21(c)で参照メモリからブロックPの一番下のラインの画素p[m,0]を読み出して格納した状況と同じである。破線で示すブロックPの下から2番目のラインの画素p[m,1]は参照メモリから参照しない。つまりループフィルタ107または305は、色差成分、かつ、4:4:4フォーマット、かつ、CTUブロックの境界(yBlk=yBlk/CTUサイズ*CTUサイズ)を越える場合に、ブロックPの水平境界１ライン目は参照メモリrefImgの一番下のラインを参照し、ブロックPの水平境界２ライン目は、同じブロックの１番下のラインの参照画素p[m,0]の値をコピーして導出する。

　　p[m,0] = refImg[xBlk+m,yBlk-1]　(m=0..M-1)
　　p[m,1] = p[m,0]　　　　　　　　　(m=0..M-1)
　それ以外 (輝度成分、もしくは、4:2:0フォーマット、もしくは、yBlk!=yBlk/CTUサイズ*CTUサイズ) の場合、
　　p[m,0] = refImg[xBlk+m,yBlk-1]　(m=0..M-1)
　　p[m,1] = refImg[xBlk+m,yBlk-2]　(m=0..M-1)
　デブロッキングフィルタでは、デブロッキングフィルタを実施すると判定された場合、q[m,1]、q[m,0]、p[m,0]、およびコピーして生成したp[m,1]を（式４）に代入して、フィルタリング後の画素値q[m,0]、p[m,0]を算出する。

　SAOのEOでは、p[m-1,0]、p[m+1,0]、q[m-1,0]、q[m,0]、q[m+1,0]、およびコピーして生成したp[m-1,1]、p[m,1]、p[m+1,1]を参照して選択したoffsetPを（式５）に代入し、フィルタリング後のp[m,0]を算出する。また、p[m-1,0]、p[m,0]、p[m+1,0]、q[m-1,0]、q[m+1,0]、q[m-1,1]、q[m,1]、q[m+1,1]を参照して選択したoffsetQを（式５）に代入し、フィルタリング後のq[m,0]を算出する。

　以上により、デブロッキングフィルタとSAOのEOでは、図22(b)に示すようにブロックP、Q境界の2ラインの画素をフィルタリングすることができる。

　図17(b)は上記の動作を説明するフローチャートである。図中S1416、S1422、S1424は図14(b)と同じ動作であり、説明を省略する。ループフィルタ107または305は、参照メモリから対象ブロックの予測に必要な参照画素（例えば、図21(b)のz[xBlk+m]）を読み出し、ループフィルタ107または305の（図示されない）内部メモリp[m,0])に格納する（S1714）。

　　p[m,0] = z[xBlk+m]　(m=0..M-1)
　この処理は、２次元メモリで記載すると以下と等価である。

　　p[m,0] = refImg[xBlk+m,yBlk-1]　(m=0..M-1)
ループフィルタ107または305は、内部メモリのM個の参照画素p[m,0]を参照画素p[m,1]にコピーする(S1715)。

　　p[m,1] = p[m,0]　(m=0..M-1)
参照メモリから読み出した参照画素、それをコピーした参照画素、および内部メモリの参照画素を用いてフィルタリングを実施する（S1416）。ループフィルタ107または305は、ブロックQの一番下のラインを参照メモリに格納する（S1720）。

　この方法は、参照メモリから読み出して内部メモリに格納したブロックPの1ラインを内部メモリにコピーする処理が増える以外は従来と同じ処理であり、変更が容易である。

　　（変形例６）
　実施形態２のデブロッキングフィルタでは、図22(b)に示すようにブロック境界の画素p[m,0]およびq[m,0]に対しフィルタリングを実施する例を説明した。変形例６では、ブロック境界の画素q[m,0]に対しフィルタリングを実施する例を説明する。

　図22(c)に示すように、変形例４では、色差成分、かつ、4:4:4フォーマット、かつ、CTUブロックの境界(yBlk=yBlk/CTUサイズ*CTUサイズ)を越える場合に、ブロック境界の画素q[m,0]に対しフィルタリングを実施するが、p[m,0]にはフィルタをかけない。１つの方法は実施形態２で実施した（式５）のフィルタリングをq[m,0]に対してのみ実施する。この場合、その他の処理は実施形態２と全く同じである。

　別の方法として、下式でq[m,0]を算出する。

　　q[m,0] = (a1*q[m,0]+a2*p[m,0]+a3*q[m,1]+4)>>3
　　a1+a2+a3=8
例えば、a1=4、a2=3、a3=1である。

　この方法では、p[m,1]を参照しないので、実施形態２とは異なり、p[m,0]からp[m,1]へのコピーが発生しない。

　なお、上記以外(輝度成分、もしくは、4:2:0フォーマット、もしくは、yBlk!=yBlk/CTUサイズ*CTUサイズ)の場合には、通常通り、全てのp[m,0]、p[m,1]、q[m,0]、q[m,1]を参照してフィルタ処理をすればよい。

　　（変形例７）
　実施形態２では、対象ブロックQの上側ブロックPの一番下のラインの全画素を参照メモリから参照する場合のデブロッキングフィルタおよびSAOのEOの処理を説明した。変形例７では、図23(a)に示すように、参照メモリ上に格納した、ブロックPの奇数位置の画素を2ライン分を参照し、偶数位置の画素は参照しない場合のデブロッキングフィルタの処理を説明する。以下は、色差成分、かつ、4:4:4フォーマット、かつ、CTUブロックの境界(yBlk=yBlk/CTUサイズ*CTUサイズ)を越える場合であり、それ以外の場合には、既に説明した通りの処理で良い。

　図23(a)に示すように、奇数位置ではデブロッキングフィルタに必要な全ての画素（p[2m+1,1]、p[2m+1,0]、q[2m+1,0]、q[2m+1,1]、m=0..M2-1）がそろっており、（式４）に代入することでq[2m+1,0]のデブロッキング処理を実施する。p[m,0]はフィルタリングしない。

　次に偶数位置の画素q[2m,0]を、奇数位置のデブロッキング済みの画素を用いて補正する。

　　q[2m,0] = (q[2m-1,0]+ 6*q[2m,0]+ q[2m+1,0]+4)>>3
また、以下のように補正範囲にクリップ処理を追加しても好適である。

　　Δq = Clip3(-tc,tc, (q[2m-1,0]- 2*q[2m,0]+ q[2m+1,0]+4)>>3 )
　　q[2m,0] = Clip1(q[2m,0]+Δq)
また、以下のように、奇数位置([2m-1,0]の位置)のデブロッキング処理において導出した補正値を、偶数位置の補正処理に利用しても良い。

　　Δ= Clip3(-tc,tc,(((q[2m-1,0]-p[2m-1,0])<<2)+p[2m-1,1]-q[2m-1,1]+4)>>3)
　　q[2m,0] = Clip1(q[2m,0]-Δ)
奇数位置は、2m-1の代わりに2m+1でもよい。
また、奇数位置として2m+1と2m-1の両方を利用する、以下の式でもよい。

　　Δp = (q[2m-1,0]-p[2m-1,0])<<2)+p[2m-1,1]-q[2m-1,1]
　　Δm = (q[2m+1,0]-p[2m+1,0])<<2)+p[2m+1,1]-q[2m+1,1]
　　Δ= Clip3(-tc,tc,(Δp+Δm+8)>>4)
　　q[2m,0] = Clip1(q[2m,0]-Δ)
　以上のように、奇数位置の画素のみ参照メモリに格納し、奇数位置では4画素を参照してデブロッキングフィルタを実施し、偶数位置の画素は奇数位置のデブロッキングフィルタ後の画素から補間して算出することで、4:2:0フォーマット用サイズの参照メモリでも、4:4:4フォーマットの符号化データを復号することができる。

　なお、変形例５では、ブロックPの奇数位置の画素を参照メモリに参照する例を説明したが、ブロックPの偶数位置の画素を参照メモリに参照する構成でもよい。この場合、上記2mを2m+1（もしくは2m-1）に置き換える。

　（ALF）
　4:2:0フォーマット準拠の画像復号装置において、4:4:4フォーマットの符号化データにCTUブロック境界にALFをかけるために、参照メモリから色差成分の参照画素を内部メモリに格納した状態の一例を図28(a)に示す。実線で示した画素は参照メモリに格納される画素であり、破線で示す画素は参照メモリに格納されない画素である。符号化データが4:4:4フォーマットであるので、色差成分の対象ブロックQ（画素q[m,n]、m=0..M-1,n=0..N-1）は輝度成分と同じサイズ(M*N)の画素を持つ。しかし、ALFに必要な対象ブロックの1ブロックライン上のブロックP（画素p[m,n]、m=0..M-1,n=0..N-1）はブロックQに隣接する4ラインが参照メモリに格納されており、4:2:0フォーマットの色差成分は4:4:4フォーマットの色差成分の半分であるので、必要な画素の半分しか格納することができない。そのため、図28(a)では、ブロックPには偶数位置p[2m,0]、p[2m,1]、p[2m,2]、p[2m,3]の参照画素がないが、これらの参照画素は、ブロック境界の画素へのALFに不可欠である。さらに、ブロック境界に接する画素p[2m,0]、p[2m,1]は、フィルタをかける時に参照されるだけではなく、p[2m,0]、p[2m,1]自体にフィルタをかけ、画素値を変更する。一方、CTUブロック内部では、色差成分を格納するために必要なサイズのメモリを有している。

　そのため、実施形態２の画像符号化装置および画像復号装置では、4:2:0フォーマットの場合、または、4:4:4フォーマットでCTUブロックに隣接しない場合は、ブロック境界の上側4ラインを内部メモリから参照し、4:4:4フォーマットでCTUブロックに隣接する場合には、ブロック境界の上側2ラインを参照する。つまり、例えば、図28(b)に示すように、内部メモリの復号画素を参照メモリに格納する時に、4:4:4フォーマットのブロックPの１番下の2ラインの画素を、水平方向の解像度が半分しかない4:2:0フォーマット用の色差成分の参照メモリ4ライン分に格納する。4:2:0フォーマットでは、色差のループフィルタ用に4ライン分のラインメモリを保持しているのでこの処理が可能である。参照メモリZ（配列の要素z[]）には、k番目のブロックPの一番下の2ラインの画素を格納する。

　　z[xBlk+m] = p[m,0] 　(m=0..M-1)
　　z[xBlk+width+m] = p[m,1] 　(m=0..M-1)
ここでwidthは画像の水平方向のサイズである。

　この処理は、２次元メモリで記載すると以下と等価である。

　　refImg [xBlk+m,yBlk+N-1] = p[m,0] 　(m=0..M-1)
　　refImg [xBlk+m,yBlk+N-2] = p[m,1] 　(m=0..M-1)
そしてフィルタリングで参照するため、内部メモリに読み出す時は、下記のように参照メモリZの画素値を参照する。

　　p[m,0] = z[xBlk+m]　(m=0..M-1)
　　p[m,1] = z[xBlk+width+m]　(m=0..M-1)
　この処理は、２次元メモリで記載すると以下と等価である。

　　p[m,0] = refImg[xBlk+m,yBlk-1]　(m=0..M-1)
　　p[m,1] = refImg[xBlk+m,yBlk-2]　(m=0..M-1)
ここで、xBlk、yBlkはブロックQの左上座標である。
内部メモリにおいて、ブロックPの下から2ラインのみを参照する構成では、CTUブロックの境界を越える場合に、ALFの対象画素の算出方法、および参照画素を変更する。以下に詳細に説明する。

　図12(d)～(g)に示すように、通常、ALFを実施する場合、色差成分は4ライン分の参照メモリが必要である。本願では図24に示すように、CTUブロック境界では色差成分のALFフィルタの形状を変化させることで、2ライン分の参照メモリでALFを実施する技術を説明する。イントラ予測やデブロッキングフィルタ、SAO(EO)と同様、以下についても、色差成分、かつ、4:4:4フォーマット、かつ、CTUブロックの境界(yBlk=yBlk/CTUサイズ*CTUサイズ)を越える場合に実施し、それ以外の場合には、通常通りの処理で良い。

　図24(a)の斜線に示すp[m,2]は、ブロックPの内部の画素だけで従来のALFを実施できる、ブロックP内の一番下のライン上の画素である。斜線で示した画素はフィルタリングの対象画素であり、白画素は参照画素である。また、太線で示す図中のブロックP、Qの境界はCTUブロックの境界である。通常、p[m,1]は、図12(d)に示すようにブロックQの画素を参照しなければならない。そして、図12(g)に示すq[m,1]までは自ブロックの画素だけではALFを実施することはできない。しかし、図24(b)～(e)に示すように、CTUブロック境界ではALFフィルタ形状を5x5から5x3に変更することで、参照するメモリを2ラインに削減することができる。フィルタ形状を5x3に変更すると、図24(b)に示すようにp[m,1]もブロックP内の画素だけでALFを実施することができる。また、図24(e)に示すように、q[m,1]もブロックP内の画素だけでALFを実施することができる。一方、図24(c)のp[m,0]、(d)のq[m,0]のみは自ブロック内の画素だけでALFを実施できない。この時に必要な参照メモリは図24(c)、(d)に示すように2ラインである。5x5のALFのフィルタ係数を図25(a)、5x3のALFのフィルタ係数を図25(b)とすると、ALFは以下のように表すことができる。

　n>=2の場合、
　　p[m,n] = f0*p[m,n+2]+ f1*p[m-1,n+1]+ f2*p[m,n+1]+ f3*p[m+1,n+1]+ f4*p[m-2,n]+ f5*p[m-1,n]+ f6*p[m,n]+ f7*p[m+1,n]+ f8*p[m+2,n]+ f9*p[m-1,n-1]+ f10*p[m,n-1]+ f11*p[m+1,n-1]+ f12*p[m,n-2]
q[x,y]の算出は、 p[x,y]をq[x,y]と置き換えた式となる。

　n=1の場合、
　　p[m,n] = g0*p[m-1,n+1]+ g1*p[m,n+1]+ g2*p[m+1,n+1]+ g3*p[m-2,n]+ g4*p[m-1,n]+ g5*p[m,n]+ g6*p[m+1,n]+ g7*p[m+2,n]+ g8*p[m-1,n-1]+ g9*p[m,n-1]+ g10*p[m+1,n-1]
q[x,y]の算出は、 p[x,y]をq[x,y]と置き換えた式となる。

　n=0の場合、
　　p[m,n] = g0*p[m-1,n+1]+ g1*p[m,n+1]+ g2*p[m+1,n+1]+ g3*p[m-2,n]+ g4*p[m-1,n]+ g5*p[m,n]+ g6*p[m+1,n]+ g7*p[m+2,n]+ g8*q[m-1,n]+ g9*q[m,n]+ g10*q[m+1,n]
q[x,y]の算出は、 p[x,y]をq[x,y]と置き換えた式となる。

　なお、上記ではフィルタ形状をSxS=5x5から5x3に変更する例を説明したが、Sx(S-2)タップフィルタであれば、上記の例に限らず(S-3)ライン分のメモリを準備すればよい。

　以上説明したように、ALFは、色差成分にフィルタをかける時に、4:4:4フォーマット、かつ、CTUブロックの境界(yBlk=yBlk/CTUサイズ*CTUサイズ)では、菱形形状の5x3フィルタを使用し、それ以外では菱形形状の5x5フィルタを使用する。このように、フィルタ形状を変更することにより、4:2:0フォーマット準拠の画像復号装置で4:4:4フォーマットの符号化データを復号することができる。

　なお、4:2:0フォーマットの4ライン分の参照メモリは、4:4:4フォーマットの2ライン分のメモリと同じサイズである。そのため、ALFと参照メモリを共有する場合、イントラ予測やデブロッキングフィルタ、SAOのEOは通常の処理を実施することができる。

　　（変形例８）
　さらに別の例として、変形例８は、CTU境界では上側CUの画素を参照するループフィルタをオフにし、CTU内部のCU境界ではループフィルタをオンにする技術を説明する。

　図27は変形例８の動作を示すフローチャートである。画像符号化装置11あるいは画像復号装置31はCU境界がCTU境界か否かを判定する（S2702）。画像符号化装置11あるいは画像復号装置31は、CTU境界であれば（S2702でY）S2706に進み、CTU境界でなければ（S2702でN）S2704に進む。CTU境界でなければ、画像符号化装置11あるいは画像復号装置31はループフィルタをオンにする（S2704）。CTU境界ならば、画像符号化装置11あるいは画像復号装置31は、ループフィルタをオフにする（S2706）。

　以上説明したように、CTU境界ではループフィルタをオフにすることによって、参照メモリに格納した画素を使用せず、ループフィルタを実施することができる。そのため、4:2:0フォーマットの符号化データを復号するラインメモリを有する画像復号装置で、4:4:4フォーマットの符号化データを復号することができる。

　本発明の一態様に係る画像符号化装置は、前記入力動画像の１画面を複数の画素からなるブロックに分割する手段と、前記ブロックを単位として、対象ブロックの隣接ブロックの画素（参照画素）を参照し、イントラ予測を行い、予測画素値を算出する予測手段と、前記入力動画像から前記予測画素値を減算し、第１の予測誤差を算出する手段と、前記予測誤差を変換、量子化し、量子化変換係数を出力する手段と、前記量子化変換係数を可変長符号化する手段とを備え、前記予測手段は、イントラ予測を実施する対象ブロックの左側のブロックの画素と、上側のブロックの画素とを参照し、色差成分において、前記上側のブロックの参照画素は、対象ブロックの２画素毎に１画素（第１の参照画素）を参照し、残りの１画素（第２の参照画素）は、第１の参照画素から補間することで導出し、前記予測手段は、第１の参照画素と第２の参照画素を参照して、対象ブロックの色差成分の各画素のイントラ予測値を算出することを特徴とする。

　本発明の一態様に係る画像符号化装置では、さらに、前記第１の参照画素は奇数画素位置の画素であり、前記第２の参照画素は偶数画素位置の画素であることを特徴とする。

　本発明の一態様に係る画像符号化装置では、さらに、前記第１の参照画素は偶数画素位置の画素であり、前記第２の参照画素は奇数画素位置の画素であることを特徴とする。

　本発明の一態様に係る画像復号装置は、複数の画素からなるブロックを処理単位として、符号化データを可変長復号して量子化変換係数を出力する手段と、量子化変換係数を逆量子化、逆変換して第２の予測誤差を出力する手段と、前記ブロックを単位として、対象ブロックの隣接ブロックの画素（参照画素）を参照し、イントラ予測を行い、予測画素値を算出する予測手段と、前記予測画素値と前記予測誤差を加算する手段とを備え、前記予測手段は、イントラ予測を実施する対象ブロックの左側のブロックの画素と、上側のブロックの画素とを参照し、色差成分において、前記上側のブロックの参照画素は、対象ブロックの２画素毎に１画素（第１の参照画素）を参照し、残りの１画素（第２の参照画素）は、第１の参照画素から補間することで導出し、前記予測手段は、第１の参照画素と第２の参照画素を参照して、対象ブロックの色差成分の各画素のイントラ予測値を算出することを特徴とする
　本発明の一態様に係る画像復号装置では、さらに、前記第１の参照画素は奇数画素位置の画素であり、前記第２の参照画素は偶数画素位置の画素であることを特徴とする。

　本発明の一態様に係る画像復号装置では、さらに、前記第１の参照画素は偶数画素位置の画素であり、前記第２の参照画素は奇数画素位置の画素であることを特徴とする。

　本発明の一態様に係るデブロッキングフィルタ装置は、フィルタリングで参照する画素を格納するメモリと、メモリから読み出した参照画素とフィルタリングの対象画素からなるT画素を参照してフィルタ処理を実施するフィルタ手段と、２つのブロックの水平境界において、色差成分は上側のブロックのT/4ラインの対象画素（第１の対象画素）をメモリから読み出し、メモリから読み出さない上側のブロックのT/4ラインの参照画素（第３の参照画素）は第１の対象画素をコピーすることで導出し、前記フィルタ手段は、第１の対象画素と第３の参照画素と対象ブロックの画素を参照して、色差成分のフィルタリングの対象画素を算出することを特徴とする。

　本発明の一態様に係るループフィルタ装置では、フィルタリングで参照する画素を格納するメモリと、メモリから読み出した参照画素とフィルタリングの対象画素からなる画素を参照して、色差成分に菱形形状のフィルタをかけるフィルタ手段と、２つのブロックの水平境界において、色差成分は上側のブロックの画素のうち、ブロック境界側のS-3ラインの画素（第１の対象画素）をメモリから読み出し、前記フィルタ手段は、水平境界を接するブロックの画素のうち、ブロック境界から（S/2+1）ラインまでは、SxS菱形形状のフィルタをかけ、ブロック境界からS/2ラインまでは、Sx（S-2）菱形形状のフィルタをかけることで、色差成分のフィルタリングを実施することを特徴とする。

　本発明の一態様に係るループフィルタ装置では、さらに、前記ブロックが符号化ユニット（CU）である場合は、上記処理を実施せず、前記ブロックが符号化ツリーユニット（CTU）である場合は、上記処理を実施することを特徴とする。

　本発明の一態様に係る画像復号装置は、複数の画素からなるブロックを処理単位として、符号化データを可変長復号して量子化変換係数を出力する手段と、量子化変換係数を逆量子化、逆変換して第２の予測誤差を出力する手段と、前記ブロックを単位として、対象ブロックの隣接ブロックの画素（参照画素）を参照し、イントラ予測を行い、予測画素値を算出する予測手段と、前記予測画素値と前記予測誤差を加算し、復号画像を導出する手段と、復号画像をフィルタリングする手段とを備え、前記予測手段またはフィルタリング手段では、記ブロック境界がCU境界である場合とCTU境界である場合とで異なる処理を実施することを特徴とする。

　本発明の一態様に係る画像符号化装置は、前記入力動画像の１画面を複数の画素からなるブロックに分割する手段と、前記ブロックを単位として、対象ブロックの隣接ブロックの画素（参照画素）を参照し、イントラ予測を行い、予測画素値を算出する予測手段と、前記入力動画像から前記予測画素値を減算し、第１の予測誤差を算出する手段と、前記予測誤差を変換、量子化し、量子化変換係数を出力する手段と、前記量子化変換係数を可変長符号化する手段と、量子化変換係数を逆量子化、逆変換して第２の予測誤差を出力する手段と、前記予測画素値と前記予測誤差を加算し、復号画像を導出する手段と、復号画像をフィルタリングする手段とを備え、前記予測手段またはフィルタリング手段では、記ブロック境界がCU境界である場合とCTU境界である場合とで異なる処理を実施することを特徴とする。

　　（ソフトウェアによる実現例）
　なお、上述した実施形態における画像符号化装置１１、画像復号装置３１の一部、例えば、エントロピー復号部３０１、予測パラメータ復号部３０２、ループフィルタ３０５、予測画像生成部３０８、逆量子化・逆変換部３１１、加算部３１２、予測画像生成部１０１、減算部１０２、変換・量子化部１０３、エントロピー符号化部１０４、逆量子化・逆変換部１０５、ループフィルタ１０７、符号化パラメータ決定部１１０、予測パラメータ符号化部１１１をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、画像符号化装置１１、画像復号装置３１のいずれかに内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。

　また、上述した実施形態における画像符号化装置１１、画像復号装置３１の一部、または全部を、LSI（Large Scale Integration）等の集積回路として実現しても良い。画像符号化装置１１、画像復号装置３１の各機能ブロックは個別にプロセッサ化しても良いし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はＬＳＩに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりＬＳＩに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。

　　（応用例）
　上述した画像符号化装置１１及び画像復号装置３１は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像（CG及びGUIを含む）であってもよい。

　まず、上述した画像符号化装置１１及び画像復号装置３１を、動画像の送信及び受信に利用できることを、図８を参照して説明する。

　図８の（ａ）は、画像符号化装置１１を搭載した送信装置PROD_Aの構成を示したブロック図である。図８の（ａ）に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3と、を備えている。上述した画像符号化装置１１は、この符号化部PROD_A1として利用される。

　送信装置PROD_Aは、符号化部PROD_A1に入力する動画像の供給源として、動画像を撮像するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成または加工する画像処理部Ａ７を更に備えていてもよい。図８の（ａ）においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。

　なお、記録媒体PROD_A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部（不図示）を介在させるとよい。

　図８の（ｂ）は、画像復号装置３１を搭載した受信装置PROD_Bの構成を示したブロック図である。図８の（ｂ）に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3と、を備えている。上述した画像復号装置３１は、この復号部PROD_B3として利用される。

　受信装置PROD_Bは、復号部PROD_B3が出力する動画像の供給先として、動画像を表示するディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。図８の（ｂ）においては、これら全てを受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。

　なお、記録媒体PROD_B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部（不図示）を介在させるとよい。

　なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送（ここでは、送信先が予め特定されていない送信態様を指す）であってもよいし、通信（ここでは、送信先が予め特定されている送信態様を指す）であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。

　例えば、地上デジタル放送の放送局（放送設備など）／受信局（テレビジョン受像機など）は、変調信号を無線放送で送受信する送信装置PROD_A／受信装置PROD_Bの一例である。また、ケーブルテレビ放送の放送局（放送設備など）／受信局（テレビジョン受像機など）は、変調信号を有線放送で送受信する送信装置PROD_A／受信装置PROD_Bの一例である。

　また、インターネットを用いたVOD（Video On Demand）サービスや動画共有サービスなどのサーバ（ワークステーションなど）／クライアント（テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど）は、変調信号を通信で送受信する送信装置PROD_A／受信装置PROD_Bの一例である（通常、ＬＡＮにおいては伝送媒体として無線または有線の何れかが用いられ、ＷＡＮにおいては伝送媒体として有線が用いられる）。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。

　なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置PROD_A及び受信装置PROD_Bの双方として機能する。

　次に、上述した画像符号化装置１１及び画像復号装置３１を、動画像の記録及び再生に利用できることを、図９を参照して説明する。

　図９の（ａ）は、上述した画像符号化装置１１を搭載した記録装置PROD_Cの構成を示したブロック図である。図９の（ａ）に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した画像符号化装置１１は、この符号化部PROD_C1として利用される。

　なお、記録媒体PROD_Mは、（１）HDD（Hard Disk Drive）やSSD(Solid State Drive)などのように、記録装置PROD_Cに内蔵されるタイプのものであってもよいし、（２）SDメモリカードやUSB（Universal Serial Bus）フラッシュメモリなどのように、記録装置PROD_Cに接続されるタイプのものであってもよいし、（３）DVD（Digital Versatile Disc）やBD（Blu-ray Disc:登録商標）などのように、記録装置PROD_Cに内蔵されたドライブ装置（不図示）に装填されるものであってもよい。

　また、記録装置PROD_Cは、符号化部PROD_C1に入力する動画像の供給源として、動画像を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成または加工する画像処理部PROD_C6を更に備えていてもよい。図９の（ａ）においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。

　なお、受信部PROD_C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部（不図示）を介在させるとよい。

　このような記録装置PROD_Cとしては、例えば、DVDレコーダ、BDレコーダ、HDD（Hard Disk Drive）レコーダなどが挙げられる（この場合、入力端子PROD_C4または受信部PROD_C5が動画像の主な供給源となる）。また、カムコーダ（この場合、カメラPROD_C3が動画像の主な供給源となる）、パーソナルコンピュータ（この場合、受信部PROD_C5または画像処理部Ｃ６が動画像の主な供給源となる）、スマートフォン（この場合、カメラPROD_C3または受信部PROD_C5が動画像の主な供給源となる）なども、このような記録装置PROD_Cの一例である。

　図９の（ｂ）は、上述した画像復号装置３１を搭載した再生装置PROD_Dの構成を示したブロックである。図９の（ｂ）に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した画像復号装置３１は、この復号部PROD_D2として利用される。

　なお、記録媒体PROD_Mは、（１）HDDやSSDなどのように、再生装置PROD_Dに内蔵されるタイプのものであってもよいし、（２）SDメモリカードやUSBフラッシュメモリなどのように、再生装置PROD_Dに接続されるタイプのものであってもよいし、（３）DVDやBDなどのように、再生装置PROD_Dに内蔵されたドライブ装置（不図示）に装填されるものであってもよい。

　また、再生装置PROD_Dは、復号部PROD_D2が出力する動画像の供給先として、動画像を表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。図９の（ｂ）においては、これら全てを再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。

　なお、送信部PROD_D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部（不図示）を介在させるとよい。

　このような再生装置PROD_Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる（この場合、テレビジョン受像機等が接続される出力端子PROD_D4が動画像の主な供給先となる）。また、テレビジョン受像機（この場合、ディスプレイPROD_D3が動画像の主な供給先となる）、デジタルサイネージ（電子看板や電子掲示板等とも称され、ディスプレイPROD_D3または送信部PROD_D5が動画像の主な供給先となる）、デスクトップ型PC（この場合、出力端子PROD_D4または送信部PROD_D5が動画像の主な供給先となる）、ラップトップ型またはタブレット型PC（この場合、ディスプレイPROD_D3または送信部PROD_D5が動画像の主な供給先となる）、スマートフォン（この場合、ディスプレイPROD_D3または送信部PROD_D5が動画像の主な供給先となる）なども、このような再生装置PROD_Dの一例である。

　　（ハードウェア的実現及びソフトウェア的実現）
　また、上述した画像復号装置３１及び画像符号化装置１１の各ブロックは、集積回路（ICチップ）上に形成された論理回路によってハードウェア的に実現してもよいし、CPU（Central Processing Unit）を用いてソフトウェア的に実現してもよい。

　後者の場合、上記各装置は、各機能を実現するプログラムの命令を実行するCPU、上記プログラムを格納したROM（Read Only Memory）、上記プログラムを展開するRAM（Random Access Memory）、上記プログラム及び各種データを格納するメモリ等の記憶装置（記録媒体）などを備えている。そして、本発明の実施形態の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード（実行形式プログラム、中間コードプログラム、ソースプログラム）をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ（またはCPUやMPU）が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。

　上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー（登録商標）ディスク／ハードディスク等の磁気ディスクやCD-ROM（Compact Disc Read-Only Memory）／MOディスク（Magneto-Optical disc）／MD（Mini Disc）／DVD（Digital Versatile Disc）／CD-R（CD Recordable）／ブルーレイディスク（Blu-ray Disc（登録商標））等の光ディスクを含むディスク類、ICカード（メモリカードを含む）／光カード等のカード類、マスクROM／EPROM（Erasable Programmable Read-Only Memory）／EEPROM（登録商標）（Electrically Erasable and Programmable Read-Only Memory）／フラッシュROM等の半導体メモリ類、あるいはPLD（Programmable logic device）やFPGA（Field Programmable Gate Array）等の論理回路類などを用いることができる。

　また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN（Local Area Network）、ISDN（Integrated Services Digital Network）、VAN（Value-Added Network）、CATV（Community Antenna television/Cable Television）通信網、仮想専用網（Virtual Private Network）、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE（Institute of Electrical and Electronic Engineers）1394、USB、電力線搬送、ケーブルＴＶ回線、電話線、ADSL（Asymmetric Digital Subscriber Line）回線等の有線でも、IrDA（Infrared Data Association）やリモコンのような赤外線、BlueTooth（登録商標）、IEEE802.11無線、HDR（High Data Rate）、NFC（Near Field Communication）、DLNA（登録商標）（Digital Living Network Alliance）、携帯電話網、衛星回線、地上デジタル放送網等の無線でも利用可能である。なお、本発明の実施形態は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

　本発明の実施形態は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

　（関連出願の相互参照）
　本出願は、２０１７年５月２６日に出願された日本国特許出願：特願２０１７－１０４３６８に対して優先権の利益を主張するものであり、それを参照することにより、その内容の全てが本書に含まれる。

　本発明の実施形態は、画像データが符号化された符号化データを復号する画像復号装置、及び、画像データが符号化された符号化データを生成する画像符号化装置に好適に適用することができる。また、画像符号化装置によって生成され、画像復号装置によって参照される符号化データのデータ構造に好適に適用することができる。

１０　CT情報復号部
１１　画像符号化装置
２０　CU復号部
３１　画像復号装置
４１　画像表示装置

Claims

　入力動画像を符号化する動画像符号化装置において、
　前記入力動画像の１画面を複数の画素からなるブロックに分割する手段と、
　前記ブロックを単位として、対象ブロックの隣接ブロックの画素（参照画素）を参照し、イントラ予測を行い、予測画素値を算出する予測手段と、
　前記入力動画像から前記予測画素値を減算し、予測誤差を算出する手段と、
　前記予測誤差を変換、量子化し、量子化変換係数を出力する手段と、
　前記量子化変換係数を可変長符号化する手段とを備え、
　前記予測手段は、イントラ予測を実施する対象ブロックの左側のブロックの画素と、上側のブロックの画素とを参照し、
　色差成分において、前記上側のブロックの参照画素は、対象ブロックの２画素毎に１画素（第１の参照画素）を参照し、
　残りの１画素（第２の参照画素）は、第１の参照画素から補間することで導出し、
　前記予測手段は、第１の参照画素と第２の参照画素を参照して、対象ブロックの色差成分の各画素のイントラ予測値を算出することを特徴とする動画像符号化装置。
　前記第１の参照画素は奇数画素位置の画素であり、前記第２の参照画素は偶数画素位置の画素であることを特徴とする請求項１に記載の動画像符号化装置。
　前記第１の参照画素は偶数画素位置の画素であり、前記第２の参照画素は奇数画素位置の画素であることを特徴とする請求項１に記載の動画像符号化装置。
　動画像を復号する動画像復号装置において、
　複数の画素からなるブロックを処理単位として、符号化データを可変長復号して量子化変換係数を出力する手段と、
　量子化変換係数を逆量子化、逆変換して予測誤差を出力する手段と、
　前記ブロックを単位として、対象ブロックの隣接ブロックの画素（参照画素）を参照し、イントラ予測を行い、予測画素値を算出する予測手段と、
　前記予測画素値と前記予測誤差を加算する手段とを備え、
　前記予測手段は、イントラ予測を実施する対象ブロックの左側のブロックの画素と、上側のブロックの画素とを参照し、
　色差成分において、前記上側のブロックの参照画素は、対象ブロックの２画素毎に１画素（第１の参照画素）を参照し、
　残りの１画素（第２の参照画素）は、第１の参照画素から補間することで導出し、
　前記予測手段は、第１の参照画素と第２の参照画素を参照して、対象ブロックの色差成分の各画素のイントラ予測値を算出することを特徴とする動画像復号装置。
　前記第１の参照画素は奇数画素位置の画素であり、前記第２の参照画素は偶数画素位置の画素であることを特徴とする請求項４に記載の動画像復号装置。
　前記第１の参照画素は偶数画素位置の画素であり、前記第２の参照画素は奇数画素位置の画素であることを特徴とする請求項４に記載の動画像復号装置。
　動画像を復号する動画像復号装置において、
　複数の画素からなるブロックを処理単位として、符号化データを可変長復号して量子化変換係数を出力する手段と、
　量子化変換係数を逆量子化、逆変換して第２の予測誤差を出力する手段と、
　前記ブロックを単位として、対象ブロックの隣接ブロックの画素（参照画素）を参照し、イントラ予測を行い、予測画素値を算出する予測手段と、
　前記予測画素値と前記予測誤差を加算し、復号画像を導出する手段と、
　復号画像をフィルタリングする手段とを備え、
　前記予測手段またはフィルタリング手段では、記ブロック境界がCU境界である場合とCTU境界である場合とで異なる処理を実施することを特徴とする動画像復号装置。
　入力動画像を符号化する動画像符号化装置において、
　前記入力動画像の１画面を複数の画素からなるブロックに分割する手段と、
　前記ブロックを単位として、対象ブロックの隣接ブロックの画素（参照画素）を参照し、イントラ予測を行い、予測画素値を算出する予測手段と、
　前記入力動画像から前記予測画素値を減算し、第１の予測誤差を算出する手段と、
　前記予測誤差を変換、量子化し、量子化変換係数を出力する手段と、
　前記量子化変換係数を可変長符号化する手段と、
　量子化変換係数を逆量子化、逆変換して第２の予測誤差を出力する手段と、
　前記予測画素値と前記予測誤差を加算し、復号画像を導出する手段と、
　復号画像をフィルタリングする手段とを備え、
　前記予測手段またはフィルタリング手段では、記ブロック境界がCU境界である場合とCTU境界である場合とで異なる処理を実施することを特徴とする動画像符号化装置。