WO2018199002A1

WO2018199002A1 - 動画像符号化装置及び動画像復号装置

Info

Publication number: WO2018199002A1
Application number: PCT/JP2018/016408
Authority: WO
Inventors: 友子青野; 知宏猪飼
Original assignee: シャープ株式会社
Priority date: 2017-04-28
Filing date: 2018-04-23
Publication date: 2018-11-01
Also published as: US20240089469A1; JP2020109884A; US11863764B2; US20200053365A1; US20220030254A1

Abstract

符号化単位（CU）を変換する第１の変換手段と、第１の変換手段から出力された第１の変換係数の一部を変換する第２の変換手段とを備え、第２の変換手段は、水平方向と垂直方向のサイズの異なる領域（第１の領域）の第１の変換係数、あるいは非矩形領域（第２の領域）の第１の変換係数の少なくともいづれかを変換する。

Description

動画像符号化装置及び動画像復号装置

　本発明は、画像復号装置、及び画像符号化装置に関する。

　動画像を効率的に伝送または記録するために、動画像を符号化することによって符号化データを生成する画像符号化装置、及び、当該符号化データを復号することによって復号画像を生成する画像復号装置が用いられている。

　具体的な動画像符号化方式としては、例えば、H.264/AVCやHEVC（High-Efficiency Video Coding）にて提案されている方式などが挙げられる。

　このような動画像符号化方式においては、動画像を構成する画像（ピクチャ）は、画像を分割することにより得られるスライス、スライスを分割することにより得られる符号化単位（符号化ユニット（Coding Unit：CU）と呼ばれることもある）、及び、符号化単位を分割することより得られるブロックである予測ユニット（PU）、変換ユニット（TU）からなる階層構造により管理され、CUごとに符号化／復号される。

　また、このような動画像符号化方式においては、通常、入力画像を符号化／復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像（原画像）から減算して得られる予測残差（「差分画像」または「残差画像」と呼ぶこともある）が符号化される。予測画像の生成方法としては、画面間予測（インター予測）、及び、画面内予測（イントラ予測）が挙げられる。

　動画像符号化装置では、この予測残差に直交変換および量子化を施した量子化変換係数を符号化し、動画像復号装置では、符号化データから量子化変換係数を復号し、逆量子化および逆直交変換を施して、予測残差を復元する（非特許文献２）。近年、予測残差に対し、第１の直交変換（プライマリ変換）を施した後、変換係数に対し、さらに第２の変換（セカンダリ変換）を施すことで、変換係数値をゼロ付近に集中させ、符号量を削減する技術が開発されている（非特許文献１）。

"Algorithm Description of Joint Exploration Test Model 5", JVET-E1001, Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 12-20 January 2017 ITU-T H.265(04/2015) SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisual services - Coding of moving video High efficiency video coding

　非特許文献１では、画像符号化装置は予測残差にプライマリ変換を施して、特定の成分にエネルギーを集中させた後、さらに予測残差の変換係数にセカンダリ変換を施して、さらにエネルギー集中を高める。画像符号化装置は、この結果に対し、量子化、エントロピー符号化処理を施して符号化データを生成する。また、画像復号装置は符号化データをエントロピー復号、逆量子化した変換係数に対し、逆セカンダリ逆変換、逆プライマリ逆変換を施す。

　セカンダリ変換によって、特定の成分（低周波数成分）にエネルギーが集中するものの、処理量が大幅に増加する。また、セカンダリ変換に非分離型の変換を用いた場合、分離型のプライマリ変換では対応できなかった斜め方向成分のエネルギー集中も高めることができるので、斜め方向の線分も高い品質で再現することができる。しかしながら、長さNの変換の演算量はO(N^2)もしくはO(NlogN)であることが知られているように、長い成分の変換では、複雑度が高くなる。

　そこで、本発明は、上記の課題に鑑みてなされたものであり、その目的は、符号量削減効果を維持しつつ、変換の処理量および複雑度を削減することができる画像復号装置及び画像符号化装置を提供することにある。

　本発明の一態様に係る画像符号化装置は、入力動画像の１画面を複数の画素からなる符号化単位（CU）に分割する手段と、前記CUを単位として所定の変換を行い変換係数を出力する変換手段と、前記変換係数を量子化し、量子化変換係数を出力する手段と、前記量子化変換係数を可変長符号化する手段とを備え、前記変換手段は、第１の変換手段と、第１の変換手段から出力された第１の変換係数の一部を変換する第２の変換手段とを備え、第２の変換手段は、水平方向と垂直方向のサイズの異なる領域（第１の領域）の第１の変換係数、あるいは非矩形領域（第２の領域）の第１の変換係数の少なくともいづれかを変換することを特徴とする。

　本発明の一態様に係る画像復号装置は、複数の画素からなる符号化単位（CU)を処理単位として符号化データを可変長復号して量子化変換係数を出力する手段と、量子化変換係数を逆量子化して変換係数を出力する手段と、前記変換係数を逆変換する逆変換手段とを備え、前記逆変換手段は、前記変換係数の少なくとも一部を逆変換して、第２の変換係数を出力する第２の逆変換手段と、前記変換係数の残りと前記第２の変換係数を逆変換する第１の逆変換手段とを備え、第２の逆変換手段は、水平方向と垂直方向のサイズの異なる領域（第１の領域）の前記変換係数、あるいは非矩形領域（第２の領域）の前記変換係数の少なくともいづれかを逆変換することを特徴とする。

　本発明の一態様によれば、符号化効率の低下を抑えつつ、動画像符号化・復号処理量および使用するメモリを削減することができる。

本発明の一実施形態に係る画像伝送システムの構成を示す概略図である。本発明の一実施形態に係る符号化ストリームのデータの階層構造を示す図である。 PU分割モードのパターンを示す図である。（ａ）～（ｈ）は、それぞれ、PU分割モードが、2Nx2N、2NxN、2NxnU、2NxnD、Nx2N、nLx2N、nRx2N、及び、NxNの場合のパーティション形状について示している。参照ピクチャ及び参照ピクチャリストの一例を示す概念図である。本発明の一実施形態に係る画像復号装置の構成を示すブロック図である。本発明の一実施形態に係る画像符号化装置の構成を示すブロック図である。変換・量子化部および逆量子化・逆変換部の詳細なブロック図である。本発明の一実施形態に係る画像符号化装置を搭載した送信装置、及び、画像復号装置を搭載した受信装置の構成について示した図である。（ａ）は、画像符号化装置を搭載した送信装置を示しており、（ｂ）は、画像復号装置を搭載した受信装置を示している。本発明の一実施形態に係る画像符号化装置を搭載した記録装置、及び、画像復号装置を搭載した再生装置の構成について示した図である。（ａ）は、画像符号化装置を搭載した記録装置を示しており、（ｂ）は、画像復号装置を搭載した再生装置を示している。セカンダリ変換の対象領域を示す図である。変換・量子化部および逆量子化・逆変換部の動作を示すフローチャートである。イントラ予測モードとセカンダリ変換の対応関係を示す表である。セカンダリ変換の性能を示す一例である。セカンダリ変換に入力する32個の係数を示す図である。変換係数のスキャン方向を示す図である。変換・量子化部および逆量子化・逆変換部の動作を示す別のフローチャートである。変換・量子化部および逆量子化・逆変換部の動作を示す別のフローチャートである。イントラ予測モードを示す図である。セカンダリ変換に入力する16個の係数を示す図である。逆量子化・逆変換部の動作の一部を示すフローチャートである。逆量子化・逆変換部の動作の一部を示すフローチャートである。セカンダリ変換セットの具体例を示す表である。変換・量子化部および逆量子化・逆変換部の動作を示す別のフローチャートである。イントラ予測モードとセカンダリ変換の対応関係を示す別の表である。変換・量子化部および逆量子化・逆変換部の動作を示す別のフローチャートである。

　　（実施形態１）
　以下、図面を参照しながら本発明の実施形態について説明する。

　図１は、本実施形態に係る画像伝送システム１の構成を示す概略図である。

　画像伝送システム１は、符号化対象画像を符号化した符号を伝送し、伝送された符号を復号し画像を表示するシステムである。画像伝送システム１は、画像符号化装置１１、ネットワーク２１、画像復号装置３１及び画像表示装置４１を含んで構成される。

　画像符号化装置１１には、単一レイヤもしくは複数レイヤの画像を示す画像Ｔが入力される。レイヤとは、ある時間を構成するピクチャが１つ以上ある場合に、複数のピクチャを区別するために用いられる概念である。たとえば、同一ピクチャを、画質や解像度の異なる複数のレイヤで符号化するとスケーラブル符号化になり、異なる視点のピクチャを複数のレイヤで符号化するとビュースケーラブル符号化となる。複数のレイヤのピクチャ間で予測（インターレイヤ予測、インタービュー予測）を行う場合には、符号化効率が大きく向上する。また予測を行わない場合（サイマルキャスト）の場合にも、符号化データをまとめることができる。

　ネットワーク２１は、画像符号化装置１１が生成した符号化ストリームＴｅを画像復号装置３１に伝送する。ネットワーク２１は、インターネット（internet）、広域ネットワーク（WAN:Wide Area Network）、小規模ネットワーク（LAN:Local Area Network）またはこれらの組み合わせである。ネットワーク２１は、必ずしも双方向の通信網に限らず、地上デジタル放送、衛星放送等の放送波を伝送する一方向の通信網であっても良い。また、ネットワーク２１は、DVD（Digital Versatile Disc）、BD（Blu-ray Disc:登録商標）等の符号化ストリームTeを記録した記憶媒体で代替されても良い。

　画像復号装置３１は、ネットワーク２１が伝送した符号化ストリームTeのそれぞれを復号し、それぞれ復号した１または複数の復号画像Tdを生成する。

　画像表示装置４１は、画像復号装置３１が生成した１または複数の復号画像Tdの全部または一部を表示する。画像表示装置４１は、例えば、液晶ディスプレイ、有機ＥＬ（Electro-luminescence）ディスプレイ等の表示デバイスを備える。また、空間スケーラブル符号化、ＳＮＲスケーラブル符号化では、画像復号装置３１、画像表示装置４１が高い処理能力を有する場合には、画質の高い拡張レイヤ画像を表示し、より低い処理能力しか有しない場合には、拡張レイヤほど高い処理能力、表示能力を必要としないベースレイヤ画像を表示する。

　　＜演算子＞
　本明細書で用いる演算子を以下に記載する。

　>>は右ビットシフト、<<は左ビットシフト、&はビットワイズAND、|はビットワイズOR、|=は別の条件との和演算（OR）である。

　x ? y : zは、xが真（0以外）の場合にy、xが偽（0）の場合にzをとる３項演算子である。

　Clip3(a, b, c) は、cをa以上b以下の値にクリップする関数であり、c<aの場合にはaを返し、c>bの場合にはbを返し、その他の場合にはcを返す関数である（ただし、a<=b）。

　　＜符号化ストリームTeの構造＞
　本実施形態に係る画像符号化装置１１及び画像復号装置３１の詳細な説明に先立って、画像符号化装置１１によって生成され、画像復号装置３１によって復号される符号化ストリームTeのデータ構造について説明する。

　図２は、符号化ストリームTeにおけるデータの階層構造を示す図である。符号化ストリームTeは、例示的に、シーケンス、及びシーケンスを構成する複数のピクチャを含む。図２の（ａ）～（ｆ）は、それぞれ、シーケンスSEQを既定する符号化ビデオシーケンス、ピクチャPICTを規定する符号化ピクチャ、スライスSを規定する符号化スライス、スライスデータを規定する符号化スライスデータ、符号化スライスデータに含まれる符号化ツリーユニット、符号化ツリーユニットに含まれる符号化ユニット（Coding Unit；CU）を示す図である。

　　（符号化ビデオシーケンス）
　符号化ビデオシーケンスでは、処理対象のシーケンスSEQを復号するために画像復号装置３１が参照するデータの集合が規定されている。シーケンスSEQは、図２の（ａ）に示すように、ビデオパラメータセット（Video Parameter Set）、シーケンスパラメータセットSPS（Sequence Parameter Set）、ピクチャパラメータセットPPS（Picture Parameter Set）、ピクチャPICT、及び、付加拡張情報SEI（Supplemental Enhancement Information）を含んでいる。ここで＃の後に示される値はレイヤIDを示す。図２では、#0と#1すなわちレイヤ０とレイヤ１の符号化データが存在する例を示すが、レイヤの種類及びレイヤの数はこれによらない。

　ビデオパラメータセットVPSは、複数のレイヤから構成されている動画像において、複数の動画像に共通する符号化パラメータの集合及び動画像に含まれる複数のレイヤ及び個々のレイヤに関連する符号化パラメータの集合が規定されている。

　シーケンスパラメータセットSPSでは、対象シーケンスを復号するために画像復号装置３１が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの幅や高さが規定される。なお、SPSは複数存在してもよい。その場合、PPSから複数のSPSの何れかを選択する。

　ピクチャパラメータセットPPSでは、対象シーケンス内の各ピクチャを復号するために画像復号装置３１が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの復号に用いられる量子化幅の基準値（pic_init_qp_minus26）や重み付き予測の適用を示すフラグ（weighted_pred_flag）が含まれる。なお、PPSは複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のPPSの何れかを選択する。

　　（符号化ピクチャ）
　符号化ピクチャでは、処理対象のピクチャPICTを復号するために画像復号装置３１が参照するデータの集合が規定されている。ピクチャPICTは、図２の（ｂ）に示すように、スライスS0～S_NS-1を含んでいる（ＮＳはピクチャPICTに含まれるスライスの総数）。

　なお、以下、スライスS0～S_NS-1のそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する符号化ストリームTeに含まれるデータであって、添え字を付している他のデータについても同様である。

　　（符号化スライス）
　符号化スライスでは、処理対象のスライスSを復号するために画像復号装置３１が参照するデータの集合が規定されている。スライスSは、図２の（ｃ）に示すように、スライスヘッダSH、及び、スライスデータSDATAを含んでいる。

　スライスヘッダSHには、対象スライスの復号方法を決定するために画像復号装置３１が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報（slice_type）は、スライスヘッダSHに含まれる符号化パラメータの一例である。

　スライスタイプ指定情報により指定可能なスライスタイプとしては、（１）符号化の際にイントラ予測のみを用いるIスライス、（２）符号化の際に単方向予測、または、イントラ予測を用いるPスライス、（３）符号化の際に単方向予測、双方向予測、または、イントラ予測を用いるBスライスなどが挙げられる。なお、インター予測は、単予測、双予測に限定されず、より多くの参照ピクチャを用いて予測画像を生成してもよい。以下、P、Bスライスと呼ぶ場合には、インター予測を用いることができるブロックを含むスライスを指す。

　なお、スライスヘッダSHには、上記符号化ビデオシーケンスに含まれる、ピクチャパラメータセットPPSへの参照（pic_parameter_set_id）を含んでいても良い。

　　（符号化スライスデータ）
　符号化スライスデータでは、処理対象のスライスデータSDATAを復号するために画像復号装置３１が参照するデータの集合が規定されている。スライスデータSDATAは、図２の（ｄ）に示すように、符号化ツリーユニット（CTU:Coding Tree Unit）を含んでいる。CTUは、スライスを構成する固定サイズ（例えば64x64）のブロックであり、最大符号化単位（LCU:Largest Coding Unit）と呼ぶこともある。

　　（符号化ツリーユニット）
　図２の（ｅ）に示すように、処理対象の符号化ツリーユニットを復号するために画像復号装置３１が参照するデータの集合が規定されている。符号化ツリーユニットは、再帰的な４分木分割（QT分割）または２分木分割（BT分割）により符号化処理の基本的な単位である符号化ユニット（CU:Coding Unit）に分割される。再帰的な４分木分割または２分木分割により得られる木構造を符号化ツリー（CT:Coding Tree）、木構造のノードのことを符号化ノード（CN:Coding Node）と称する。４分木及び２分木の中間ノードは、符号化ノードであり、符号化ツリーユニット自身も最上位の符号化ノードとして規定される。

　CTは、CT情報として、QT分割を行うか否かを示すQT分割フラグ（cu_split_flag）、及びBT分割の分割方法を示すBT分割モード（split_bt_mode）を含む。cu_split_flag及び／又はsplit_bt_modeは符号化ノードCNごとに伝送される。cu_split_flagが１の場合には、符号化ノードCNは４つの符号化ノードCNに分割される。cu_split_flagが０の場合、split_bt_modeが１の場合には、符号化ノードCNは２つの符号化ノードCNに水平分割される。split_bt_modeが２の場合には、符号化ノードCNは２つの符号化ノードCNに垂直分割される。split_bt_modeが０の場合には、符号化ノードCNは分割されず、１つの符号化ユニットCUをノードとして持つ。符号化ユニットCUは符号化ノードの末端ノード（リーフノード）であり、これ以上分割されない。

　また、符号化ツリーユニットCTUのサイズが64x64画素の場合には、符号化ユニットのサイズは、64x64画素、64x32画素、32x64画素、32x32画素、64x16画素、16x64画素、32x16画素、16x32画素、16x16画素、64x8画素、8x64画素、32x8画素、8x32画素、16x8画素、8x16画素、8x8画素、64x4画素、4x64画素、32x4画素、4x32画素、16x4画素、4x16画素、8x4画素、4x8画素、及び、4x4画素の何れかをとり得る。

　　（符号化ユニット）
　図２の（ｆ）に示すように、処理対象の符号化ユニットを復号するために画像復号装置３１が参照するデータの集合が規定されている。具体的には、符号化ユニットは、予測ツリー、変換ツリー、CUヘッダCUHから構成される。CUヘッダでは予測モード、分割方法（PU分割モード）等が規定される。

　予測ツリーでは、符号化ユニットを１または複数に分割した各予測ユニット（PU）の予測パラメータ（参照ピクチャインデックス、動きベクトル等）が規定される。別の表現でいえば、予測ユニットは、符号化ユニットを構成する１または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた１または複数の予測ユニットを含む。なお、以下では、予測ユニットをさらに分割した予測単位を「サブブロック」と呼ぶ。サブブロックは、複数の画素によって構成されている。予測ユニットとサブブロックのサイズが等しい場合には、予測ユニット中のサブブロックは１つである。予測ユニットがサブブロックのサイズよりも大きい場合には、予測ユニットは、サブブロックに分割される。たとえば予測ユニットが8x8、サブブロックが4x4の場合には、予測ユニットは水平に２分割、垂直に２分割からなる、４つのサブブロックに分割される。

　予測処理は、この予測ユニット（サブブロック）ごとに行ってもよい。

　予測ツリーにおける分割の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との２つがある。イントラ予測とは、同一ピクチャ内の予測であり、インター予測とは、互いに異なるピクチャ間（例えば、表示時刻間、レイヤ画像間）で行われる予測処理を指す。

　イントラ予測の場合、分割方法は、2Nx2N（符号化ユニットと同一サイズ）と、NxNとがある。

　また、インター予測の場合、分割方法は、符号化データのPU分割モード（part_mode）により符号化され、2Nx2N（符号化ユニットと同一サイズ）、2NxN、2NxnU、2NxnD、Nx2N、nLx2N、nRx2N、及び、NxNなどがある。なお、2NxN、Nx2Nは1:1の対称分割を示し、
2NxnU、2NxnD及びnLx2N、nRx2Nは、1:3、3:1の非対称分割を示す。CUに含まれるPUを順にPU0、PU1、PU2、PU3と表現する。

　図３の（ａ）～（ｈ）に、それぞれのPU分割モードにおけるパーティションの形状（PU分割の境界の位置）を具体的に図示している。図３の（ａ）は、2Nx2Nのパーティションを示し、（ｂ）、（ｃ）、（ｄ）は、それぞれ、2NxN、2NxnU、及び、2NxnDのパーティション（横長パーティション）を示す。（ｅ）、（ｆ）、（ｇ）は、それぞれ、Nx2N、nLx2N、nRx2Nである場合のパーティション（縦長パーティション）を示し、（ｈ）は、NxNのパーティションを示す。なお、横長パーティションと縦長パーティションを総称して長方形パーティション、2Nx2N、NxNを総称して正方形パーティションと呼ぶ。

　また、変換ツリーにおいては、符号化ユニットが１または複数の変換ユニットに分割され、各変換ユニットの位置とサイズとが規定される。別の表現でいえば、変換ユニットは、符号化ユニットを構成する１または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた１または複数の変換ユニットを含む。

　変換ツリーにおける分割には、符号化ユニットと同一のサイズの領域を変換ユニットとして割り付けるものと、上述したCUの分割と同様、再帰的な４分木分割によるものがある。

　変換処理は、この変換ユニットごとに行われる。

　　（予測パラメータ）
　予測ユニット（PU：Prediction Unit）の予測画像は、PUに付随する予測パラメータによって導出される。予測パラメータには、イントラ予測の予測パラメータもしくはインター予測の予測パラメータがある。以下、インター予測の予測パラメータ（インター予測パラメータ）について説明する。インター予測パラメータは、予測リスト利用フラグpredFlagL0、predFlagL1と、参照ピクチャインデックスrefIdxL0、refIdxL1と、動きベクトルmvL0、mvL1から構成される。予測リスト利用フラグpredFlagL0、predFlagL1は、各々L0リスト、L1リストと呼ばれる参照ピクチャリストが用いられるか否かを示すフラグであり、値が１の場合に対応する参照ピクチャリストが用いられる。なお、本明細書中「ＸＸであるか否かを示すフラグ」と記す場合、フラグが０以外（たとえば１）をＸＸである場合、０をＸＸではない場合とし、論理否定、論理積などでは１を真、０を偽と扱う（以下同様）。但し、実際の装置や方法では真値、偽値として他の値を用いることもできる。

　符号化データに含まれるインター予測パラメータを導出するためのシンタックス要素には、例えば、PU分割モードpart_mode、マージフラグmerge_flag、マージインデックスmerge_idx、インター予測識別子inter_pred_idc、参照ピクチャインデックスrefIdxLX、予測ベクトルインデックスmvp_LX_idx、差分ベクトルmvdLXがある。

　　（参照ピクチャリスト）
　参照ピクチャリストは、参照ピクチャメモリ３０６に記憶された参照ピクチャからなるリストである。図４は、参照ピクチャ及び参照ピクチャリストの一例を示す概念図である。図４の（ａ）において、矩形はピクチャ、矢印はピクチャの参照関係、横軸は時間、矩形中のI、P、Bは各々イントラピクチャ、単予測ピクチャ、双予測ピクチャ、矩形中の数字は復号順を示す。図に示すように、ピクチャの復号順は、I0、P1、B2、B3、B4であり、表示順は、I0、B3、B2、B4、P1である。図４の（ｂ）に、参照ピクチャリストの例を示す。参照ピクチャリストは、参照ピクチャの候補を表すリストであり、１つのピクチャ（スライス）が１つ以上の参照ピクチャリストを有してもよい。図の例では、対象ピクチャB3は、L0リストRefPicList0及びL1リストRefPicList1の２つの参照ピクチャリストを持つ。対象ピクチャがB3の場合の参照ピクチャは、I0、P1、B2であり、参照ピクチャはこれらのピクチャを要素として持つ。個々の予測ユニットでは、参照ピクチャリストRefPicListX中のどのピクチャを実際に参照するかを参照ピクチャインデックスrefIdxLXで指定する。図では、refIdxL0及びrefIdxL1により参照ピクチャP1とB2が参照される例を示す。

　　（マージ予測とAMVP予測）
　予測パラメータの復号（符号化）方法には、マージ予測（merge）モードとAMVP（Adaptive Motion Vector Prediction、適応動きベクトル予測）モードがある、マージフラグmerge_flagは、これらを識別するためのフラグである。マージモードは、予測リスト利用フラグpredFlagLX（またはインター予測識別子inter_pred_idc）、参照ピクチャインデックスrefIdxLX、動きベクトルmvLXを符号化データに含めずに、既に処理した近傍PUの予測パラメータから導出するモードである。AMVPモードは、インター予測識別子inter_pred_idc、参照ピクチャインデックスrefIdxLX、動きベクトルmvLXを符号化データに含めるモードである。なお、動きベクトルmvLXは、予測ベクトルmvpLXを識別する予測ベクトルインデックスmvp_LX_idxと差分ベクトルmvdLXとして符号化される。

　インター予測識別子inter_pred_idcは、参照ピクチャの種類及び数を示す値であり、PRED_L0、PRED_L1、PRED_BIの何れかの値をとる。PRED_L0、PRED_L1は、各々L0リスト、L1リストの参照ピクチャリストで管理された参照ピクチャを用いることを示し、１枚の参照ピクチャを用いること（単予測）を示す。PRED_BIは２枚の参照ピクチャを用いること（双予測BiPred）を示し、L0リストとL1リストで管理された参照ピクチャを用いる。予測ベクトルインデックスmvp_LX_idxは予測ベクトルを示すインデックスであり、参照ピクチャインデックスrefIdxLXは、参照ピクチャリストで管理された参照ピクチャを示すインデックスである。なお、LXは、L0予測とL1予測を区別しない場合に用いられる記述方法であり、LXをL0、L1に置き換えることでL0リストに対するパラメータとL1リストに対するパラメータを区別する。

　マージインデックスmerge_idxは、処理が完了したPUから導出される予測パラメータ候補（マージ候補）のうち、いずれの予測パラメータを復号対象PUの予測パラメータとして用いるかを示すインデックスである。

　　（動きベクトル）
　動きベクトルmvLXは、異なる２つのピクチャ上のブロック間のずれ量を示す。動きベクトルmvLXに関する予測ベクトル、差分ベクトルを、それぞれ予測ベクトルmvpLX、差分ベクトルmvdLXと呼ぶ。

　　（インター予測識別子inter_pred_idcと予測リスト利用フラグpredFlagLX）
　インター予測識別子inter_pred_idcと、予測リスト利用フラグpredFlagL0、predFlagL1の関係は以下のとおりであり、相互に変換可能である。

　inter_pred_idc = （predFlagL1<<１） + predFlagL0
　predFlagL0 = inter_pred_idc & １
　predFlagL1 = inter_pred_idc >> １
　なお、インター予測パラメータは、予測リスト利用フラグを用いても良いし、インター予測識別子を用いてもよい。また、予測リスト利用フラグを用いた判定は、インター予測識別子を用いた判定に置き替えてもよい。逆に、インター予測識別子を用いた判定は、予測リスト利用フラグを用いた判定に置き替えてもよい。

　　（双予測biPredの判定）
　双予測BiPredであるかのフラグbiPredは、２つの予測リスト利用フラグがともに１であるかによって導出できる。たとえば以下の式で導出できる。

　biPred = (predFlagL0 == 1 && predFlagL1 == 1)
　フラグbiPredは、インター予測識別子が２つの予測リスト（参照ピクチャ）を使うことを示す値であるか否かによっても導出できる。たとえば以下の式で導出できる。

　biPred = (inter_pred_idc == PRED_BI) ? 1 : 0
上記式は、以下の式でも表現できる。

　biPred = (inter_pred_idc == PRED_BI)
　なお、PRED_BIはたとえば3の値を用いることができる。

　　（イントラ予測モード）
　輝度イントラ予測モードIntraPredModeYは67モードであり、プレーナ予測（0）、DC予測（1）、方向予測（2～66）が対応する。色差イントラ予測モードIntraPredModeCは上記の67モードにCCLM（Colour Component Linear Mode）を加えた68モードである。CCLMは、対象色成分における対象画素の画素値を、対象色成分よりも前に符号化された別の色成分の画素値を参照した線形予測によって導出するモードである。なお、色成分には輝度Y、色差Cb、色差Crが含まれる。輝度と色差で異なるイントラ予測モードを割り当ててもよく、CUあるいはPU単位で予測モードを符号化、復号する。

　　（画像復号装置の構成）
　次に、本実施形態に係る画像復号装置３１の構成について説明する。図５は、本実施形態に係る画像復号装置３１の構成を示す概略図である。画像復号装置３１は、エントロピー復号部３０１、予測パラメータ復号部（予測画像復号装置）３０２、ループフィルタ３０５、参照ピクチャメモリ３０６、予測パラメータメモリ３０７、予測画像生成部（予測画像生成装置）３０８、逆量子化・逆変換部３１１、及び加算部３１２を含んで構成される。

　また、予測パラメータ復号部３０２は、インター予測パラメータ復号部３０３及びイントラ予測パラメータ復号部３０４を含んで構成される。予測画像生成部３０８は、インター予測画像生成部３０９及びイントラ予測画像生成部３１０を含んで構成される。

　エントロピー復号部３０１は、外部から入力された符号化ストリームTeに対してエントロピー復号を行って、個々の符号（シンタックス要素）を分離し復号する。分離された符号には、予測画像を生成するための予測パラメータ及び、差分画像を生成するための残差情報などがある。

　エントロピー復号部３０１は、分離した符号の一部を予測パラメータ復号部３０２に出力する。分離した符号の一部とは、例えば、予測モードpredMode、PU分割モードpart_mode、マージフラグmerge_flag、マージインデックスmerge_idx、インター予測識別子inter_pred_idc、参照ピクチャインデックスref_Idx_lX、予測ベクトルインデックスmvp_LX_idx、差分ベクトルmvdLXである。どの符号を復号するかの制御は、予測パラメータ復号部３０２の指示に基づいて行われる。エントロピー復号部３０１は、量子化係数を逆量子化・逆変換部３１１に出力する。この量子化係数は、符号化処理において、残差信号に対して直交変換（離散コサイン変換、離散サイン変換等）を行い量子化して得られる係数である。

　インター予測パラメータ復号部３０３は、エントロピー復号部３０１から入力された符号に基づいて、予測パラメータメモリ３０７に記憶された予測パラメータを参照してインター予測パラメータを復号する。

　インター予測パラメータ復号部３０３は、復号したインター予測パラメータを予測画像生成部３０８に出力し、また予測パラメータメモリ３０７に記憶する。

　イントラ予測パラメータ復号部３０４は、エントロピー復号部３０１から入力された符号に基づいて、予測パラメータメモリ３０７に記憶された予測パラメータを参照してイントラ予測パラメータを復号する。イントラ予測パラメータとは、CUを１つのピクチャ内で予測する処理で用いるパラメータ、例えば、イントラ予測モードIntraPredModeである。イントラ予測パラメータ復号部３０４は、復号したイントラ予測パラメータを予測画像生成部３０８に出力し、また予測パラメータメモリ３０７に記憶する。

　ループフィルタ３０５は、加算部３１２が生成したCUの復号画像に対し、デブロッキングフィルタ、サンプル適応オフセット（SAO）、適応ループフィルタ（ALF）等のフィルタを施す。

　参照ピクチャメモリ３０６は、加算部３１２が生成したCUの復号画像を、復号対象のピクチャ及びCU毎に予め定めた位置に記憶する。

　予測パラメータメモリ３０７は、予測パラメータを、復号対象のピクチャ及び予測ユニット（もしくはサブブロック、固定サイズブロック、ピクセル）毎に予め定めた位置に記憶する。具体的には、予測パラメータメモリ３０７は、インター予測パラメータ復号部３０３が復号したインター予測パラメータ、イントラ予測パラメータ復号部３０４が復号したイントラ予測パラメータ及びエントロピー復号部３０１が分離した予測モードpredModeを記憶する。記憶されるインター予測パラメータには、例えば、予測リスト利用フラグpredFlagLX（インター予測識別子inter_pred_idc）、参照ピクチャインデックスrefIdxLX、動きベクトルmvLXがある。

　予測画像生成部３０８には、エントロピー復号部３０１から入力された予測モードpredModeが入力され、また予測パラメータ復号部３０２から予測パラメータが入力される。また、予測画像生成部３０８は、参照ピクチャメモリ３０６から参照ピクチャを読み出す。予測画像生成部３０８は、予測モードpredModeが示す予測モードで、入力された予測パラメータと読み出した参照ピクチャを用いてPUの予測画像を生成する。

　ここで、予測モードpredModeがインター予測モードを示す場合、インター予測画像生成部３０９は、インター予測パラメータ復号部３０３から入力されたインター予測パラメータと読み出した参照ピクチャを用いてインター予測によりPUの予測画像を生成する。

　インター予測画像生成部３０９は、予測リスト利用フラグpredFlagLXが１である参照ピクチャリスト（L0リスト、もしくはL1リスト）に対し、参照ピクチャインデックスrefIdxLXで示される参照ピクチャから、復号対象PUを基準として動きベクトルmvLXが示す位置にある参照ピクチャブロックを参照ピクチャメモリ３０６から読み出す。インター予測画像生成部３０９は、読み出した参照ピクチャブロックをもとに予測を行ってPUの予測画像を生成する。インター予測画像生成部３０９は、生成したPUの予測画像を加算部３１２に出力する。

　予測モードpredModeがイントラ予測モードを示す場合、イントラ予測画像生成部３１０は、イントラ予測パラメータ復号部３０４から入力されたイントラ予測パラメータと読み出した参照ピクチャを用いてイントラ予測を行う。具体的には、イントラ予測画像生成部３１０は、復号対象のピクチャであって、既に復号されたPUのうち、復号対象PUから予め定めた範囲にある隣接PUを参照ピクチャメモリ３０６から読み出す。予め定めた範囲とは、復号対象PUがいわゆるラスタースキャンの順序で順次移動する場合、例えば、左、左上、上、右上の隣接PUのうちのいずれかであり、イントラ予測モードによって異なる。ラスタースキャンの順序とは、各ピクチャにおいて、上端から下端まで各行について、順次左端から右端まで移動させる順序である。

　イントラ予測画像生成部３１０は、読み出した隣接PUについてイントラ予測モードIntraPredModeが示す予測モードで予測を行ってPUの予測画像を生成する。イントラ予測画像生成部３１０は、生成したPUの予測画像を加算部３１２に出力する。

　イントラ予測パラメータ復号部３０４において、輝度と色差で異なるイントラ予測モードを導出する場合、イントラ予測画像生成部３１０は、輝度予測モードIntraPredModeYに応じて、プレーナ予測（０）、DC予測（１）、方向予測（２～６６）の何れかによって輝度のPUの予測画像を生成し、色差予測モードIntraPredModeCに応じて、プレーナ予測（０）、DC予測（１）、方向予測（２～６６）、LMモード（６７）の何れかによって色差のPUの予測画像を生成する。

　逆量子化・逆変換部３１１の詳細なブロック図を図7に示す。図7(b)は逆量子化・逆変換部３１１であり、逆量子化部706、並び替え部707、逆セカンダリ変換部708、並び替え部709、逆プライマリ変換部710からなる。逆量子化部706は、エントロピー復号部３０１から入力された量子化変換係数を逆量子化する。並べ替え部707（サブセット抽出部、係数アサイン部）は、逆量子化部706の出力の中から逆セカンダリ変換を施す係数を抽出し、逆セカンダリ変換部708に入力する形式に並び替える。逆セカンダリ変換部708は、並べ替え部707の出力に逆セカンダリ変換を施す。詳細は後述する。並び替え部709（サブセット格納部、係数アサイン部）は、逆セカンダリ変換部708の出力と逆セカンダリ変換しなかった逆量子化部706の出力とを合わせて、逆プライマリ変換部710に入力する形式に並び替える。逆プライマリ変換部710は、並び替え部709の出力に逆プライマリ変換を行い、予測残差信号を算出する。逆量子化・逆変換部３１１は、算出した残差信号を加算部３１２に出力する。

　加算部３１２は、インター予測画像生成部３０９またはイントラ予測画像生成部３１０から入力されたPUの予測画像と逆量子化・逆変換部３１１から入力された残差信号を画素毎に加算して、PUの復号画像を生成する。加算部３１２は、生成したPUの復号画像を参照ピクチャメモリ３０６に記憶し、生成したPUの復号画像をピクチャ毎に統合した復号画像Tdを外部に出力する。

　　（画像符号化装置の構成）
　次に、本実施形態に係る画像符号化装置１１の構成について説明する。図６は、本実施形態に係る画像符号化装置１１の構成を示すブロック図である。画像符号化装置１１は、予測画像生成部１０１、減算部１０２、変換・量子化部１０３、エントロピー符号化部１０４、逆量子化・逆変換部１０５、加算部１０６、ループフィルタ１０７、予測パラメータメモリ（予測パラメータ記憶部、フレームメモリ）１０８、参照ピクチャメモリ（参照画像記憶部、フレームメモリ）１０９、符号化パラメータ決定部１１０、予測パラメータ符号化部１１１を含んで構成される。予測パラメータ符号化部１１１は、インター予測パラメータ符号化部１１２及びイントラ予測パラメータ符号化部１１３を含んで構成される。

　予測画像生成部１０１は画像Ｔの各ピクチャについて、そのピクチャを分割した領域である符号化ユニットCU毎に予測ユニットPUの予測画像Ｐを生成する。ここで、予測画像生成部１０１は、予測パラメータ符号化部１１１から入力された予測パラメータに基づいて参照ピクチャメモリ１０９から復号済のブロックを読み出す。予測パラメータ符号化部１１１から入力された予測パラメータとは、例えばインター予測の場合、動きベクトルである。予測画像生成部１０１は、対象PUを起点として動きベクトルが示す参照画像上の位置にあるブロックを読み出す。またイントラ予測の場合、予測パラメータとは例えばイントラ予測モードである。イントラ予測モードで使用する隣接PUの画素値を参照ピクチャメモリ１０９から読み出し、PUの予測画像Pを生成する。予測画像生成部１０１は、読み出した参照ピクチャブロックについて複数の予測方式のうちの１つの予測方式を用いてPUの予測画像Ｐを生成する。予測画像生成部１０１は、生成したPUの予測画像Ｐを減算部１０２に出力する。

　なお、予測画像生成部１０１は、既に説明した予測画像生成部３０８と同じ動作であるためここでの説明を省略する。

　予測画像生成部１０１は、予測パラメータ符号化部から入力されたパラメータを用いて、参照ピクチャメモリから読み出した参照ブロックの画素値をもとにPUの予測画像Pを生成する。予測画像生成部１０１で生成した予測画像は減算部１０２、加算部１０６に出力される。

　減算部１０２は、予測画像生成部１０１から入力されたPUの予測画像Ｐの信号値を、画像Ｔの対応するPUの画素値から減算して、残差信号を生成する。減算部１０２は、生成した残差信号を変換・量子化部１０３に出力する。

　変換・量子化部１０３の詳細なブロック図を図7に示す。図7(a)は変換・量子化部１０３であり、プライマリ変換部701、並び替え部702、セカンダリ変換部703、並び替え部704、量子化部705からなる。プライマリ変換部701は、減算部１０２から入力された予測残差信号に対しプライマリ変換を行い、プライマリ変換係数を算出する。並び替え部702はプライマリ変換部701の出力をセカンダリ変換部703に入力する形式に並び替える。この並び替えは、逆量子化・逆変換部３１１の並び替え部709の並び替えと入出力が逆の関係にある。セカンダリ変換部703は、並び替え部702の出力にセカンダリ変換を施す。詳細は後述する。並び替え部704は、セカンダリ変換部703の出力とセカンダリ変換しなかったプライマリ変換部701の出力を合わせて、量子化部705に入力する形式に並び替える。この並び替えは、逆量子化・逆変換部３１１の並び替え部707の並び替えと入出力が逆の関係にある。量子化部705は、並び替え部704の出力を量子化して量子化係数を求める。変換・量子化部１０３は、求めた量子化係数をエントロピー符号化部１０４及び逆量子化・逆変換部１０５に出力する。

　プライマリ変換はCUあるいはTU単位の予測残差に対し、一般的に分離型変換を施す。予測残差の特徴に適合した、相互に独立な変換軸で変換するため、DCT-2、DCT-5、DCT-8、DST-1、DST-7等、複数の変換基底から選択することができる。画像復号装置で記載した逆プライマリ変換は、プライマリ変換の逆変換であり、プライマリ変換で使用した変換基底に対応する逆変換用の基底を用いる。

　次にセカンダリ変換とその逆変換について説明する。

　セカンダリ変換はプライマリ変換後の係数に対し適用する変換である。一般的にプライマリ変換は分離型変換で実現されており、例えば斜め方向成分に対しては最適ではなく、エネルギーを効率的に集中させることができない。このような場合に、プライマリ変換係数に再度斜め方向の成分に対して効果のある変換を施すことによって、特定の成分にエネルギーを集中させることができる。

　図7を用いてセカンダリ変換、逆セカンダリ変換の手順を示す。プライマリ変換（CU単位）後のプライマリ変換係数を格納した幅W、高さHのW*HブロックPXに対し、PXの左上領域を含む幅M、高さMのM*M配列SX（図10の斜線部に対応）をセカンダリ変換の対象とする。セカンダリの対象がM*Mブロックの場合、単に「M*Mブロック変換」とも呼ぶ。行列表現では垂直方向、水平方向の順に表記するのが自然であるが、以下ではブロックのサイズを幅*高さで表現することに合わせて、W*HブロックPXをW*H配列PX（配列の各成分をPXw,h w=0..W-1、h=0..H-1）と記す。ここでW、HはCU(CUを分割して変換する場合TU)の幅と高さであり、M<=W、かつM<=Hである。なお、MはCUが8x8以上の場合はM=8、それ以外の場合はM=4のように、CUのサイズに合わせてMを設定してもよい。セカンダリ変換はプライマリ変換係数全体、あるいは一部の低周波数成分に施す。セカンダリ変換の出力をM*M配列SY（配列の各成分をSYm,nと記す）と表記し、量子化部705に入力するW*H配列PY（配列の各成分をPYw,hと記す）の左上に位置するMxM領域に格納する。量子化部705に入力するW*H配列PYの残りの領域にはプライマリ変換係数PXを格納する。

　セカンダリ変換にROT(ROtational Transform)のような分離型の２次元変換を用いる場合、並び替え部702、セカンダリ変換部703、並び替え部704の処理は下記で表される。

　　並び替え部702：　　　　SXm,n = PXm,n(0<=m,n<M)　　（式１）
　　セカンダリ変換部703：　SY = [ROTf][SX]T[ROTf]　　（式２）
　　並び替え部704：　　　　PYw,h = SYw,h (0<=w,h<M)　（式３）
　　　　　　　　　　　　　　　　 = PXw,h (上記以外)

　ここで[ROTf]はROT変換基底の配列である。(式２)では、ROTf，SXの２次元配列を行列とみなして、各行列の積を計算する（以後、配列を行列とみなして計算する）。T[X]は行列[X]の転置を表す。(式２)の分離型の２次元変換は、入力行列に対し、変換基底行列の積である１次元変換を２回適用することでも実現できる。この場合、１回目の変換の出力を転置して得られる行列を入力として２回目の変換を行う。

　ROTは分離型変換の中では、斜め方向成分のエネルギー集中が高い変換であるが、ROTの代わりに分離型変換よりもエネルギー集中の高い非分離型変換をセカンダリ変換として用いてもよい。この場合、並び替え部702では上述の処理に加え、２次元配列を１次元配列にする処理を実行する。また、並び替え部704では上述の処理に加え、１次元配列を２次元配列にする処理を実行する。

　セカンダリ変換に非分離型変換を用いる場合、並び替え部702、セカンダリ変換部703、並び替え部704の処理は下記で表される。ここでM*M配列SXおよびM*M配列SYは共に１次元の配列である。

　　並び替え部702：　　　　SXj = PXm,n (m=j%M, n=j/M (j=0..M*M-1))　　（式４）
　　セカンダリ変換部703：　SY = [Tf][SX]　　　　　　　　　　　　　　　（式５）
　　並び替え部704：　　　　PYw,h = SYj (w=j%M, h=j/M (j=0..M*M-1))　　（式６）
　　　　　　　　　　　　　　　　 = PXw,h (上記以外)

　ここでTfは非分離型変換（１次元変換）の配列であり、１次元のDCT-2、DCT-5、DCT-8、DST-1、DST-7、HyGT(Hypercube-Givens Transform)等とすることができる。以下にROTおよび非分離型変換のいくつかの例を示す。

　図11(a)は図５の変換・量子化部103の動作を示すフローチャートである。

　プライマリ変換部701は、予測残差に対しCU単位でプライマリ変換を行う(S1101)。並び替え部702は、CUの幅Wと高さHを所定の閾値THと比較する(S1102)。WとHのいずれか一方が閾値THより小さい場合、並び替え部702はセカンダリ変換サイズM=M1とし(S1103)、そうでない場合、M=M2とする(S1104)。ここでM1<M2である。M1、M2は２のべき乗であることが望ましい。並び替え部702は、上述の(式１)あるいは(式４)に示すように、M＊M個のプライマリ変換係数をセカンダリ変換部703への入力SXとしてセットする(S1105)。セカンダリ変換部703は、入力されたM＊M個のプライマリ変換係数に対し、(式２)に示す分離型、あるいは(式５)に示す非分離型変換を適用し、セカンダリ変換を実施する(S1106)。並び替え部704は、上述の(式３)あるいは(式６)に示すように、プライマリ変換係数およびセカンダリ変換係数を量子化部705への入力PYとしてセットする(S1107)。量子化部705は、変換係数PYに対し量子化を施す(S1108)。

　次に逆セカンダリ変換について説明する。図7(b)に示すように、逆量子化部706の出力を格納したW*H配列PY'（配列の各成分をPY'w,hと記す）に対し、PY'の左上に位置するM*M配列SY'（配列の各成分をSY'm,nと記す）が逆セカンダリ変換の対象である。ここでM<=W、M<=Hである。逆セカンダリ変換の出力をM*M配列SX'（配列の各成分をSX'm,nと記す）を、逆プライマリ変換部710に入力するW*H配列PX'（配列の各成分をPX'w,hと記す）の左上に位置するMxM領域に格納する。逆プライマリ変換部710に入力するW*H配列PX'の残りの領域には、逆セカンダリ変換しなかった逆量子化部706の出力PY'を格納する。

　セカンダリ変換にROT(ROtational Transform)のような分離型の２次元変換を用いる場合、並び替え部707、逆セカンダリ変換部708、並び替え部709の処理は下記で表される。

　　並び替え部707：　　　　　SY'm,n = PY'm,n(0<=m,n<M)　　（式７）
　　逆セカンダリ変換部708：　SX' = T[ROTb][SY'][ROTb]　　（式８）
　　並び替え部709：　　　　　PX'w,h = SX'w,h (0<=w,h<M)　（式９）
　　　　　　　　　　　　　　　　　　= PY'w,h (上記以外)

　ここで[ROTb]は逆ROT変換基底の配列であり、T[X]は行列[X]の転置を表す。

　ROTの代わりに非分離型変換をセカンダリ変換として用いた場合、並び替え部707では上述の処理に加え、２次元配列を１次元配列にする処理を実行する。また、並び替え部709では上述の処理に加え、１次元配列を２次元配列にする処理を実行する。

　セカンダリ変換に非分離型変換を用いる場合、並び替え部707、逆セカンダリ変換部708、並び替え部709の処理は下記で表される。ここで配列SX'および配列SY'は共にM*Mサイズの１次元の配列である。

　　並び替え部707：　　　　SY'j = PY'm,n (m=j%M, n=j/M (j=0..M*M-1)) （式１０）
　　セカンダリ変換部708：　SX' = [Tb][SY']　　　　　　　　　　　　　（式１１）
　　並び替え部709：　　　　PX'w,h = SX'j (w=j%M, h=j/M (j=0..M*M-1)) （式１２）
　　　　　　　　　　　　　　　　 = PY'w,h (上記以外)

　ここで[Tb]は非分離型変換の配列であり、上述の１次元のDCT-2、DCT-5、DCT-8、DST-1、DST-7、HyGT(Hypercube-Givens Transform)等の逆変換とすることができる。

　図11(b)は図６の逆量子化・逆変換部311および図５の逆量子化・逆変換部105の動作を示すフローチャートである。

　逆量子化部706は、エントロピー復号部301で復号された予測残差の量子化変換係数に対し、逆量子化を行う(S1109)。並び替え部707は、CUの幅Wと高さHを所定の閾値THと比較する(S1110)。WとHのいずれか一方が閾値THより小さい場合、並び替え部707は逆セカンダリ変換サイズM=M1とし(S1111)、そうでない場合、M=M2とする(S1112)。並び替え部707は設定されたMを用いてM×M領域をセカンダリ変換用の領域として抽出する。ここでM1、M2は図11(a)のフローチャートで用いたものと同じである。並び替え部707は上述の(式７)あるいは(式１０)に示すように、M*M個の変換係数を逆セカンダリ変換部708への入力SY'としてセットする(S1113)。逆セカンダリ変換部708は、入力されたM*M個の変換係数に対し、(式８)に示す分離型、あるいは(式１１)に示す非分離型変換を適用し、逆セカンダリ変換を実施する(S1114)。並び替え部709は、上述の(式９)あるいは(式１２)に示すように、プライマリ変換係数を逆プライマリ変換部710への入力PX'としてセットする(S1115)。逆プライマリ変換部710は、変換係数PX'に対し逆プライマリ変換を施す(S1116)。

　上記において、閾値TH=8とした場合、M1=4、M2=8と設定してもよい。

　セカンダリ変換はイントラ予測において適用され、イントラ予測モードiPredと、インデックスnIdxを参照してCU毎に適用する変換を選択する。図12(a)は67種類のイントラ予測モードに対し、35種類の変換セットTPREDを割り当てた例である。1個の変換セットには3種類のフィルタが割り当てられており、図12(b)に示すインデックスnIdxを用いて適用する変換を指定する(nIdx=1～3)。nIdx=0の場合はセカンダリ変換を適用しない。

　エントロピー符号化部１０４には、変換・量子化部１０３から量子化係数が入力され、予測パラメータ符号化部１１１から予測パラメータが入力される。入力される予測パラメータには、例えば、参照ピクチャインデックスref_Idx_lX、予測ベクトルインデックスmvp_LX_idx、差分ベクトルmvdLX、予測モードpred_mode_flag、及びマージインデックスmerge_idx等の符号がある。

　エントロピー符号化部１０４は、入力された分割情報、予測パラメータ、量子化変換係数等をエントロピー符号化して符号化ストリームTeを生成し、生成した符号化ストリームTeを外部に出力する。

　逆量子化・逆変換部１０５は、画像復号装置における、逆量子化・逆変換部３１１（図５）と同じであり、変換・量子化部１０３から入力された量子化係数を逆量子化して変換係数を求める。逆量子化・逆変換部１０５は、求めた変換係数について逆変換を行い、残差信号を算出する。逆量子化・逆変換部１０５は、算出した残差信号を加算部１０６に出力する。

　加算部１０６は、予測画像生成部１０１から入力されたPUの予測画像Ｐの信号値と逆量子化・逆変換部１０５から入力された残差信号の信号値を画素毎に加算して、復号画像を生成する。加算部１０６は、生成した復号画像を参照ピクチャメモリ１０９に記憶する。

　ループフィルタ１０７は加算部１０６が生成した復号画像に対し、デブロッキングフィルタ、サンプル適応オフセット（SAO）、適応ループフィルタ（ALF）を施す。

　予測パラメータメモリ１０８は、符号化パラメータ決定部１１０が生成した予測パラメータを、符号化対象のピクチャ及びCU毎に予め定めた位置に記憶する。

　参照ピクチャメモリ１０９は、ループフィルタ１０７が生成した復号画像を、符号化対象のピクチャ及びCU毎に予め定めた位置に記憶する。

　符号化パラメータ決定部１１０は、符号化パラメータの複数のセットのうち、１つのセットを選択する。符号化パラメータとは、上述したQTBT分割パラメータや予測パラメータやこれらに関連して生成される符号化の対象となるパラメータである。予測画像生成部１０１は、これらの符号化パラメータのセットの各々を用いてPUの予測画像Ｐを生成する。

　符号化パラメータ決定部１１０は、複数のセットの各々について情報量の大きさと符号化誤差を示すRDコスト値を算出する。RDコスト値は、例えば、符号量と二乗誤差に係数λを乗じた値との和である。符号量は、量子化残差と符号化パラメータをエントロピー符号化して得られる符号化ストリームTeの情報量である。二乗誤差は、減算部１０２において算出された残差信号の残差値の二乗値についての画素間の総和である。係数λは、予め設定されたゼロよりも大きい実数である。符号化パラメータ決定部１１０は、算出したRDコスト値が最小となる符号化パラメータのセットを選択する。これにより、エントロピー符号化部１０４は、選択した符号化パラメータのセットを符号化ストリームTeとして外部に出力し、選択されなかった符号化パラメータのセットを出力しない。符号化パラメータ決定部１１０は決定した符号化パラメータを予測パラメータメモリ１０８に記憶する。

　予測パラメータ符号化部１１１は、符号化パラメータ決定部１１０から入力されたパラメータから、符号化するための形式を導出し、エントロピー符号化部１０４に出力する。符号化するための形式の導出とは、例えば動きベクトルと予測ベクトルから差分ベクトルを導出することである。また予測パラメータ符号化部１１１は、符号化パラメータ決定部１１０から入力されたパラメータから予測画像を生成するために必要なパラメータを導出し、予測画像生成部１０１に出力する。予測画像を生成するために必要なパラメータとは、例えばサブブロック単位の動きベクトルである。

　インター予測パラメータ符号化部１１２は、符号化パラメータ決定部１１０から入力された予測パラメータに基づいて、差分ベクトルのようなインター予測パラメータを導出する。インター予測パラメータ符号化部１１２は、予測画像生成部１０１に出力する予測画像の生成に必要なパラメータを導出する構成として、インター予測パラメータ復号部３０３（図５等、参照）がインター予測パラメータを導出する構成と一部同一の構成を含む。また、イントラ予測パラメータ符号化部１１３は、予測画像生成部１０１に出力する予測画像の生成に必要な予測パラメータを導出する構成として、イントラ予測パラメータ復号部３０４（図５等参照）がイントラ予測パラメータを導出する構成と、一部同一の構成を含む。

　イントラ予測パラメータ符号化部１１３は、符号化パラメータ決定部１１０から入力されたイントラ予測モードIntraPredModeから、符号化するための形式（例えばMPM_idx、rem_intra_luma_pred_mode等）を導出する。

　図13に示すように、セカンダリ変換による符号化ゲイン（符号量削減量）は大きいが、新しい変換を適用するので、処理量や使用するメモリも増加する。上述のように、セカンダリ変換サイズをMxMに制限することで処理量や使用するメモリの増加を抑える試みがあるが、十分ではない。以降ではセカンダリ変換サイズをさらに制限することで、処理量や使用するメモリの増加を抑える技術を説明する。

　従来、セカンダリ変換は、正方形かつ２のべき乗のサイズを用いてきた。M1*M1の次に大きい変換は(M1*2)*(M1*2)=M1*M2*4であり、変換サイズは４倍になる。本発明では、セカンダリ変換のサイズをM*MではなくM*N(M=M1*2、N=M1あるいはM=M1、N=M1*2)のように、横と縦で異なるサイズとすることにより、変換サイズは４倍ではなく２倍に抑える。特に非分離型変換では、入力の個数が４倍になると変換係数の基底は16倍になるので、変換サイズを２倍に抑えることは使用するメモリの削減に大きな効果がある。またM*N変換を２回ではなく、低周波数成分を含む入力に対してのみ行うことで、さらに処理量および使用するメモリ量を削減することができる。プライマリ変換後の非ゼロ変換係数のほとんどは低周波数領域に集まるため、高周波数成分側の入力に対してセカンダリ変換を行わなくても、符号化効率に大きな低下はない。

　図14は、セカンダリ変換の対象とするプライマリ変換係数の領域の例である。図14(a)、(b)はM=8のM*Mブロック変換(8*8ブロック変換)をM=4、N=8(4*8ブロック変換)、あるいはM=8、N=4(8*4ブロック変換)のM*Nブロック変換で置き換えた例である。図14(a)はセカンダリ変換としてM*N(4*8)ブロック変換を適用した時の入力SXの一例である。分離型のセカンダリ変換の場合、並び替え部702は入力SXに(式13)を適用する。また、非分離型のセカンダリ変換の場合、並び替え部702は入力SXに(式14)を適用する。なお図14、(式13)、(式14)は一般的な配列であり、X、Xm,nをSX、SXm,nと置き換えて読む。

　図14(b)はセカンダリ変換としてM*N(8*4)変換を適用した時の入力SXの一例である。並び替え部702は、分離型のセカンダリ変換の場合、入力SXに(式15)をセットし、非分離型のセカンダリ変換の場合、入力SXに(式16)をセットする。なお図14、(式15)、(式16)は一般的な配列であり、X、Xm,nをSX、SXm,nと置き換えて読む。

　分離型のセカンダリ変換およびセカンダリ逆変換は以下で表される。

　　セカンダリ変換部703：　 SY = [ROTf_N][SX]T[ROTf_M]　　　（式１７）
　　逆セカンダリ変換部708：　SX' = T[ROTb_N][SY'][ROTb_M]　　（式１８）
ここで“N”、および“M”は変換の垂直および水平サイズである。つまり、[ROTf_N]はN*N配列であり、[ROTf_M]はM*M配列である。

　図14(c)はセカンダリ変換として１次元のM*N(=32)変換を適用した時の入力SXの一例である。並び替え部702は非分離型のセカンダリ変換の場合、入力SXに(式19)をセットする。なお図14、(式19)は一般的な配列であり、X、Xm,nをSX、SXm,nと置き換えて読む。

　非分離型のセカンダリ変換および逆セカンダリ変換は(式5)、(式11)で表される。

　以下では、変換・量子化部103の並び替え部702で抽出するセカンダリ変換の入力領域の形状（セカンダリ変換の入力SX）について説明するが、逆量子化・逆変換部311(105)の並び替え部709においても、上記形状を逆セカンダリ変換の出力領域の形状として用いる。すなわち、スキャン方向、イントラ予測方向、ブロック形状に応じて、逆セカンダリ変換の出力を設定する領域を選択することができる。

　　（スキャン方向依存セカンダリ変換）
　M*Mセカンダリ変換(図14はM=8の例)に対し、図14(a)～(c)のいずれの入力SXを使用するかは、図15に示す変換係数の３種類のスキャン方向を用いて決定する。図14は一般的な配列であり、X、Xm,nをSX、SXm,nと置き換えて読む。変換係数のスキャン方向が垂直方向であれば縦長のセカンダリ変換領域、例えば、図14(a)の入力SXを用い、スキャン方向が水平方向であれば横長のセカンダリ変換領域、例えば図14(b)の入力SXを用い、それ以外（スキャン方向が斜め方向）であれば、縦長あるいは横長のセカンダリ変換領域を入力SXに用いればよい。

　また、別の構成として、変換係数のスキャン方向が垂直方向であれば縦長のセカンダリ変換領域、例えば、図14(a)の入力SXを用い、スキャン方向が水平方向であれば横長のセカンダリ変換領域、例えば図14(b)の入力SXを用いる。それ以外（スキャン方向が斜め方向）であれば、M*Mブロックの左上からの距離が一定以下の左上中心の領域をセカンダリ変換領域、例えば、図14(c)の入力SXを用いてセカンダリ変換を実行する。なお、入力が図14(c)で、要素数を２のべき乗とする場合には、完全には左上からの距離が等距離の領域（三角形）とならず、多少いびつな形になるが特に問題ではない。

　さらに、別の構成として、分離型のセカンダリ変換の場合、変換係数のスキャン方向が垂直方向であれば縦長のセカンダリ変換領域、例えば、図14(a)の入力SXを用い、スキャン方向が水平方向であれば横長のセカンダリ変換領域、例えば図14(b)の入力SXを用いる。スキャン方向が斜め方向であれば、図17に示すイントラ予測モードを参照し、イントラ予測モードが0～predDiag-1の場合は縦長のセカンダリ変換領域、例えば、図14(a)の入力SXを用い、イントラ予測モードがpredDiag～predURの場合は横長のセカンダリ変換領域、例えば図14(b)の入力SXを用いてセカンダリ変換を実行する。

　なお、後述のフローチャートで示すように、CUあるいはTUの幅Wと高さHのいづれか一方が閾値TH未満の場合には、例えば4*4の正方形の領域をセカンダリ変換領域の入力とし、それ以外（CUまたはTUの幅Wと高さHの双方が閾値TH以上の）場合には、上記の非正方形領域をセカンダリ変換領域の入力としてもよい。

　　（イントラ方向依存セカンダリ変換）
　また、別の一例として、M*Mセカンダリ変換(図14はM=8の例)に対し、図14(a)～(c)のいずれの入力SXを使用するかを、変換係数のスキャン方向ではなく、イントラ予測モードを用いて決定してもよい。非分離型のセカンダリ変換の場合、イントラ予測モードが水平方向付近、例えば、図17に示すpredHor-diff～predHor+diffであれば、縦長のセカンダリ変換領域、例えば、図14(a)の4x8ブロックの入力SXを用い、イントラ予測モードが垂直方向付近、例えば、predVer-diff～predVer+diffであれば、横長のセカンダリ変換領域、例えば、図14(b)の8x4ブロックの入力SXを用いる。それ以外の場合には、縦長あるいは横長のセカンダリ変換領域を用いればよい。

　また、別の構成として、イントラ予測モードが水平方向付近であれば、例えば、図14(a)の縦長のセカンダリ変換領域を、イントラ予測モードが垂直方向付近であれば、例えば、図14(b)の横長のセカンダリ変換領域を、それ以外の場合にも、M*Mブロックの左上中心のセカンダリ変換領域、例えば、図14(c)の入力SXを用いてセカンダリ変換を実行してもよい。

　さらに、別の構成として、イントラ予測モードが図17に示すpredDiag未満であれば、縦長のセカンダリ変換領域である図14(a)の入力SXを用い、イントラ予測モードがpredDiag以上であれば、横長のセカンダリ変換領域である図14(b)の入力SXを用いてセカンダリ変換を実行しても良い。また方向予測以外のイントラ予測モードの場合には、縦長あるいは横長のセカンダリ変換領域を入力SXに用いても良い。ここでpredHor、predVer、predDiag、predURは各々、水平方向予測、垂直方向予測、左上方向予測、左下方向から右上方向のイントラ予測モード番号であり、イントラ予測モード数が67であれば、predHor=18、pred=50、predDiag=34、predBL=2、predUR=66などを用いる。diffは正の整数である。

　なお、CUあるいはTUの幅Wと高さHのいづれか一方が閾値TH未満の場合には、例えば4*4の正方形の領域をセカンダリ変換領域の入力とし、それ以外（CUまたはTUの幅Wと高さHの双方が閾値TH以上の）場合には、上記の非正方形領域をセカンダリ変換領域の入力としてもよい。

　　（ブロック形状依存セカンダリ変換）
　また、別の一例として、セカンダリ変換の入力とする領域の形状は、ブロック形状を用いて決定してもよい。ブロック形状が縦長(W<H)であれば、例えば、図14(a)に示す縦長のセカンダリ変換領域を入力SXに用い、ブロック形状が横長(W>H)であれば、例えば、図14(b)に示す横長のセカンダリ変換領域を入力SXに用いても良い。それ以外であれば、縦長あるいは横長のセカンダリ変換領域を用いても良い。

　また、別の構成として、ブロック形状が縦長(W<H)であれば、例えば、図14(a)に示す縦長のセカンダリ変換領域を入力SXに用い、ブロック形状が横長(W>H)であれば、例えば、図14(b)に示す横長のセカンダリ変換領域を入力SXに用いても良い。それ以外であれば、図14(c)に示すM*Mブロックの左上中心のセカンダリ変換領域を入力SXに用いても良い。

　図16(a)は、M*N点非分離型セカンダリ変換(M!=N、MとNは等しくない)を適用する場合の図５の変換・量子化部103の動作を示すフローチャートである。

　S1101、S1102、S1108は、図11のS1101、S1102、S1108と同じであり説明を省略する。S1603、S1605はM=N=M1のセカンダリ変換を適用する場合であり、図11のS1103、S1105と同じであり説明を省略する。CUの幅Wと高さHのいずれもが閾値TH以上の場合、並び替え部702は変換係数のスキャン方向を参照する(S1604)。スキャン方向が垂直方向の場合、S16041に進み、セカンダリ変換のサイズを縦長のM=M2/2、N=M2とし、(式14)で示すように図14(a)のM*N個の変換係数をセカンダリ変換部703への入力SXとする。スキャン方向が水平方向の場合、S16042に進み、セカンダリ変換サイズを横長のM=M2、N=M2/2とし、(式16)で示すように図14(b)のM*N個の変換係数をセカンダリ変換部703への入力SXとする。スキャン方向がそれ以外（例えば斜め方向）の場合、S16043に進み、(式17)で示すようにM*Mブロックの左上中心の領域である図14(c)のM2*M2/2個の変換係数をセカンダリ変換部703への入力SXとする。ここでM1<M2である。M1、M2は２のべき乗であることが望ましい。セカンダリ変換部703は、入力されたプライマリ変換係数に対し、(式5)に示す非分離型変換を適用し、セカンダリ変換を実施する(S1606)。並び替え部704は、上述の(式6)に示すように、プライマリ変換係数およびセカンダリ変換係数を量子化部705への入力PYとしてセットする(S1607)。なお、(式14)、(式16)、(式17)ではM1=4、M2=8とした。なお図14、(式14)、(式16)、(式17)は一般的な配列であり、X、Xm,nをSX、SXm,nあるいはPY、PYm,nと置き換えて読む。

　図16(b)は、M*N点非分離型セカンダリ変換(M!=N)を適用する場合の図６の逆量子化・逆変換部311および図５の逆量子化・逆変換部105の動作を示すフローチャートである。

　S1109、S1110、S1116は、図11のS1109、S1110、S1116と同じであり説明を省略する。S1611、S1613はM=N=M1の逆セカンダリ変換を適用する場合であり、図11のS1111、S1113と同じであり説明を省略する。CUの幅Wと高さHの双方が閾値TH以上の場合、並び替え部707は変換係数のスキャン方向を参照する(S1612)。スキャン方向が垂直方向の場合、S16121に進み、逆セカンダリ変換のサイズをM=M2/2、N=M2とし、(式14)で示すように図14(a)のM*N個の変換係数を逆セカンダリ変換部708への入力SY'とする。(式14)および以下で参照する(式16)、(式17)は、一般的な配列であるのでXをSY'と置き替えて読む。つまり、X1、X2、Xm,nはSY'1、SY'2、SY'm,nと置き換える。スキャン方向が水平方向の場合、S16122に進み、逆セカンダリ変換のサイズをM=M2、N=M2/2とし、(式16)で示すように図14(b)のM*N個の変換係数を逆セカンダリ変換部708への入力SY'とする。スキャン方向が斜め方向の場合、S16123に進み、(式17)で示すように図14(c)のM2*M2/2個の変換係数を逆セカンダリ変換部708への入力SY'とする。逆セカンダリ変換部708は、入力された変換係数に対し、(式11)に示す非分離型変換を適用し、逆セカンダリ変換を実施する(S1614)。並び替え部709は、上述の(式12)に示すように、プライマリ変換係数を逆プライマリ変換部710への入力PX'としてセットする(S1615)。逆プライマリ変換部710は、変換係数に対し逆プライマリ変換を施す(S1616)。

　なお、図16ではスキャン方向を参照してセカンダリ変換部703、あるいは逆セカンダリ変換部708に入力する変換係数をセットしたが、上述のようにスキャン方向ではなく、イントラ予測モードを参照してして変換係数をセットしてもよい。

　また、図16では低周波数成分側に存在する変換係数SX1あるいはSY'1に対して、セカンダリ変換あるいは逆セカンダリ変換を実施する動作を示したが、図16(a)ではS1102～S1607を２回処理し、図16(b)ではS1110～S1615を２回処理し、２回目に高周波数成分側に存在する変換係数SX2あるいはSY'2をセカンダリ変換あるいは逆セカンダリ変換の入力としてセットすることで、M*M全体にセカンダリ変換あるいは逆セカンダリ変換を実施することもできる。

　以上、説明したように、セカンダリ変換を行う変換係数の領域に非正方形M*N(M!=N)を用いることにより、符号化効率の低下を抑えつつ、処理量や使用するメモリを削減することができる。さらに、M>Nとして横長の変換M*Nと縦長の変換N*Mを組み合わせることにより、M*M変換よりも小さな変換サイズでも符号化効率の低減を最低限としている。

　　（実施形態２）
　実施形態１ではセカンダリ変換の要素数をM2*M2からM2*M2/2とすることで、符号化効率の低下を抑えつつ、処理量や使用するメモリを削減する技術を説明した。実施形態２では、CUサイズが大きい場合もM2*M2セカンダリ変換を使用せず、M1*M1のような小サイズのセカンダリ変換を適用することで、符号化効率の低下を抑えつつ、処理量や使用するメモリを削減する技術を説明する。ここでM1、M2の定義は実施形態１と同じである。

　図18はセカンダリ変換を行うM2*M2サイズのブロックを小サイズの領域（M1*M1の矩形ブロック、あるいはM1*M1個の１次元データ、以降ではどちらもブロックと呼ぶ）に分割し、小ブロック毎にセカンダリ変換を実施する場合に、M2=8、M1=4と設定した例である。以下ではM2=8、M1=4の例を説明するが、M2、M1が２のべき乗であり、M2>M1の関係を満たせば、M2=8、M1=4に限らず、他の値をとることも可能である。図18(a)、(b)は分割した小サイズの全ブロックに対しセカンダリ変換を行う場合、図18(c)、(d)は分割した小ブロックのうち３つに対しセカンダリ変換を行う場合、図18(e)、(f)、(g)は分割した小ブロックのうち２つに対しセカンダリ変換を行う場合、図18(h)、(i)は分割した小ブロックのうち１つに対しセカンダリ変換を行う場合を示す。ここで小ブロックを図18(a)のように２次元配列として定義した場合と、図18(b)のように１次元配列として定義した場合の、分離型のセカンダリ変換部703への入力SX1、SX2、SX3、SX4を以下に示す。

　また、非分離型のセカンダリ変換部703への入力SX1、SX2、SX3、SX4を以下に示す。

　なお、(式20)～(式22)は一般的な配列であり、X、Xm,nをSX、SXm,nと置き換えて読む。

　M2*M2ブロックを分割した小ブロックのうちの何個の小ブロックをセカンダリ変換するかは、許容可能な処理量やメモリサイズに合わせて決定することができる。処理量やメモリサイズに十分余裕があれば、全ての小ブロックに対しセカンダリ変換を実施し、処理量やメモリサイズにほとんど余裕がなければ、１個の小ブロックに対してのみセカンダリ変換を実施する。このように、処理量やメモリサイズの余裕に応じてセカンダリ変換する小ブロックの個数を決定することができる。セカンダリ変換する小ブロックの個数は、符号化して画像復号装置に通知してもよい。あるいは符号化データに含まれるレベル情報を参照して個数を決定した場合は、新たに個数を示すシンタックスを追加する必要はない。

　また、変換係数のスキャン方向やイントラ予測モードを参照して、矩形の小ブロックに分割するか、非矩形の小ブロックに分割するか、あるいはどの小ブロックをセカンダリ変換するかを決定する。例えば、スキャン方向が垂直あるいは水平方向である場合、矩形の小ブロックに分割し、スキャン方向が斜め方向である場合、非矩形の小ブロックに分割する。または、イントラ予測モードが図17に示すpredHor-diff～predHor+diff、あるいはpredVer-diff～predVer+diffであれば、矩形の小ブロックに分割し、そうでなければ場合、非矩形の小ブロックに分割する。または、２つの小ブロックに対しセカンダリ変換を実施する場合は、スキャン方向が垂直方向であれば、図18(g)のように入力としてSX1とSX3を選択し、水平方向であれば、図18(f)のように入力としてSX1とSX2を選択し、斜め方向であれば、図18(e)のように入力としてSX1とSX2を選択する。または、イントラ予測モードが図17に示すpredHor-diff～predHor+diffであれば、図18(g)のように入力としてSX1とSX3を選択し、predVer-diff～predVer+diffであれば、図18(f)のように入力としてSX1とSX2を選択し、それ以外であれば、図18(e)のように入力としてSX1とSX2を選択する。

　セカンダリ変換するM*Mブロックを小サイズのブロックに分割し、ブロック毎にセカンダリ変換あるいは逆セカンダリ変換する場合の変換・量子化部103、逆量子化・逆変換部311(105)の動作は、図16のフローチャートの動作とほぼ同じであるが、並び替え部の動作が若干異なる。そのため、図16(b)に示す枠線で囲んだ部分(1612)について、図19を用いて説明する。図16(a)に対しても、並び替え部の処理内容の差分は図16(b)と同じであり、説明は省略する。

　セカンダリ変換した小ブロックの個数Lが1、3、4個の場合の並び替え部と逆セカンダリ変換部の動作を、図19(a)のフローチャートを用いて説明する。逆量子化・逆変換部311(105)は変数s=1をセットする(S1901)。sは逆セカンダリ変換部708に入力する変換係数の配列SXの番号である。並び替え部707は、変換係数のスキャン方向が斜め方向か否かをチェックし(S1902)、斜め方向であればS1903に進み、そうでなければS1904に進む。並び替え部707は、変換係数のスキャン方向が斜め方向であれば、逆セカンダリ変換するM*Mブロックを非矩形の小ブロックに分割し、(式22)のSY'sをセットする(S1903)。ここでs=1～Lである。なお(式20)～(式22)のX、Xm,nは先に述べたようにSY'、SY'm,nと置き換えて読む。並び替え部707は、変換係数のスキャン方向が斜め方向でなければ、セカンダリ変換するM*Mブロックを矩形の小ブロックに分割し、(式21)のSY'をセットする(S1904)。逆セカンダリ変換部708は、並び替え部707でセットされた配列SY'を逆セカンダリ変換する(S1905)。並び替え部709は、逆セカンダリ変換の出力SX'を逆プライマリ変換に入力する配列PX'に書き込む(S1906)。逆量子化・逆変換部311(105)は変数sをインクリメントする(S1907)。逆量子化・逆変換部311(105)は変数sと小ブロックの個数Lを比較し、S=LでなければS1902に戻り、次の小ブロックに対し処理を継続し、S>=Lであれば対象となる全ての小ブロックの処理が終了したので、処理を終了する。

　セカンダリ変換した小ブロックの個数Lが2個の場合の並び替え部、逆セカンダリ変換部の動作を、図19(b)のフローチャートを用いて説明する。S1901～S1902、S1905～S1906、S1908の処理は図19(a)と同じであり、説明を省略する。並び替え部707は、変換係数のスキャン方向が斜め方向であれば、セカンダリ変換の対象領域を図18(e)の非矩形の小ブロックに分割し、対応する変換係数を(式22)から選択しSY'をセットする(S1903)。なお(式22)と後で述べる(式21)のX、Xm,nは先に述べたようにSY'、SY'm,nと置き換えて読む。並び替え部707は、変換係数のスキャン方向が垂直方向か否かをチェックし(S19041)、垂直方向であればS19042に進み、そうでなければS19043に進む。垂直方向スキャンの場合、並び替え部707は、セカンダリ変換の対象領域を図18(g)の小ブロックに分割し、対応する変換係数を(式21)から選択しSY'sをセットする(S19042)。水平方向スキャンの場合、並び替え部707は、セカンダリ変換の対象領域図18(f)の小ブロックに分割し、対応する変換係数を(式21)から選択しSY'sをセットする(S19043)。逆量子化・逆変換部311(105)は、垂直方向スキャンの場合、変数sを２インクリメントし、それ以外の場合、変数sを１インクリメントする(S19071)。

　実施形態２では、CUサイズが大きい場合もM2*M2セカンダリ変換を使用せず、M1*M1のような小サイズのセカンダリ変換を複数個適用することで、符号化効率の低下を抑えつつ、処理量や使用するメモリを削減することができる。

　　（変形例１）
　実施形態１および実施形態２では、セカンダリ変換／逆セカンダリ変換、あるいはセカンダリ変換／逆セカンダリ変換への入力SX／SY'の形状（種類）を変換係数のスキャン方向やイントラ予測モードから導出した。変形例１では、セカンダリ変換の選択に使用するインデックスnIdxを用いて、明示的に変換の種類を通知する技術を説明する。

　図12に示すように、セカンダリ変換ではイントラ予測モード毎に３種類の変換からなる変換セットが準備されており、３種類の変換の中からnIdxで指定された変換を選択する。図20に示すように、この３種類の変換に、斜め方向、垂直方向、水平方向に適したM*N変換（M!=N）を割り当てる。

　図20(a)は、分離型のセカンダリ変換と非分離型のセカンダリ変換で構成されたセットの例である。nIdx=0はセカンダリ変換オフ、nIdx=1は非分離型のセカンダリ変換で、図14(c)や図18(b)の入力に適した変換である。nIdx=2はM*N分離型のセカンダリ変換でM>N、つまり横長の形状で、図14(b)や図18(f)の入力に適した変換である。nIdx=3はM*N分離型のセカンダリ変換でM<N、つまり縦長の形状で、図14(a)や図18(g)の入力に適した変換である。

　図20(b)は、非分離型のセカンダリ変換で構成されたセットの例である。nIdx=0はセカンダリ変換オフ、nIdx=1は図14(c)や図18(b)の入力に適した変換である。nIdx=2は図14(b)や図18(f)のような横長の入力に適した変換である。nIdx=3は図14(a)や図18(g)のような縦長の入力に適した変換である。

　画像符号化装置では、符号化パラメータ決定部110が、これらの中から対象CUに最適なセカンダリ変換を導出し、nIdxを符号化することで、最も符号化効率のよいセカンダリ変換を用いて映像を符号化、復号することができる。

　以上のように、変形例１ではプライマリ変換係数に適用するセカンダリ変換の種類をインデックスnIdxで符号化し、画像復号装置に通知することで、最も符号化効率のよいセカンダリ変換を用いて映像を符号化、復号することができる。

　　（実施形態３）
　セカンダリ変換導入の動機は、プライマリ変換でエネルギーを効率的に集中させることができなかった成分に対して、セカンダリ変換を施すことでエネルギーを集中させることである。実施形態３では、分離型変換で実現されたプライマリ変換は斜め方向成分に対しては最適ではないことから、斜め方向成分が重要な場合、つまりイントラ予測モードが斜め方向の場合にのみセカンダリ変換を実施する技術を説明する。斜め方向以外のイントラ予測の場合は、もともと斜め方向成分にエネルギーが集中することがないため、セカンダリ変換の効果は小さく、セカンダリ変換を実施しなくても符号化効率の低下は小さい。セカンダリ変換を実施しないので、符号化効率の低下を抑えつつ、処理量を削減することができる。

　図17はイントラ予測モードiPredを表す図である。図17に示す67種類のイントラ予測モードのうち、予測方向が斜め方向の予測モード、つまり、
　　predBL<=iPred<predHor-diff || predHor+diff<iPred<predVer-diff || predVer+diff<iPred<=predUR　　（式２３）
の場合にのみ、セカンダリ変換を実施する。ここでdiffは正の整数である。

　図21(a)は変換・量子化部103の動作を示すフローチャートである。図21(a)において、S1101とS1108は図11(a)のS1101とS1108と同じであるため、説明を省略する。変換・量子化部103は対象CUのイントラ予測モードが(式23)を満たすかどうかをチェックする(S2102)。対象CUのイントラ予測モードが(式23)を満たす場合、セカンダリ変換を実施するためにS2103に進み、そうでなければセカンダリ変換を行わずS1108に進む。S2103では図11(a)のS1102～S1107、あるいは図16(a)のS1102～S1607のセカンダリ変換処理を実施する。

　図21(b)は逆量子化・逆変換部311(105)の動作を示すフローチャートである。図21(b)において、S1109とS1116は図11(b)のS1109とS1116と同じであるため、説明を省略する。逆量子化・逆変換部311(105)は対象CUのイントラ予測モードが(式23)を満たすかどうかをチェックする(S2102)。対象CUのイントラ予測モードが(式23)を満たす場合、逆セカンダリ変換を実施するためにS2104に進み、そうでなければ逆セカンダリ変換を行わずS1116に進む。S2104では図11(b)のS1110～S1115、あるいは図16(b)のS1110～S1615の逆セカンダリ変換処理を実施する。

　以上で説明したように、セカンダリ変換はプライマリ変換後の係数に対し適用する変換である。一般的にプライマリ変換は分離型変換で実現されており、斜め方向成分に対しては最適ではなく、エネルギーを効率的に集中することができない。このような場合に、プライマリ変換係数に再度斜め方向の成分に対して効果のあるセカンダリ変換を施すことによって、特定の成分に、よりエネルギーを集中することができる。

　　（変形例２）
　実施形態３では、イントラ予測モードが斜め方向の場合、セカンダリ変換を実施し、そうでない場合はセカンダリ変換を実施しないという、イントラ予測モードに応じてセカンダリ変換という選択肢を変更する技術の一例を説明した。変形例２ではセカンダリ変換の選択肢を増やして符号化効率の低下を抑制する技術を説明する。

　セカンダリ変換では、図20に示すような、インデックスnIdxを用いて明示的にセカンダリ変換の形状（種類）を選択する技術を変形例１で述べたが、変形例２ではイントラ予測モードに応じてnIdxの値を制限する。

　変形例２では、イントラ予測モードiPredが水平方向の場合（predHor-diff<=iPred<=predHor＋diff）、水平方向に適した変換(nIdx=3)、斜め方向に適した変換(nIdx=1)、変換オフ(nIdx=0)の３つから選択する。イントラ予測モードiPredが垂直方向の場合（predVer-diff<=iPred<=predVer＋diff）、垂直方向に適した変換(nIdx=2)、斜め方向に適した変換(nIdx=1)、変換オフ(nIdx=0)の３つから選択する。それ以外の場合（プレナ予測、DC予測、斜め方向予測）、斜め方向に適した変換(nIdx=1)、変換オフ(nIdx=0)の２つから選択する。ここでdiffは正の整数である。図22にイントラ予測モードと取りうるnIdxの関係を示す。

　このように、イントラ予測モードに応じて取りうるnIdxの個数を削減することで、処理量を削減しつつ符号化効率の低下を抑制することができる。

　　（実施形態４）
　実施形態１～３はセカンダリ変換の処理量、あるいは使用するメモリを削減する技術について述べた。実施形態４では、ある条件下でプライマリ変換を適用するか否かを切り替えることで処理量を削減する技術について述べる。

　プライマリ変換は分離型変換を用いることが多いため、斜め方向の成分に対してはエネルギー集中が良くなく、非分離型変換を用いるセカンダリ変換では、斜め方向の成分に対してもエネルギー集中が良い。一方、変換サイズが大きくなると、入力を水平・垂直方向成分に分離して演算する分離型フィルタを用いるプライマリ変換は、処理量、メモリ使用量は増加するものの、それほど大きな増加ではない。しかしながら、非分離型変換を用いるセカンダリ変換ではサイズが２倍になるとメモリ使用量は４倍になり、これに伴って演算量も増加する。そこで変換サイズが小さく、主要な成分が斜め方向である場合には、セカンダリ変換のみ実施し、プライマリ変換を実施しないことで、処理量を削減することができる。

　例えば、変換サイズが小さく、主要な成分が斜め方向であるという条件を下式とすると、
　　(predBL<=iPred<predHor-diff || predHor+diff<iPred<predVer-diff || predVer+diff<iPred<=predUR) && (W<=M1 && H<=M1)　　（式２４）
これが成り立つ場合はプライマリ変換を行わない。ここでiPredはイントラ予測モード、W、HはCUの幅および高さ、M1はCUサイズが小さいか否かを判定する閾値、diffは正の整数である。例えばM1=4である。

　図23(a)は実施形態４の変換・量子化部103の動作を示すフローチャートである。図23(a)において、S1101とS1108は図11(a)のS1101とS1108と同じであるため、説明を省略する。変換・量子化部103は対象CUのサイズおよびイントラ予測モードが(式24)を満たすかどうかをチェックする(S2301)。対象CUのサイズおよびイントラ予測モードが(式24)を満たさない場合、プライマリ変換を実施するためにS1101に進み、その後、S2103に進む。そうでなければプライマリ変換を行わずS2103に進む。S2103では図11(a)のS1102～S1107、あるいは図16(a)のS1102～S1607のセカンダリ変換処理を実施する。

　図23(b)は実施形態４の逆量子化・逆変換部311(105)の動作を示すフローチャートである。図23(b)において、S1109とS1116は図11(b)のS1109とS1116と同じであるため、説明を省略する。S2104では、図11(b)のS1110～S1115、あるいは図16(b)のS1110～S1615の逆セカンダリ変換処理を実施する。逆量子化・逆変換部311(105)は対象CUのサイズおよびイントラ予測モードが(式24)を満たすかどうかをチェックする(S2301)。対象CUのサイズおよびイントラ予測モードが(式24)を満たさない場合、逆プライマリ変換を実施するためにS1116に進み、そうでなければ逆プライマリ変換を行わずに終了する。

　なお、図23ではセカンダリ変換、セカンダリ逆変換は非分離型変換を用いる。

　以上のように、実施形態４では、ある条件下でプライマリ変換を適用するか否かを切り替えることで符号化効率低下を抑制しつつ、処理量を削減することができる。

　本発明の一態様に係る画像符号化装置の、前記第２の変換手段はさらに、第１の領域に対する変換を、小サイズの正方形変換を組み合わせて実行することを特徴とする。

　本発明の一態様に係る画像符号化装置の、前記第２の変換手段はさらに、イントラ予測モードあるいは変換係数のスキャン方向によって、第１の領域に対する変換、あるいは第２の領域に対する変換を選択することを特徴とする。

　本発明の一態様に係る画像符号化装置は、イントラ予測モードとCUのサイズによって前記第１の変換を実行するか否かを決定することを特徴とする。

　本発明の一態様に係る画像復号装置の、前記第２の逆変換手段はさらに、第１の領域に対する逆変換を、小サイズの正方形逆変換を組み合わせて実行することを特徴とする。

　本発明の一態様に係る画像復号装置の、前記第２の逆変換手段はさらに、イントラ予測モードあるいは変換係数のスキャン方向によって、第１の領域に対する逆変換、あるいは第２の領域に対する逆変換を選択することを特徴とする。

　本発明の一態様に係る画像復号装置は、イントラ予測モードとCUのサイズによって、前記第１の逆変換を実行するか否かを決定することを特徴とする。

　　（ソフトウェアによる実現例）
　なお、上述した実施形態における画像符号化装置１１、画像復号装置３１の一部、例えば、エントロピー復号部３０１、予測パラメータ復号部３０２、ループフィルタ３０５、予測画像生成部３０８、逆量子化・逆変換部３１１、加算部３１２、予測画像生成部１０１、減算部１０２、変換・量子化部１０３、エントロピー符号化部１０４、逆量子化・逆変換部１０５、ループフィルタ１０７、符号化パラメータ決定部１１０、予測パラメータ符号化部１１１をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、画像符号化装置１１、画像復号装置３１のいずれかに内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。

　また、上述した実施形態における画像符号化装置１１、画像復号装置３１の一部、または全部を、LSI（Large Scale Integration）等の集積回路として実現しても良い。画像符号化装置１１、画像復号装置３１の各機能ブロックは個別にプロセッサ化しても良いし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はＬＳＩに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりＬＳＩに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。

　　（応用例）
　上述した画像符号化装置１１及び画像復号装置３１は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像（CG及びGUIを含む）であってもよい。

　まず、上述した画像符号化装置１１及び画像復号装置３１を、動画像の送信及び受信に利用できることを、図８を参照して説明する。

　図８の（ａ）は、画像符号化装置１１を搭載した送信装置PROD_Aの構成を示したブロック図である。図８の（ａ）に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3と、を備えている。上述した画像符号化装置１１は、この符号化部PROD_A1として利用される。

　送信装置PROD_Aは、符号化部PROD_A1に入力する動画像の供給源として、動画像を撮像するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成または加工する画像処理部Ａ７を更に備えていてもよい。図８の（ａ）においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。

　なお、記録媒体PROD_A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部（不図示）を介在させるとよい。

　図８の（ｂ）は、画像復号装置３１を搭載した受信装置PROD_Bの構成を示したブロック図である。図８の（ｂ）に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3と、を備えている。上述した画像復号装置３１は、この復号部PROD_B3として利用される。

　受信装置PROD_Bは、復号部PROD_B3が出力する動画像の供給先として、動画像を表示するディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。図８の（ｂ）においては、これら全てを受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。

　なお、記録媒体PROD_B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部（不図示）を介在させるとよい。

　なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送（ここでは、送信先が予め特定されていない送信態様を指す）であってもよいし、通信（ここでは、送信先が予め特定されている送信態様を指す）であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。

　例えば、地上デジタル放送の放送局（放送設備など）／受信局（テレビジョン受像機など）は、変調信号を無線放送で送受信する送信装置PROD_A／受信装置PROD_Bの一例である。また、ケーブルテレビ放送の放送局（放送設備など）／受信局（テレビジョン受像機など）は、変調信号を有線放送で送受信する送信装置PROD_A／受信装置PROD_Bの一例である。

　また、インターネットを用いたVOD（Video On Demand）サービスや動画共有サービスなどのサーバ（ワークステーションなど）／クライアント（テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど）は、変調信号を通信で送受信する送信装置PROD_A／受信装置PROD_Bの一例である（通常、ＬＡＮにおいては伝送媒体として無線または有線の何れかが用いられ、ＷＡＮにおいては伝送媒体として有線が用いられる）。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。

　なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置PROD_A及び受信装置PROD_Bの双方として機能する。

　次に、上述した画像符号化装置１１及び画像復号装置３１を、動画像の記録及び再生に利用できることを、図９を参照して説明する。

　図９の（ａ）は、上述した画像符号化装置１１を搭載した記録装置PROD_Cの構成を示したブロック図である。図９の（ａ）に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した画像符号化装置１１は、この符号化部PROD_C1として利用される。

　なお、記録媒体PROD_Mは、（１）HDD（Hard Disk Drive）やSSD(Solid State Drive)などのように、記録装置PROD_Cに内蔵されるタイプのものであってもよいし、（２）SDメモリカードやUSB（Universal Serial Bus）フラッシュメモリなどのように、記録装置PROD_Cに接続されるタイプのものであってもよいし、（３）DVD（Digital Versatile Disc）やBD（Blu-ray Disc:登録商標）などのように、記録装置PROD_Cに内蔵されたドライブ装置（不図示）に装填されるものであってもよい。

　また、記録装置PROD_Cは、符号化部PROD_C1に入力する動画像の供給源として、動画像を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成または加工する画像処理部PROD_C6を更に備えていてもよい。図９の（ａ）においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。

　なお、受信部PROD_C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部（不図示）を介在させるとよい。

　このような記録装置PROD_Cとしては、例えば、DVDレコーダ、BDレコーダ、HDD（Hard Disk Drive）レコーダなどが挙げられる（この場合、入力端子PROD_C4または受信部PROD_C5が動画像の主な供給源となる）。また、カムコーダ（この場合、カメラPROD_C3が動画像の主な供給源となる）、パーソナルコンピュータ（この場合、受信部PROD_C5または画像処理部Ｃ６が動画像の主な供給源となる）、スマートフォン（この場合、カメラPROD_C3または受信部PROD_C5が動画像の主な供給源となる）なども、このような記録装置PROD_Cの一例である。

　図９の（ｂ）は、上述した画像復号装置３１を搭載した再生装置PROD_Dの構成を示したブロックである。図９の（ｂ）に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した画像復号装置３１は、この復号部PROD_D2として利用される。

　なお、記録媒体PROD_Mは、（１）HDDやSSDなどのように、再生装置PROD_Dに内蔵されるタイプのものであってもよいし、（２）SDメモリカードやUSBフラッシュメモリなどのように、再生装置PROD_Dに接続されるタイプのものであってもよいし、（３）DVDやBDなどのように、再生装置PROD_Dに内蔵されたドライブ装置（不図示）に装填されるものであってもよい。

　また、再生装置PROD_Dは、復号部PROD_D2が出力する動画像の供給先として、動画像を表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。図９の（ｂ）においては、これら全てを再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。

　なお、送信部PROD_D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部（不図示）を介在させるとよい。

　このような再生装置PROD_Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる（この場合、テレビジョン受像機等が接続される出力端子PROD_D4が動画像の主な供給先となる）。また、テレビジョン受像機（この場合、ディスプレイPROD_D3が動画像の主な供給先となる）、デジタルサイネージ（電子看板や電子掲示板等とも称され、ディスプレイPROD_D3または送信部PROD_D5が動画像の主な供給先となる）、デスクトップ型PC（この場合、出力端子PROD_D4または送信部PROD_D5が動画像の主な供給先となる）、ラップトップ型またはタブレット型PC（この場合、ディスプレイPROD_D3または送信部PROD_D5が動画像の主な供給先となる）、スマートフォン（この場合、ディスプレイPROD_D3または送信部PROD_D5が動画像の主な供給先となる）なども、このような再生装置PROD_Dの一例である。

　　（ハードウェア的実現及びソフトウェア的実現）
　また、上述した画像復号装置３１及び画像符号化装置１１の各ブロックは、集積回路（ICチップ）上に形成された論理回路によってハードウェア的に実現してもよいし、CPU（Central Processing Unit）を用いてソフトウェア的に実現してもよい。

　後者の場合、上記各装置は、各機能を実現するプログラムの命令を実行するCPU、上記プログラムを格納したROM（Read Only Memory）、上記プログラムを展開するRAM（RandomAccess Memory）、上記プログラム及び各種データを格納するメモリ等の記憶装置（記録媒体）などを備えている。そして、本発明の実施形態の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード（実行形式プログラム、中間コードプログラム、ソースプログラム）をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ（またはCPUやMPU）が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。

　上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー（登録商標）ディスク／ハードディスク等の磁気ディスクやCD-ROM（Compact Disc Read-Only Memory）／MOディスク（Magneto-Optical disc）／MD（Mini Disc）／DVD（Digital Versatile Disc）／CD-R（CD Recordable）／ブルーレイディスク（Blu-ray Disc：登録商標）等の光ディスクを含むディスク類、ICカード（メモリカードを含む）／光カード等のカード類、マスクROM／EPROM（Erasable Programmable Read-Only Memory）／EEPROM（Electrically Erasable and Programmable Read-Only Memory：登録商標）／フラッシュROM等の半導体メモリ類、あるいはPLD（Programmable logic device）やFPGA（Field Programmable Gate Array）等の論理回路類などを用いることができる。

　また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN（Local Area Network）、ISDN（Integrated Services Digital Network）、VAN（Value-Added Network）、CATV（Community Antenna television/Cable Television）通信網、仮想専用網（Virtual Private Network）、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE（Institute of Electrical and Electronic Engineers）1394、USB、電力線搬送、ケーブルＴＶ回線、電話線、ADSL（Asymmetric Digital Subscriber Line）回線等の有線でも、IrDA（Infrared Data Association）やリモコンのような赤外線、BlueTooth（登録商標）、IEEE802.11無線、HDR（High Data Rate）、NFC（Near Field Communication）、DLNA（Digital Living Network Alliance：登録商標）、携帯電話網、衛星回線、地上デジタル放送網等の無線でも利用可能である。なお、本発明の実施形態は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

　本発明の実施形態は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

　（関連出願の相互参照）
　本出願は、２０１７年４月２８日に出願された日本国特許出願：特願２０１７－０８９７８８に対して優先権の利益を主張するものであり、それを参照することにより、その内容の全てが本書に含まれる。

　本発明の実施形態は、画像データが符号化された符号化データを復号する画像復号装置、及び、画像データが符号化された符号化データを生成する画像符号化装置に好適に適用することができる。また、画像符号化装置によって生成され、画像復号装置によって参照される符号化データのデータ構造に好適に適用することができる。

１０　CT情報復号部
１１　画像符号化装置
２０　CU復号部
３１　画像復号装置
４１　画像表示装置

Claims

　入力動画像を符号化する動画像符号化装置において、
　前記入力動画像の１画面を複数の画素からなる符号化単位（CU）に分割する手段と、
　前記CUを単位として所定の変換を行い変換係数を出力する変換手段と、
　前記変換係数を量子化し、量子化変換係数を出力する手段と、
　前記量子化変換係数を可変長符号化する手段とを備え、
　前記変換手段は、
　第１の変換手段と、
　第１の変換手段から出力された第１の変換係数の一部を変換する第２の変換手段とを備え、
　第２の変換手段は、水平方向と垂直方向のサイズの異なる領域（第１の領域）の第１の変換係数、あるいは非矩形領域（第２の領域）の第１の変換係数の少なくともいづれかを変換することを特徴とする動画像符号化装置。
　前記第２の変換手段は、第１の領域に対する変換を、小サイズの正方形変換を組み合わせて実行することを特徴とする請求項１に記載の動画像符号化装置。
　前記第２の変換手段は、イントラ予測モードあるいは変換係数のスキャン方向によって、第１の領域に対する変換、あるいは第２の領域に対する変換を選択することを特徴とする請求項１に記載の動画像符号化装置。
　動画像を復号する動画像復号装置において、
　複数の画素からなる符号化単位（CU)を処理単位として、符号化データを可変長復号して量子化変換係数を出力する手段と、
　量子化変換係数を逆量子化して変換係数を出力する手段と、
　前記変換係数を逆変換する逆変換手段とを備え、
　前記逆変換手段は、
　前記変換係数の少なくとも一部を逆変換して、第２の変換係数を出力する第２の逆変換手段と、
　前記変換係数の残りと前記第２の変換係数を逆変換する第１の逆変換手段とを備え、
　第２の逆変換手段は、水平方向と垂直方向のサイズの異なる領域（第１の領域）の前記変換係数、あるいは非矩形領域（第２の領域）の前記変換係数の少なくともいづれかを逆変換することを特徴とする動画像復号装置。
　前記第２の逆変換手段は、第１の領域に対する逆変換を、小サイズの正方形逆変換を組み合わせて実行することを特徴とする請求項４に記載の動画像復号装置。
　前記第２の逆変換手段は、イントラ予測モードあるいは変換係数のスキャン方向によって、第１の領域に対する逆変換、あるいは第２の領域に対する逆変換を選択することを特徴とする請求項４に記載の動画像復号装置。