WO2015045301A1

WO2015045301A1 - 映像符号化装置、映像符号化方法および映像符号化プログラム

Info

Publication number: WO2015045301A1
Application number: PCT/JP2014/004666
Authority: WO
Inventors: 慶一蝶野; 健太徳満
Original assignee: 日本電気株式会社
Priority date: 2013-09-27
Filing date: 2014-09-10
Publication date: 2015-04-02
Also published as: JPWO2015045301A1

Abstract

　映像符号化装置は、変換スキップモードが有効であるか否かに基づいて直交変換係数の切り捨てに用いるデッドゾーン係数を選択するデッドゾーン係数選択部と、絶対値が、選択されたデッドゾーン係数から導出されるデッドゾーン以下である直交変換係数を０に変換する直交変換係数変換部と、直交変換係数変換部が出力する直交変換係数を量子化する量子化部とを備える。

Description

映像符号化装置、映像符号化方法および映像符号化プログラム

　本発明は、量子化のデッドゾーン制御技術が適用される映像符号化装置に関する。

　非特許文献１に記載されたHigh-Efficiency Video Coding （HEVC）に基づいた映像符号化方式では、ディジタル化された映像の各フレームは符号化ツリーユニット（CTU:Coding Tree Unit）に分割され、ラスタスキャン順に各CTUが符号化される。各CTUは、クアッドツリー構造で、符号化ユニット（CU: Coding Unit）に分割されて符号化される。各CTUは、クアッドツリー構造で、符号化ユニット（CU:Coding Unit）に分割されて符号化される。各CUは、予測ユニット（PU:Prediction Unit）に分割されて予測される。また、各CUの予測誤差は、クアッドツリー構造で、変換ユニット（TU: Transform Unit）に分割されて周波数変換される。

　CUは、イントラ予測/フレーム間予測の符号化単位である。以下、イントラ予測およびフレーム間予測を説明する。

　イントラ予測は、符号化対象フレームの再構築画像から予測画像を生成する予測である。非特許文献１では、DC予測およびPlanar 予測に加えて、図12に示す33種類の角度イントラ予測が定義されている。角度イントラ予測は、符号化対象ブロック周辺の再構築画素を図12に示す33種類の方向のいずれかに外挿して、イントラ予測信号を生成する。以下、イントラ予測を用いるCUをイントラCUと呼ぶ。

　フレーム間予測は、符号化対象フレームと表示時刻が異なる再構築フレーム（参照ピクチャ）の再構築画像から予測画像を生成する予測である。図13は、フレーム間予測の例を示す説明図である。MV＝(mv_x, mv_y)は、符号化対象ブロックに対する参照ピクチャ中の再構築画像ブロックの平行移動量を示す。フレーム間予測（以下、インター予測と呼ぶ）は、再構築画像ブロックに基づいて、インター予測信号を生成する。以下、インター予測を用いるCUをインターCUと呼ぶ。

　なお、イントラCUのみで符号化されたフレームはＩフレーム（または、Ｉピクチャ）と呼ばれる。イントラCUだけでなくインターCUも含めて符号化されたフレームはＰフレーム（または、Ｐピクチャ）と呼ばれる。ブロックのインター予測に１枚の参照ピクチャだけでなく、さらに同時に２枚の参照ピクチャを用いるインターCUを含めて符号化されたフレームはＢフレーム（または、Ｂピクチャ）と呼ばれる。

　図14を参照して、ディジタル化された映像の各フレームの各CUを入力画像としてビットストリームを出力する一般的な映像符号化装置の構成と動作を説明する。

　図14に示す映像符号化装置は、変換器101 、量子化器102 、エントロピー符号化器103 、逆量子化／逆変換器104 、バッファ105 、予測器106 、および推定器107 を備える。

　図15は、フレームの空間解像度がCIF （CIF:Common Intermediate Format）、CTU サイズが64の場合のフレームt のCTU 分割例、および、フレームt に含まれる第８のCTU （CTU8）のCU分割例を示す説明図である。また、図16は、CTU8のCU分割例に対応する、CTU のCUクアッドツリー構造を示す説明図である。CUクアッドツリー構造は、各CUDepth のCU分割フラグ（cu_split_flag ）で表現されることが分かる。

　図17は、CUのPU分割形状を示す。CUがイントラ予測の場合、正方形のPU分割を選択できる（ただし、CUが最小サイズよりも大きい場合、2N×N のみを選択できる）。CUがインター予測の場合、CUが8 よりも大きい場合、N×N以外のPU分割を選択できる（ただし、CUが8 の場合、2N×2N、2N×N 、およびN×2N のいずれかのみを選択できる）。

　図18は、CUのTU分割例を示す説明図である。上段には、2N×2N PU 分割形状のイントラCUのTU分割例が示されている。CUがイントラ予測の場合、クアッドツリーの根（Root）がPUに配置され、CUの予測誤差のTUクアッドツリー構造が各TUDepth のTU分割フラグ（tu_split_flag ）で表現される。下段には、2N×N PU分割形状のインターCUのTU分割例が示されている。CUがインター予測の場合、クアッドツリーの根（Root）がCUに配置され、CUの予測誤差のTUクアッドツリー構造が各TUDepthのTU分割フラグ（tu_split_flag ）で表現される。

　推定器107 は、CTU毎に、符号化コストを最小とするCUクアッドツリー構造／PU分割形状／TUクアッドツリー構造を決定する。

　予測器106 は、推定器107 が決定したCUクアッドツリー構造およびPU分割形状に基づいて、CUの入力画像信号に対する予測信号を生成する。予測信号は、上述したイントラ予測またはインター予測に基づいて生成される。

　変換器101 は、推定器107 が決定したTUクアッドツリー構造および後述する変換スキップフラグ（transform_skip_flag ）に基づいて、入力画像信号から予測信号を減じた予測誤差画像を周波数変換する。

　図19は、変換器101 の構成例を示すブロック図である。図19を参照して、変換器101 の構成と動作をさらに詳しく説明する。

　変換器101 は、水平方向周波数変換器1011、第１右ビットシフト器1012、垂直方向周波数変換器1013、第２右ビットシフト器1014、第３右ビットシフト器1015、および、スイッチ1010とスイッチ1016とを備える。

　変換器101 は、予測誤差信号の変換符号化において、周波数変換に基づいた4×4、8×8、16×16、および32×32ブロックサイズの直交変換を利用できる。具体的には、イントラCUの輝度成分の4×4 TU に対して、整数精度のDST （Discrete Sine Transform ：離散サイン変換）を適用できる。その他のTUに対して、そのブロックサイズに対応する整数精度のDCT （Discrete Cosine Transform ：離散コサイン変換）を適用する。図20は、整数精度のDCT （整数DCT ）の基底を示す説明図である。図21は、整数精度のDST （整数DST ）の基底を示す説明図である。

　N×Nブロックサイズの整数DCT の基底（以下、N 点整数DCT とも呼ぶ）は、32×32ブロックサイズの整数DCT の基底の先頭行から32/N行おきに各行の先頭N 列の要素を集めることで得られる。

　なお、図20に示す整数DCT の基底の値と包含関係とから分かるように、全てのブロックサイズで、N 点整数DCT ベクトルのノルムはほぼ均一になる。また、図21から分かるように、整数DST の基底は、同ブロックサイズの整数DCT の基底に対して、ノルムがほぼ均一になるように設定されている。

　変換器101 は、上述したDST やDCT などの周波数変換に基づいた直交変換だけでなく、単位行列に基づいた4×4ブロックサイズの直交変換も利用できる。スクリーンコンテンツやCG（computer graphics ）などの急峻なエッジの保持にDST やDCT などの周波数変換は適さないためである。4×4ブロックサイズの単位行列に基づいた直交変換は、周波数変換を行わない直交変換であり、変換スキップモードと呼ばれる。変換スキップモードは、transform_skip_flag が1 に設定された場合に有効になる。

　まず、transform_skip_flag が0 のときの変換器101 の動作を説明する。

　スイッチ1010を介して入力される予測誤差信号は、水平方向周波数変換器1011に供給される。水平方向周波数変換器1011は、図20や図21に示された基底を用いて、N×NブロックサイズのTUの予測誤差信号を水平方向に周波数変換する。

　第１右ビットシフト器1012は、水平方向に周波数変換されたTUの予測誤差信号をlog₂N - 1 ビットだけ右方向にビットシフトする。

　続いて、垂直方向周波数変換器1013は、図20や図21に示された基底を用いて、第１右ビットシフト器1012から供給されるTUの予測誤差信号を垂直方向に周波数変換する。

　さらに、第２右ビットシフト器1014は、垂直方向周波数変換器1013から供給されるTUの予測誤差信号をlog₂N + 6 ビットだけ右方向にビットシフトする。

　transform_skip_flag が0 のとき、スイッチ1016は、第２右ビットシフト器1014の出力をTUの直交変換係数として出力する。

　次に、transform_skip_flag が1 のときの変換器101の動作を説明する。

　スイッチ1010を介して入力される、N×NブロックサイズのTUの予測誤差信号は、第３右ビットシフト器1015に供給される。第３右ビットシフト器1015は、予測誤差信号を、13 - BitDepth ビットだけ左方向にビットシフトする。周波数変換を用いて得た直交変換係数と変換スキップモードの直交変換係数のノルムとを整合させて、同一の量子化を適用するためである。なお、BitDepthは入力画像の画素ビット深度である。

　transform_skip_flag が1 のとき、スイッチ1016は、第３右ビットシフト器1015の出力をTUの直交変換係数として出力する。

　量子化器102 は、変換器101 から供給される直交変換係数を量子化する。以下、量子化された直交変換係数を変換量子化値と呼ぶ。

　量子化器102 の動作をより詳細に説明する。

　量子化器102 は、量子化パラメータqPと量子化ステップQstep の対数が比例する線形量子化を用いる（例えば、qPが6 増加するとQstep が2 倍になる）。N×NブロックサイズのTU内の位置(i、j){0≦i,j≦N-1}に対応する直交変換係数c_ij の量子化係数q_ij を求める量子化処理は、以下の（１）式のように定義できる。

　ただし、Sign( ) は入力の正負の符号を返す関数、Int [ ] は入力を整数値化する関数、Qscale は図22に示す量子化ステップ係数、qP％6 はqPを6 で割った剰余、m_ij は量子化重み付け係数、f は量子化丸めを決定するオフセット(0≦f≦0.5) 、N はTUのサイズを示す。

　視覚的な画質調整に用いる、量子化重み付け係数m_ij のデフォルト値は16である。量子化重み付け係数マトリクスは、色成分別、TUサイズ別、およびイントラ予測／インター予測別に、シーケンスおよびピクチャ単位で伝送可能である。ただし、伝送できる量子化重み付け係数マトリクスのブロックサイズは、8×8までとなる。16×16や32×32のブロックサイズのTUの量子化重み付け係数マトリクスは、それぞれのブロックサイズのTUに対して伝送された8×8の量子化重み付け係数マトリクスのコピーに基づいてスケーリングされる。ただし、DC成分についてのみ別途で伝送できる。

　図23、図24、図25、図26は、それぞれ、4×4、8×8、16×16、32×32 TUのイントラ予測のデフォルトの量子化重み付け係数マトリクスを示す説明図である。

　図25より、コピーに基づいたスケーリングによって、16×16 イントラTUデフォルト量子化重み付け係数マトリクスにおいて、2×2の周波数成分ごとに量子化重み付け係数が同一となることを確認できる。同様に、図26より、32×32 イントラTUデフォルト量子化重み付け係数マトリクスにおいて、4×4の周波数成分ごとに量子化重み付け係数が同一となることを確認できる。

　エントロピー符号化器103 は、cu_split_flag 、PU分割形状、tu_split_flag 、イントラ予測／インター予測の予測パラメータ、transform_skip_flag 、および変換量子化値をエントロピー符号化する。

　逆量子化／逆変換器104 は、変換量子化値を逆量子化する。さらに、逆量子化／逆変換器104 は、逆量子化した直交変換係数を逆変換する。逆変換された再構築予測誤差画像は、予測信号が加えられて、バッファ105 に供給される。バッファ105 は、再構築画像を格納する。

　上述した動作に基づいて、一般的な映像符号化装置はビットストリームを生成する。

"High Efficiency Video Coding (HEVC) text specification draft 10 (for FDIS & Last Call)," JCTVC-L1003_v34, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 12th Meeting: Geneva, CH, 14-23 Jan. 2013

　上述した映像符号化装置は、変換スキップモードの有効／無効（変換スキップモードが有効であるのか無効であるのか）に依存することなく、4×4ブロックサイズのTUの直交変換係数に対して同じ量子化重み付け係数マトリクスを利用して直交変換係数を量子化する。

　しかし、変換スキップモードの有効／無効に依存することなく予測誤差信号に対して同じ量子化重み付け係数マトリクスを利用すると、視覚特性に応じた量子化ができない。

　図27は、傾斜付きの量子化重み付け係数マトリクスおよび一様な量子化重み付け係数マトリクスを示す説明図である。例えば、図27における左側に示すような傾斜付きの量子化重み付け係数マトリクスは、変換スキップモード無効の4×4ブロックサイズのTUにおいて、劣化を認知しにくい高周波数成分の情報量を削減することにより、間接的に、劣化を認知しやすい低周波数成分の量子化雑音が低減される。しかし、当該量子化重み付け係数マトリクスは、変換スキップモード有効の4×4ブロックサイズのTUにおいて、画素位置に応じた許容外の劣化を発生させる。

　一方、図27における右側に示すような一様な量子化重み付け係数マトリクスについては、変換スキップモード有効の4×4ブロックサイズのTUにおいて、画素位置に応じた許容外の劣化を防止できる。しかし、当該量子化重み付け係数マトリクスは、変換スキップモード無効の4×4ブロックサイズのTUにおいて、高周波数成分の情報量を削減できないため、間接的に、劣化を認知しやすい低周波数成分の量子化雑音を増大させる。

　このように、変換スキップモードの有効／無効に依存することなく予測誤差信号に対して同じ量子化重み付け係数マトリクスを利用する技術は、視覚特性に応じた量子化ができず、局所的な画質劣化を回避できない問題がある。

　また、一般に、大きなブロックサイズのDCT は、急峻な画素値の変化が少ない、平坦領域の予測誤差信号の電力集中に有効である。また、DCT による直交変換係数には、高周波数成分ほど量子化雑音が知覚されにくい特性がある。

　よって、16×16や32×32といったブロックサイズのDCT 直交変換係数の量子化において、周波数成分毎の視覚特性に合致した量子化ステップサイズを用いることが好ましい。

　上述した映像符号化装置は、16×16と32×32のDCT の量子化において周波数成分毎の視覚特性に合致した値の量子化ステップサイズを利用できない。映像復号装置側のメモリ容量を節約するために、量子化ステップサイズを決定する量子化重み付け係数を複数の周波数成分間で共有するためである。例えば、16×16 イントラTUの直交変換係数に対して図28に示す量子化重み付け係数マトリクスを適用しようとしても、上述した量子化重み付け係数の伝送の制約により、図28における下線付きの周波数成分を、所望する量子化ステップサイズで量子化できない。

　なお、図28には、16×16イントラTUの量子化重み付け係数マトリクスが示されているが、下線付きの要素の値が図26に示すデフォルトの値と異なる。

　異なる周波数成分の直交変換係数に対して同一の量子化重み付け係数を利用すると、量子化雑音が知覚しにくいパワーの小さな周波数成分を効率的に除去できない。例えば、映像にはアナログ－ディジタル変換などに起因する雑音が存在するため、16×16や32×32のDCT が選択される平坦領域であっても、小さなパワーの高周波数成分が発生する。残存した周波数成分はエントロピーを増加させるため、ビットレートを低く保つには、低周波数成分の直交変換係数を荒く量子化しなければならない。この結果、上述した映像符号化装置は、低周波数成分の量子化雑音を増大させ、映像品質を低下させる。

　本発明は、映像品質の低下を抑制できる映像符号化装置、映像符号化方法および映像符号化プログラムを提供することを目的とする。

　本発明による映像符号化装置は、変換スキップモードが有効であるか否かに基づいて直交変換係数の切り捨てに用いるデッドゾーン係数を選択するデッドゾーン係数選択手段と、絶対値が、選択されたデッドゾーン係数から導出されるデッドゾーン以下である直交変換係数を０に変換する直交変換係数変換手段と、直交変換係数変換手段が出力する直交変換係数を量子化する量子化手段とを備えることを特徴とする。

　本発明による他の映像符号化装置は、所定サイズよりも大きいブロックサイズの直交変換係数の各周波数成分に対応するデッドゾーン係数を設定するデッドゾーン係数設定手段と、設定されたデッドゾーン係数から導出されるデッドゾーン以下である絶対値の直交変換係数を０に変換する直交変換係数変換手段と、直交変換係数変換手段が出力する直交変換係数を量子化する量子化手段とを備えることを特徴とする。

　本発明による映像符号化方法は、変換スキップモードが有効であるか否かに基づいて直交変換係数の切り捨てに用いるデッドゾーン係数を選択し、絶対値が、選択されたデッドゾーン係数から導出されるデッドゾーン以下である直交変換係数を０に変換する直交変換係数変換処理を実行し、直交変換係数変換処理による直交変換係数を量子化することを特徴とする。

　本発明による他の映像符号化方法は、所定サイズよりも大きいブロックサイズの直交変換係数の各周波数成分に対応するデッドゾーン係数を設定し、設定されたデッドゾーン係数から導出されるデッドゾーン以下である絶対値の直交変換係数を０に変換する直交変換係数変換処理を実行し、直交変換係数変換処理による直交変換係数を量子化することを特徴とする。

　本発明による映像符号化プログラムは、コンピュータに、変換スキップモードが有効であるか否かに基づいて直交変換係数の切り捨てに用いるデッドゾーン係数を選択する処理と、絶対値が、選択されたデッドゾーン係数から導出されるデッドゾーン以下である直交変換係数を０に変換する直交変換係数変換処理と、直交変換係数変換処理による直交変換係数を量子化する処理とを実行させることを特徴とする。

　本発明による他の映像符号化プログラムは、コンピュータに、所定サイズよりも大きいブロックサイズの直交変換係数の各周波数成分に対応するデッドゾーン係数を設定する処理と、設定されたデッドゾーン係数から導出されるデッドゾーン以下である絶対値の直交変換係数を０に変換する直交変換係数変換処理と、直交変換係数変換処理による直交変換係数を量子化する処理とを実行させることを特徴とする。

　本発明によれば、映像品質の低下を抑制できる。

映像符号化装置の一実施形態の構成を示すブロック図である。適応切り捨て器の構成例を示すブロック図である。デッドゾーン係数マトリクスと量子化重み付け係数マトリクスとを示す説明図である。適応切り捨て器の動作を示すフローチャートである。非一様デッドゾーン係数マトリクスを示す説明図である。適応切り捨て器の動作を示すフローチャートである。 16×16のイントラTUに用いる2×2のサブデッドゾーン係数マトリクスを示す説明図である。 32×32のイントラTUに用いる4×4のサブデッドゾーン係数マトリクスを示す説明図である。映像符号化装置の機能を実現可能な情報処理システムの構成例を示すブロック図である。本発明による映像符号化装置の主要部を示すブロック図である。本発明による他の映像符号化装置の主要部を示すブロック図である。 33種類の角度イントラ予測の例を示す説明図である。フレーム間予測の例を示す説明図である。一般的な映像符号化装置の構成を示す説明図である。フレームt のCTU 分割例、および、フレームt のCTU8のCU分割例を示す説明図である。 CTU8のCU分割例に対応するクアッドツリー構造を示す説明図である。 CUのPU分割例を示す説明図である。 CUのTU分割例を示す説明図である。変換器の構成例を示すブロック図である。整数精度のDCT の基底を示す説明図である。整数精度のDST の基底を示す説明図である。量子化ステップ係数を示す説明図である。 4×4TUのイントラ予測のデフォルトの量子化重み付け係数マトリクスを示す説明図である。 8×8TUのイントラ予測のデフォルトの量子化重み付け係数マトリクスを示す説明図である。 16×16TUのイントラ予測のデフォルトの量子化重み付け係数マトリクスを示す説明図である。 32×32TUのイントラ予測のデフォルトの量子化重み付け係数マトリクスを示す説明図である。傾斜付きの量子化重み付け係数マトリクスおよび一様な量子化重み付け係数マトリクスを示す説明図である。傾斜付きの量子化重み付け係数マトリクスおよび一様な量子化重み付け係数マトリクスを示す説明図である。

実施形態１．
　図１は、映像符号化装置の一実施形態の構成を示すブロック図である。図1 に示す映像符号化装置は、変換器101 、量子化器102 、エントロピー符号化器103 、逆量子化／逆変換器104 、バッファ105 、予測器106 、および推定器107 に加えて、適応切り捨て器108 を備える。

　推定器107 は、CTU 毎に、符号化コストを最小とするCUクアッドツリー構造/PU分割形状／TUクアッドツリー構造を決定する。

　予測器106 は、推定器107 が決定したCUクアッドツリー構造およびPU分割形状に基づいて、CUの入力画像信号に対する予測信号を生成する。

　変換器101 は、推定器107 が決定したTUクアッドツリー構造および変換スキップフラグ（transform_skip_flag ）に基づいて、入力画像信号から予測信号を減じた予測誤差画像を周波数変換する。

　適応切り捨て器108 は、推定器107 が決定した変換スキップフラグ（transform_skip_flag ）に基づいて、変換器101 から供給される直交変換係数に対して切り捨て処理を行う。

　図2 は、適応切り捨て器108 の構成例を示すブロック図である。適応切り捨て器108 は、イントラ予測で得られた4×4ブロックサイズTUの直交変換係数に対して、図3 に示すデッドゾーン係数マトリクスおよび量子化重み付け係数マトリクスを用いる。図3 は、本実施形態の映像符号化装置が用いるデッドゾーン係数マトリクスと量子化重み付け係数マトリクスとを示す説明図である。

　なお、デッドゾーン技術は、直交変換係数を量子化する際に、0 に近い入力に対応する出力を0 にする技術である。デッドゾーンは、直交変換係数を0 にするか否か判定するための指標に相当する。デッドゾーン係数は、デッドゾーンを設定するために使用されるパラメータであり、任意に設定可能である。

　図3 における左側に示す傾斜付きデッドゾーン係数マトリクスは、図27における左側に示す傾斜付きの量子化重み付け係数マトリクスの各要素を図3 における中央下段に示す一様量子化重み付け係数マトリクスの要素で割って生成したマトリクスである。TU内の位置(i、j){0≦i,j≦3}を示すi およびj が大きな値になるほど、デッドゾーン係数が大きくなることが分かる。図3 における右側に示す一様デッドゾーン係数マトリクスは、図27における右側に示す一様量子化重み付け係数マトリクスの各要素を図3 における中央下段に示す一様量子化重み付け係数マトリクスの要素で割って生成したマトリクスである。TU内の位置(i、j){0≦i,j≦3}を示すi およびj に依存することなく、デッドゾーン係数が固定値になっていることが分かる。

　デッドゾーン係数選択部1081は、transform_skip_flag が1 の場合、上述した一様デッドゾーン係数マトリクスを選択する。transform_skip_flag が0 の場合、上述した傾斜付きデッドゾーン係数マトリクスを選択する。以下、位置(i, j)に対応するデッドゾーン係数をd_ij とする。

　デッドゾーン算出部1082は、直交変換係数c_ij に対するデッドゾーンdz_ijを以下の（２）式のように計算する。

　図3 に示すデッドゾーン係数マトリクスより、上記の式で計算されるデッドゾーンdz_ijには以下の特徴がある。

　transform_skip_flag が0 の場合、TU内の位置(i、j){0≦i,j≦3}を示すi およびj が大きな値になるほど（つまり、周波数成分が高周波になるほど）、デッドゾーンdz_ijが大きくなる。つまり、後述する切り捨て部1083の処理によって、劣化が目立ちにくい高周波数成分の直交変換係数の情報量を削減することができる。

　transform_skip_flag が1 の場合、TU内の位置(i、j){0≦i,j≦3}を示すi およびj に依存することなく、デッドゾーンdz_ijが固定値になる。つまり、後述する切り捨て部1083の処理によって、画素位置に依存することなく一定量で直交変換係数の情報量削減ができる。

　切り捨て部1083は、4×4ブロックサイズのTUの直交変換係数に対してのみ、各位置(i,j){0≦i,j≦3}のc_ij の絶対値とdz_ij を比較し、c_ij の絶対値がdz_ij以下の場合、c_ij を0 として出力する。その他の場合、c_ij をそのまま出力する。定式的には、以下の（３）式のようになる。

　本実施形態では、量子化器102 は、適応切り捨て器108 から供給される直交変換係数を量子化する。

　上述した動作に基づいて、本実施形態の映像符号化装置はビットストリームを生成する。

　続いて、図4 を参照して、4×4ブロックサイズのTUに対する、適応切り捨て器108 の動作を説明する。

　ステップS101では、デッドゾーン係数選択部1081が、処理対象の4×4ブロックサイズのTUのtransform_skip_flag が0 か否か判定する。0 である場合、ステップS102に進む。そうでない場合、ステップS103に進む。

　ステップS102では、デッドゾーン係数選択部1081が、図3 における左側に示す傾斜付きデッドゾーン係数マトリクスを選択する。そして、ステップS104に進む。

　ステップS103では、デッドゾーン係数選択部1081が、図3 における右側に示す一様デッドゾーン係数マトリクスを選択する。そして、ステップS104に進む。

　ステップS104では、デッドゾーン算出部1082が、選択されたデッドゾーン係数マトリクスに基づいて、処理対象の4×4ブロックサイズのTUの各位置(i,j){0≦i,j≦3}の直交変換係数に対するデッドゾーンdz_ijを計算する。

　ステップS105では、切り捨て部1083が、処理対象の4×4ブロックサイズのTUの各位置(i,j){0≦i,j≦3}の直交変換係数c_ij の絶対値とデッドゾーンdz_ijを比較し、c_ij の絶対値がdz_ij以下の場合、c_ij を0 として出力する。切り捨て部1083は、その他の場合、c_ij をそのまま出力する。

　以上のように、適応切り捨て器108 は、処理対象ブロックの変換スキップモードの有効／無効（transform_skip_flagの値）を監視し、処理対象4×4ブロックサイズTUの直交変換係数の切り捨てに用いるデッドゾーン係数を適応的に選択する。具体的には、4×4ブロックサイズTUの変換スキップモードが無効の場合、傾斜付きのデッドゾーン係数を選択する。4×4ブロックサイズTUの変換スキップモードが有効の場合、一様のデッドゾーン係数を選択する。さらに、適応切り捨て器108 は、選択したデッドゾーン係数と量子化ステップサイズからデッドゾーンを算出し、絶対値がデッドゾーン以下となる4×4ブロックサイズTUに含まれる直交変換係数を0 に変換する。

　本実施形態の映像符号化装置は、適応切り捨て器108を備えるので、一様な量子化重み付け係数マトリクスを利用する映像符号化方式を用いても、変換スキップモード無効が選択された4×4ブロックサイズTUにおいて、劣化を認知しにくい高周波数成分の情報量を傾斜付きのデッドゾーンで削減することができる。その結果、間接的に、劣化を認知しやすい低周波数成分の量子化雑音を低減できる。従って、変換スキップモードの有効／無効に依存することなく4×4ブロックサイズTUの直交変換係数に対して同じ一様な量子化重み付け係数マトリクスを利用する映像符号化方式であっても、視覚特性に応じた量子化によって局所的な画質劣化を回避できる。

　なお、本実施形態では、イントラ予測で得られた4×4ブロックサイズTUの直交変換係数に対して図3 に示すデッドゾーン係数マトリクスおよび量子化重み付け係数マトリクスを用いたが、インター予測で得られた4×4ブロックサイズTUの直交変換係数に対しても同様に、変換スキップモード無効が選択された4×4ブロックサイズTUにおいて、劣化を認知しにくい高周波数成分の情報量を傾斜付きのデッドゾーンで削減することができる。

　上述した実施形態において、傾斜付きデッドゾーン係数マトリクスおよび一様デッドゾーン係数マトリクスの要素は実数で所定の記憶部に格納されることになる。しかし、量子化において量子化パラメータqPが6 増加すると量子化ステップQstep が2 倍になることを利用して、傾斜付きデッドゾーン係数マトリクスおよび一様デッドゾーン係数マトリクスの要素を整数で記憶部に格納することも可能である。実数のデッドゾーン係数dz_ijは、以下の式の対数表現により、整数のデッドゾーン係数qPDZOffset_ijとして表現できる。

　qPDZOffset_ij = 6・log₂dz_ij

　デッドゾーン係数qPDZOffset_ijを用いた場合、デッドゾーン算出部1082における、直交変換係数c_ij に対するデッドゾーンdz_ijの計算は以下の（４）式のようになる。

　上記のqPDZ_ijの計算式から分かるように、デッドゾーン係数qPDZOffset_ijが量子化パラメータqPのオフセットとして利用されることが分かる。実数ではなく整数のデッドゾーン係数を用いることによって、傾斜付きデッドゾーン係数マトリクスおよび一様デッドゾーン係数マトリクスの記憶容量を削減できる。

　本実施形態の映像符号化装置は、一様な量子化重み付け係数マトリクスを利用する映像符号化方式を用いる場合に、適応的に変換スキップモード無効の高周波数成分の直交変換係数を除去することによって視覚特性に応じた量子化を実現し、局所的な画質劣化を回避できる。

　すなわち、本実施形態の映像符号化装置は、一様な量子化重み付け係数マトリクスを利用する映像符号化方式を用いても、変換スキップモード無効が選択された4×4ブロックサイズTUにおいて、劣化を認知しにくい高周波数成分の情報量を傾斜付きのデッドゾーンで削減することができる。その結果、間接的に、劣化を認知しやすい低周波数成分の量子化雑音を低減できる。従って、変換スキップモードの有効／無効に依存することなく4×4ブロックサイズTUの直交変換係数に対して同じ一様な量子化重み付け係数マトリクスを利用する映像符号化方式であっても、視覚特性に応じた量子化によって、局所的な画質劣化が回避される。

実施形態２．
　次に、映像符号化装置の第２の実施形態を説明する。第２の実施形態の映像符号化装置の構成は、図１に示されたようである。

　以下、説明を簡略化するために、変換器101 が、4×4、8×8、および16×16ブロックサイズのDCT に基づいた直交変換を利用する場合を例にする。

　第２の実施形態では、図２に示された適応切り捨て器108 は、イントラ予測で得られた16×16ブロックサイズTUの直交変換係数に対して、図5 に示す非一様デッドゾーン係数マトリクスを用い、かつ、伝送する量子化重み付け行列として図25に示された量子化重み付け係数マトリクスを用いる。

　図5 に示す非一様デッドゾーン係数マトリクスは、図28に示す量子化重み付け係数マトリクスの各要素を、図25に示すデフォルトの量子化重み付け係数マトリクスの要素で割って生成したマトリクスである。TU内の位置(i，j){0≦i,j≦N-1}に応じて、すなわち、周波数成分に応じて、デッドゾーン係数が異なることが分かる。

　デッドゾーン係数選択部1081は、DCT の点数N が8 よりも大きい場合、上述した非一様デッドゾーン係数マトリクスを選択する。DCT の点数N が8 以下の場合、上述した一様デッドゾーン係数マトリクスを選択する。周波数成分 (i, j)に対応するデッドゾーン係数をd_ij とする。

　デッドゾーン算出部1082は、DCT の点数N が8 よりも大きい場合、直交変換係数c_ij に対するデッドゾーンdz_ijを上記の（２）式のように計算する。

　図5 に示すデッドゾーン係数マトリクスより、（２）式で計算されるデッドゾーンdz_ijには以下の特徴がある。

　TU内の周波数成分(i，j){0≦i,j≦N-1}に応じて、デッドゾーンdz_ijが異なる値をとる。つまり、後述する切り捨て部1083の処理によって、2×2毎に同一の量子化重み付け係数となる直交変換係数であっても、劣化が目立ちにくい周波数成分の直交変換係数の情報量をより削減することができる。

　切り捨て部1083は、8×8ブロックサイズよりも大きい16×16ブロックサイズのTUの直交変換係数に対して、各周波数成分(i,j){0≦i,j≦N-1}のc_ij の絶対値とdz_ijを比較し、c_ij の絶対値がdz_ij以下の場合、c_ij を0として出力する。その他の場合、c_ij をそのまま出力する。定式的には、上記の（３）式のようになる。

　次に、図6 を参照して、4×4ブロックサイズのTUに対する、適応切り捨て器108 の動作を説明する。

　ステップS201では、デッドゾーン係数選択部1081が、処理対象のDCTのブロックサイズが8×8よりも大きいか否か判定する。8×8よりも大きい場合、すなわち、処理対象のDCT のブロックサイズが16×16の場合、ステップS202に進む。そうでない場合、処理を終了する。

　ステップS202では、デッドゾーン係数選択部1081が、図5に示す非一様デッドゾーン係数マトリクスを選択する。そして、ステップS203に進む。

　なお、デッドゾーン係数選択部1081は、DCTのブロックサイズが8×8以下である場合には、全ての要素が1 である一様デッドゾーン係数を選択する。

　ステップS203では、デッドゾーン算出部1082が、選択されたデッドゾーン係数マトリクスに基づいて、処理対象の16×16ブロックサイズのTUの各周波数成分(i,j){0≦i,j≦15} の直交変換係数に対するデッドゾーンdz_ijを計算する。そして、ステップS204に進む。

　ステップS204では、切り捨て部1083が、処理対象の16×16ブロックサイズのTUの各位置(i,j){0≦i,j≦15} の直交変換係数c_ij の絶対値とデッドゾーンdz_ijを比較し、c_ij の絶対値がdz_ij以下の場合、c_ij を0 として出力する。切り捨て部1083は、その他の場合、c_ij をそのまま出力する。

　量子化器102 は、適応切り捨て器108 が出力する直交変換係数を量子化するが、ブロックサイズが8×8よりも大きい場合、直交変換係数に対して（DC成分を除く）、複数の周波数成分について同じ値の量子化重み付け係数を利用して直交変換係数を量子化する。例えば、直交変換係数に対して図23や図24に示す量子化重み付け係数マトリクスを適用する。

　以上のように、適応切り捨て器108 は、処理対象ブロックのDCT ブロックサイズを監視し、処理対象ブロックの直交変換係数の切り捨てに用いるデッドゾーンを適応的に選択する。具体的には、処理対象ブロックのDCT ブロックサイズが8×8よりも大きな場合（つまり、処理対象ブロックのブロックサイズが異なる周波数成分の直交変換係数に対して同一の量子化重み付け係数を用いて量子化するブロックサイズの場合）、周波数成分毎に異なる値をとりうる非一様デッドゾーン係数を選択する。そうでない場合には、要素が固定値1 である一様デッドゾーン係数を選択する。さらに、適応切り捨て器108 は、選択したデッドゾーン係数と量子化ステップサイズからデッドゾーンを算出し、絶対値がデッドゾーン以下となる小さな高周波数成分の直交変換係数を0 に変換する。

　本実施形態の映像符号化装置は、適応切り捨て器108を備えるので、2×2の周波数成分ごとに同一の量子化重み付け係数を量子化に用いる16×16ブロックサイズのDCT を用いても、周波数成分毎の視覚特性に応じてパワーの小さな周波数成分を効率的に除去できる。この結果、低周波数成分の量子化雑音が低減し、映像品質を改善できる。すなわち、低周波数成分の量子化雑音の増大を抑えることによって、映像品質を低下を抑制できる。

　なお、本実施形態では、説明を簡略化するために、変換器101 は、4×4、8×8、および16×16ブロックサイズのDCT に基づいた直交変換を利用するものとしたが、4×4の周波数成分ごとに同一の量子化重み付け係数を量子化に用いる32×32ブロックサイズのDCT を用いても、16×16ブロックサイズの場合と同様に、適応切り捨て器108 によって周波数成分毎の視覚特性に応じてパワーの小さな周波数成分を効率的に除去できる。

　また、インター予測で得られた16×16ブロックサイズと32×32ブロックサイズTUの直交変換係数に対しても、イントラ予測で得られた16×16ブロックサイズと同様に、適応切り捨て器108 を用いることによって周波数成分毎の視覚特性に応じてパワーの小さな周波数成分を効率的に除去できる。

　上述した実施形態において、16×16ブロックサイズのデッドゾーン係数マトリクスのすべての要素が切り捨て部1083に格納されることになる。2×2の周波数成分ごとに同一の量子化重み付け係数となることに着目して、16×16のイントラTUについて、図7 に示す2×2のサブデッドゾーン係数マトリクスを用いてもよい。

　上述した実施形態において、16×16ブロックサイズのデッドゾーン係数マトリクスのすべての要素が切り捨て部1083に格納されることになる。しかし、2×2の周波数成分ごとに同一の量子化重み付け係数となることに着目して、図7 に示す2×2のサブデッドゾーン係数マトリクスを用いてもよい。

　この場合、16×16ブロックサイズのデッドゾーンdz_ij (0≦i,j≦15)は、以下の（５）式で算出される。

　このようにコピーに対応するサブデッドゾーン係数マトリクスを用いることによって、デッドゾーン係数マトリクスの記憶容量を削減できる。同様に、32×32ブロックサイズのDCT に対して、4×4の周波数成分ごとに同一の量子化重み付け係数となることに着目して、32×32のイントラTUについて、図8 に示す4×4のサブデッドゾーン係数マトリクスを用いてもよい。

　この場合、32×32ブロックサイズのデッドゾーンdz_ij (0≦i,j≦31)は、以下の（６）式で算出される。

　上述した実施形態において、デッドゾーン係数マトリクスの要素は実数で所定の記憶部に格納されることになる。しかし、量子化において量子化パラメータqPが6 増加すると量子化ステップQstep が2 倍となることを利用して、デッドゾーン係数マトリクスの要素を整数で記憶部に格納することも可能である。実数のデッドゾーン係数dz_ijは、以下の式の対数表現により、整数のデッドゾーン係数qPDZOffset_ijとして表現できる。

　qPDZOffset_ij = 6・log₂dz_ij

　デッドゾーン係数qPDZOffset_ijを用いた場合、デッドゾーン算出部1082における、直交変換係数c_ij に対するデッドゾーンdz_ijの計算は上記の（４）式のようになる。

　上記のqPDZ_ijの計算式から分かるように、デッドゾーン係数qPDZOffset_ijが量子化パラメータqPのオフセットとして利用されることが分かる。実数ではなく整数のデッドゾーン係数を用いることによって、デッドゾーン係数マトリクスの記憶容量をさらに削減できる。

　また、上記の各実施形態を、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。

　図9 に示す情報処理システムは、プロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体1003およびビットストリームを格納するための記憶媒体1004を備える。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。

　図9 に示された情報処理システムにおいて、プログラムメモリ1002には、図1 に示された各ブロックの機能を実現するためのプログラムが格納される。そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、図1 に示された映像符号化装置の機能を実現する。

　図10は、本発明による映像符号化装置の主要部を示すブロック図である。図10に示すように、映像符号化装置は、変換スキップモードの有効／無効に基づいて直交変換係数の切り捨てに用いるデッドゾーン係数を選択するデッドゾーン係数選択部10（一例として、図2 に示すデッドゾーン係数選択部1081）と、絶対値が、選択されたデッドゾーン係数から導出されるデッドゾーン以下である直交変換係数を0 に変換する直交変換係数変換部20（一例として、図2 に示すデッドゾーン算出部1082および切り捨て部1083）と、直交変換係数変換部20が出力する直交変換係数を量子化する量子化部30（一例として、図1 に示す量子化器102 ）とを備える。

　図11は、本発明による他の映像符号化装置の主要部を示すブロック図である。図11に示すように、映像符号化装置は、所定サイズよりも大きいブロックサイズの直交変換係数の各周波数成分に対応するデッドゾーン係数を設定するデッドゾーン係数設定部11（一例として、図2 に示すデッドゾーン係数選択部1081）と、絶対値が、設定されたデッドゾーン係数から導出されるデッドゾーン以下である絶対値の直交変換係数を0 に変換する直交変換係数変換部21（一例として、図2 に示すデッドゾーン算出部1082および切り捨て部1083）と、直交変換係数変換部21が出力する直交変換係数を量子化する量子化部31（一例として、図1 に示す量子化器102 ）とを備える。

　以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２０１３年９月２７日に出願された日本特許出願２０１３－２００８９２および２０１３年９月３０日に出願された日本特許出願２０１３－２０４８６４を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　10　　デッドゾーン係数選択部
11　　デッドゾーン係数設定部
　20,21 直交変換係数変換部
　30,31 量子化部
　101 　変換器
　102 　量子化器
　103 　エントロピー符号化器
　104 　逆量子化／逆変換器
　105 　バッファ
　106 　予測器
　107 　推定器
　108 　適応切り捨て器
　1081　デッドゾーン係数選択部
　1082　デッドゾーン算出部
　1083　切り捨て部

Claims

　変換スキップモードが有効であるか否かに基づいて直交変換係数の切り捨てに用いるデッドゾーン係数を選択するデッドゾーン係数選択手段と、
　絶対値が、選択されたデッドゾーン係数から導出されるデッドゾーン以下である直交変換係数を０に変換する直交変換係数変換手段と、
　前記直交変換係数変換手段が出力する直交変換係数を量子化する量子化手段と
　を備えることを特徴とする映像符号化装置。
　前記量子化手段は、変換スキップモードが有効であるときでも無効であるときでも同じ量子化重み付け係数を利用して直交変換係数を量子化する
　請求項１記載の映像符号化装置。
　前記直交変換係数変換手段は、絶対値がデッドゾーンよりも大きい直交変換係数を変換せずに出力する
　請求項２記載の映像符号化装置。
　前記直交変換係数変換手段は、変換スキップモードが無効である場合に、固定値になり、変換スキップモードが有効である場合に、周波数成分が高周波になるほど値が大きくなるデッドゾーンを導出する
　請求項２または請求項３記載の映像符号化装置。
　所定サイズよりも大きいブロックサイズの直交変換係数の各周波数成分に対応するデッドゾーン係数を設定するデッドゾーン係数設定手段と、
　設定されたデッドゾーン係数から導出されるデッドゾーン以下である絶対値の直交変換係数を０に変換する直交変換係数変換手段と、
　前記直交変換係数変換手段が出力する直交変換係数を量子化する量子化手段と
　を備えることを特徴とする映像符号化装置。
　前記量子化手段は、直交変換係数に対して、複数の周波数成分について同じ値の量子化重み付け係数を利用して直交変換係数を量子化する
　請求項５記載の映像符号化装置。
　前記直交変換係数変換手段は、周波数成分に応じて値が異なるデッドゾーンを導出する
　請求項６記載の映像符号化装置。
　前記直交変換係数変換手段は、絶対値がデッドゾーンよりも大きい直交変換係数を変換せずに出力する
　請求項６または請求項７記載の映像符号化装置。
　変換スキップモードが有効であるか否かに基づいて直交変換係数の切り捨てに用いるデッドゾーン係数を選択し、
　絶対値が、選択されたデッドゾーン係数から導出されるデッドゾーン以下である直交変換係数を０に変換する直交変換係数変換処理を実行し、
　前記直交変換係数変換処理による直交変換係数を量子化する
　ことを特徴とする映像符号化方法。
　変換スキップモードが有効であるときでも無効であるときでも同じ量子化重み付け係数を利用して直交変換係数を量子化する
　請求項９記載の映像符号化方法。
　変換スキップモードが無効である場合に、固定値になり、変換スキップモードが有効である場合に、周波数成分が高周波になるほど値が大きくなるデッドゾーンを導出する
　請求項９または請求項１０記載の映像符号化方法。
　所定サイズよりも大きいブロックサイズの直交変換係数の各周波数成分に対応するデッドゾーン係数を設定し、
　設定されたデッドゾーン係数から導出されるデッドゾーン以下である絶対値の直交変換係数を０に変換する直交変換係数変換処理を実行し、
　前記直交変換係数変換処理による直交変換係数を量子化する
　ことを特徴とする映像符号化方法。
　直交変換係数に対して、複数の周波数成分について同じ値の量子化重み付け係数を利用して直交変換係数を量子化する
　請求項１２記載の映像符号化方法。
　周波数成分に応じて値が異なるデッドゾーンを導出する
　請求項１２または請求項１３記載の映像符号化方法。
　コンピュータに、
　変換スキップモードが有効であるか否かに基づいて直交変換係数の切り捨てに用いるデッドゾーン係数を選択する処理と、
　絶対値が、選択されたデッドゾーン係数から導出されるデッドゾーン以下である直交変換係数を０に変換する直交変換係数変換処理と、
　前記直交変換係数変換処理による直交変換係数を量子化する処理と
　を実行させるための映像符号化プログラム。
　コンピュータに、
　変換スキップモードが有効であるときでも無効であるときでも同じ量子化重み付け係数を利用して直交変換係数を量子化させる
　請求項１５記載の映像符号化プログラム。
　コンピュータに、
　変換スキップモードが無効である場合に、固定値になり、変換スキップモードが有効である場合に、周波数成分が高周波になるほど値が大きくなるデッドゾーンを導出させる
　請求項１５または請求項１６記載の映像符号化プログラム。
　コンピュータに、
　所定サイズよりも大きいブロックサイズの直交変換係数の各周波数成分に対応するデッドゾーン係数を設定する処理と、
　設定されたデッドゾーン係数から導出されるデッドゾーン以下である絶対値の直交変換係数を０に変換する直交変換係数変換処理と、
　前記直交変換係数変換処理による直交変換係数を量子化する処理と
　を実行させるための映像符号化プログラム。
　コンピュータに、
　直交変換係数に対して、複数の周波数成分について同じ値の量子化重み付け係数を利用して直交変換係数を量子化させる
　請求項１８記載の映像符号化プログラム。
　コンピュータに、
　周波数成分に応じて値が異なるデッドゾーンを導出させる
　請求項１８または請求項１９記載の映像符号化プログラム。