JPWO2014054267A1 - 画像符号化装置及び画像符号化方法 - Google Patents

画像符号化装置及び画像符号化方法 Download PDF

Info

Publication number
JPWO2014054267A1
JPWO2014054267A1 JP2014539606A JP2014539606A JPWO2014054267A1 JP WO2014054267 A1 JPWO2014054267 A1 JP WO2014054267A1 JP 2014539606 A JP2014539606 A JP 2014539606A JP 2014539606 A JP2014539606 A JP 2014539606A JP WO2014054267 A1 JPWO2014054267 A1 JP WO2014054267A1
Authority
JP
Japan
Prior art keywords
intra prediction
prediction
block
prediction mode
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014539606A
Other languages
English (en)
Inventor
和真 榊原
和真 榊原
安倍 清史
清史 安倍
秀之 大古瀬
秀之 大古瀬
耕治 有村
耕治 有村
荒川 博
博 荒川
一仁 木村
一仁 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Publication of JPWO2014054267A1 publication Critical patent/JPWO2014054267A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel

Abstract

入力画像を符号化する画像符号化装置(100)であって、入力画像の符号化対象ブロックを複数のサブブロックに分割するピクチャ分割部(102)と、分割されたサブブロック毎にイントラ予測を行うイントラ予測部(109)とを備え、イントラ予測部(109)は、予測対象のサブブロックのサイズが所定のサイズ以下であるか否かを判定する判定部(120)と、予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、ブロックサイズに依存することなく予め規定されたM個(Mは、2以上の自然数)のイントラ予測モードの数より少ないm個(mは、自然数)のイントラ予測モードを予測モード候補として決定する決定部(121)と、決定された予測モード候補の中から1つのイントラ予測モードを選択し、選択したイントラ予測モードを用いて予測対象のサブブロックのイントラ予測を行う予測部(122)とを備える。

Description

本開示は、画像符号化装置及び画像符号化方法に関する。
現在、H.264の次の世代の動画像符号化規格であるHigh Efficiency Video Coding(HEVC)が策定中である。このHEVCでは、図1に示すように、イントラ予測時において選択可能なイントラ予測モードが35種類ある。HEVCでは、この35種類の中から選択されるイントラ予測モードを用いて符号化を実施する。
しかし、イントラ予測を実行するブロックサイズが4×4画素のように小さいサイズである場合、隣り合うイントラ予測モードでは、同じ参照画素を利用してイントラ予測するものが存在する。同じ参照画素を利用してイントラ予測する場合、イントラ予測モードが異なる場合であっても、結果として得られる差分画像信号の値はほとんど変わらないものとなる。
Joint Collaborative Team on Video Coding (JCT−VC)of ITU −T SG16 WP3 andISO/IEC JTC1/SC29/WG、10th Meeting Stockholm、SE、11−20 July 2012、Document JCTVC−J1003_d7
上記のように多くのイントラ予測モードを利用できる場合、詳細な予測が可能となるため画質又は符号化効率が向上する。しかし、例えば、符号化対象のサブブロックサイズが4×4画素のように小さいサイズである場合、イントラ予測の結果として得られる差分画像信号の値にほとんど変化がない場合、画質又は符号化効率の大きな向上は見込めない。この場合は、単にイントラ予測の処理量だけが増加することになる。
そこで本開示は、符号化効率の悪化を抑制し、かつ、イントラ予測に必要な処理量を削減することができる画像符号化装置及び画像符号化方法を提供する。
本開示における画像符号化装置は、入力画像を符号化する画像符号化装置であって、入力画像の符号化対象ブロックを複数のサブブロックに分割する分割部と、分割部によって分割されたサブブロック毎にイントラ予測を行うイントラ予測部とを備え、イントラ予測部は、予測対象のサブブロックのサイズが所定のサイズ以下であるか否かを判定する判定部と、判定部によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、ブロックサイズに依存することなく予め規定されたM個(Mは、2以上の自然数)のイントラ予測モードの数より少ないm個(mは、自然数)のイントラ予測モードを予測モード候補として決定する決定部と、決定部によって決定された予測モード候補の中から1つのイントラ予測モードを選択し、選択したイントラ予測モードを用いて予測対象のサブブロックのイントラ予測を行う予測部とを備える。
本開示における画像符号化装置及び画像符号化方法は、符号化効率の悪化を抑制し、かつ、イントラ予測に必要な処理量を削減することができる。
図1は、HEVC規格におけるイントラ予測モードの種類を示す図である。 図2は、本実施の形態に係る画像符号化装置の構成を示すブロック図である。 図3は、本実施の形態に係るイントラ予測部の構成を示すブロック図である。 図4は、本実施の形態に係るイントラ予測処理の動作を示すフローチャートである。 図5は、本実施の形態に係る予測対象のサブブロックの画素位置を示す図である。 図6は、本実施の形態に係る4×4画素のサブブロックをイントラ予測する際、最も右下の画素において参照する周辺画素を示す図である。 図7Aは、本実施の形態に係る識別番号を利用してイントラ予測モードの数を制限する動作を説明するための図である。 図7Bは、本実施の形態に係る識別番号を利用してイントラ予測モードの数を制限する動作を説明するための図である。 図8は、本実施の形態の変形例1に係る予測方向がなす角度を利用してイントラ予測モードの数を制限する動作を説明するための図である。 図9は、本実施の形態の変形例2に係るPlanar予測モード及びDC予測モードが利用できるようにイントラ予測モードの数を制限する動作を説明するための図である。 図10は、本実施の形態の変形例3に係る水平方向及び垂直方向のイントラ予測モードが利用できるようにイントラ予測モードの数を制限する動作を説明するための図である。 図11は、本実施の形態の変形例4に係るイントラ予測モードの利用頻度に基づいてイントラ予測モードの数を制限する動作を説明するための図である。 図12は、本実施の形態の変形例5に係るエッジに基づいてイントラ予測モードの数を制限する動作を示すフローチャートである。 図13は、本実施の形態の変形例6に係る2つのイントラ予測モードにおいて利用する参照画素の組み合わせを示す図である。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。ただし、必要以上に詳細な説明は省略する場合がある。例えば、すでによく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、発明者らは、当業者が本開示を十分に理解するために添付図面及び以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
(実施の形態)
以下、図1〜図13を用いて、本実施の形態を説明する。説明の便宜上、HEVCを用いて符号化する際の動作を説明する。
[画像符号化装置の構成]
図2は、本実施の形態に係る画像符号化装置100のブロック図である。
画像符号化装置100は、ピクチャ単位で入力された動画像をブロック(符号化対象ブロック)に分割し、ブロック単位で符号化処理を行うことで、符号列を生成する。なお、上記ブロックには複数のサブブロックが含まれる。画像符号化装置100が有する構成要素は、ブロック単位又はサブブロック単位で処理する。
図2に示す画像符号化装置100は、ピクチャバッファ101と、ピクチャ分割部102と、減算部103と、予測残差符号化部104と、係数符号列生成部105と、予測残差復号化部106と、加算部107と、予測画像生成部108と、量子化値決定部114と、ヘッダ符号列生成部115とを備える。なお、予測画像生成部108は、イントラ予測部109と、ループフィルタ110と、フレームメモリ111と、インター予測部112と、選択部113とを備える。
画像符号化装置100は、入力画像をHEVCの規格に基づいて圧縮符号化し、符号列を生成して出力する。
ピクチャバッファ101は、取得部の一例であり、入力画像を取得し、記憶媒体に一時的に記憶する。例えば、ピクチャバッファ101は、表示を行う順にピクチャ単位で入力される入力画像を、符号化を行う順にピクチャの並び替えを行って蓄積する。ピクチャバッファ101における記憶媒体は、DRAM(Dynamic Random Access Memory)メモリなど、入力画像を記憶できる記憶媒体であればどのようなものを利用しても構わない。
ピクチャ分割部102は、入力画像の符号化対象ブロックを複数のサブブロックに分割する分割部の一例である。ピクチャ分割部102は、減算部103又は量子化値決定部114からの読出し命令を受け付けた場合、ピクチャバッファ101から入力画像を取得する。そして、ピクチャ分割部102は、読出し命令に対応する画像信号を減算部103に出力する。
このとき、各々のピクチャは、以降の符号化処理単位であるコーディングユニット(CU)と呼ばれる複数の画素から構成される符号化単位に分割される。CUは、符号化対象ブロックの一例であり、例えば、64×64画素のブロック、32×32画素のブロック、16×16画素のブロックなどからなる。
減算部103は、ピクチャ分割部102から出力される対象ブロックと、予測画像生成部108から出力される予測画像であって、対象ブロックの予測画像との差分を算出することで、差分画像信号を生成する。例えば、減算部103は、符号化対象ブロック毎に差分を算出する。減算部103は、差分画像信号を予測残差符号化部104に出力する。つまり、減算部103は、ピクチャ分割部102から読み出された画像信号と、予測画像生成部108から出力される予測画像信号との差分値である差分画像信号を生成し、予測残差符号化部104に出力する。
予測残差符号化部104は、減算部103から出力される差分画像信号を直交変換することで、直交変換係数を生成する。予測残差符号化部104は、差分画像信号を直交変換する場合、直交変換用のサブブロック単位で処理する。ここで、直交変換用のサブブロックは、トランスフォームユニット(TU)と呼ばれる複数の画素から構成される直交変換処理単位である。例えば、直交変換用のサブブロック(TU)は、例えば、32×32画素のブロック、16×16画素のブロック、8×8画素のブロック、4×4画素のブロックなどからなる。
予測残差符号化部104は、さらに、得られた直交変換係数の各周波数成分を量子化することで、量子化係数を生成する。そして、予測残差符号化部104は、量子化係数を係数符号列生成部105及び予測残差復号化部106に出力する。なお、予測残差符号化部104は、量子化値決定部114によって決定された量子化値信号を用いて、直交変換係数を量子化する。
係数符号列生成部105は、予測残差符号化部104から出力される量子化係数を可変長符号化する。係数符号列生成部105は、可変長符号化によって生成される符号列をヘッダ符号列生成部115が生成した符号列に続けて追記する。これにより、係数符号列生成部105は、出力用の符号列信号を生成する。
予測残差復号化部106は、予測残差符号化部104から出力される量子化係数を逆量子化及び逆直交変換することで、残差復号化信号を再構成する。予測残差復号化部106は、再構成して得られる残差復号化信号を加算部107に出力する。
加算部107は、予測残差復号化部106から出力される残差復号化信号と予測画像生成部108から出力される予測画像とを加算することで、再構成画像信号を生成する。そして、加算部107は、再構成画像信号をイントラ予測部109及びループフィルタ110に出力する。
予測画像生成部108は、少なくとも加算部107から出力される再構成画像信号に基づいて、ピクチャ分割部102から出力されるブロックに対する予測画像を生成する。予測画像生成部108は、予測画像を生成する場合、イントラ予測又はインター予測を用いる。
なお、予測画像生成部108は、予測用のサブブロック単位で予測画像を生成する。ここで、予測用のサブブロックとは、プレディクションユニット(PU)と呼ばれる複数の画素から構成される予測処理単位である。例えば、予測用のサブブロック(PU)は、ピクチャ分割部102が出力する符号化対象ブロックを少なくとも1つ以上に分割して生成される領域を示す。例えば、PUは、64×64画素のブロック、32×32画素のブロック、16×16画素のブロック、8×8画素のブロック、4×4画素のブロックなどからなる。
また、予測画像生成部108は、ピクチャ分割部102が出力する符号化対象ブロック単位でイントラ予測又はインター予測を切り替える。つまり、符号化対象ブロック内に属するサブブロックには、イントラ予測及びインター予測のうちいずれか一方が適用される。
予測画像生成部108は、イントラ予測部109と、ループフィルタ110と、フレームメモリ111と、インター予測部112と、選択部113とを備える。
イントラ予測部109は、既に符号化済みのブロックにおける画素データであって、符号化対象ブロック周辺に位置する画素データを用いて、符号化対象ブロックの予測画像を予測用のサブブロック毎に生成する。具体的には、イントラ予測部109は、少なくとも符号化対象ブロックに隣接する既に符号化済みの画素データに基づいてイントラ予測を行うことで、予測画像を生成する。
イントラ予測部109は、画像符号化装置100で想定している符号化規格であるHEVCに規定される35個のイントラ予測モードから1つのイントラ予測モードを選択する。さらに、イントラ予測部109は、選択したイントラ予測モードに基づいてイントラ予測を行うことで、予測対象のサブブロックの予測画像を生成する。イントラ予測部109は、サブブロック毎に予測画像を生成した結果として得られる予測画像であって、ピクチャ分割部102が出力するブロックの予測画像を、減算部103及び加算部107に出力する。
なお、イントラ予測部109のより詳細な構成及び動作については、後で説明する。
ループフィルタ110は、加算部107から出力される再構成画像信号にフィルタ処理を行う。例えば、ループフィルタ110は、再構成画像信号に対して、ブロックノイズを軽減するフィルタ処理を施す。ループフィルタ110は、フィルタ処理された再構成画像信号をフレームメモリ111に出力する。
フレームメモリ111は、ループフィルタ110から出力されるフィルタ処理後の再構成画像信号を蓄積する。再構成画像信号は、現在符号化対象となっているピクチャ以降のピクチャの符号化における予測符号化処理に用いられる。つまり、再構成画像信号は、現在、符号化対象となっているピクチャ以降のピクチャを符号化する際に、インター予測を用いて予測画像を生成する際の画素データとして利用される。フレームメモリ111は、インター予測部112からの読出し命令に応じて、格納している再構成画像信号を画素データとしてインター予測部112に出力する。
インター予測部112は、フレームメモリ111に格納されている再構成画像信号を参照画像として用いてインター予測を行うことで、サブブロック毎に予測画像信号を生成する。インター予測を行う際は、フレームメモリ111に蓄積される既に符号化済みの過去のピクチャの再構成画像信号を用いる。インター予測部112は、生成した予測画像信号を減算部103及び加算部107に出力する。
選択部113は、予測の結果得られる差分画像信号の符号量又は予測値に基づいて、イントラ予測及びインター予測のうちいずれか一方を選択する。具体的には、選択部113は、イントラ予測で得られる差分画像信号の符号量又は予測値が少ない又は小さい場合、イントラ予測を選択する。イントラ予測で得られる差分画像信号の符号量又は予測値が多い又は大きい場合、選択部113は、インター予測を選択する。
なお、予測画像生成部108は、インター予測を使わなくてもよい。このようにすれば、予測画像生成部108は、静止画像など、イントラ予測のみを用いる場合に処理構成を単純化することができる。
量子化値決定部114は、ピクチャ分割部102に格納されるピクチャに基づいて、予測残差符号化部104において差分画像信号を量子化する際の量子化値(量子化幅)を設定する。量子化値決定部114は、設定した量子化値を予測残差符号化部104及びヘッダ符号列生成部115に出力する。なお、量子化値決定部114における量子化値の設定方法は、符号列信号のビットレートが目標とするビットレートに近づくように量子化値を設定する、いわゆるレート制御に基づく量子化値の設定方法を利用しても構わない。
ヘッダ符号列生成部115は、予測画像生成部108が出力する予測情報信号と、量子化値決定部114が出力する量子化値信号と、その他の符号化制御に関する制御情報とを可変長符号化することで符号列を生成する。なお、予測情報には、例えば、イントラ予測モード、インター予測モード、動きベクトル、参照ピクチャを示す情報などが含まれる。また、制御情報は、係数符号列生成部105における処理前までに取得可能な情報であって、ブロックの符号化時に適用した符号化条件を示す情報である。例えば、制御情報には、ピクチャ符号化タイプ又はブロック分割情報などが含まれる。例えば、ピクチャ符号化タイプとは、Iピクチャ、Pピクチャ又はBピクチャを示す情報、又は、ブロックに適用された予測方法に関する情報などを含む情報である。また、ブロック分割情報は、例えば、直交変換時におけるサブブロックの分割情報、又は、予測画像生成部108におけるサブブロックの分割情報などを含む情報である。
[イントラ予測部の構成]
続いて、イントラ予測部109のより詳細な構成について説明する。
図3は、本実施の形態に係るイントラ予測部109を示すブロック図である。イントラ予測部109は、判定部120と、決定部121と、予測部122とを備える。
判定部120は、予測対象のサブブロックのサイズが所定のサイズ以下であるか否かを判定する。言い換えると、判定部120は、予測対象のサブブロックのサイズが小さいか否かを判定する。具体的には、所定のサイズは、4×4画素であり、判定部120は、予測対象のサブブロックが4×4画素以下のサイズである場合に、当該予測対象のサブブロックのサイズが小さいと判定する。より具体的には、判定部120は、ピクチャ分割部102から取得した予測対象のサブブロックが4×4画素である場合にのみ、当該予測対象のサブブロックのサイズが小さいと判定する。
なお、所定のサイズは、これに限られない。例えば、所定のサイズは、8×8画素のサイズでもよい。つまり、判定部120は、予測対象のサブブロックのサイズが8×8画素以下である場合に、当該予測対象のサブブロックが小さいと判定してもよい。
決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、ブロックサイズに依存することなく予め規定されたM個(Mは、2以上の自然数)のイントラ予測モードの数より少ないm個(mは、自然数)のイントラ予測モードを予測モード候補として決定する。また、決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズより大きいと判定された場合には、ブロックサイズに依存することなく予め規定されたM個のイントラ予測モードを予測モード候補として決定する。
ここで、M個のイントラ予測モードは、所定の符号化規格によって規定されたイントラ予測モードである。具体的には、M個のイントラ予測モードは、HEVCによって規定されている。図1に示すように、HEVCによって規定されたイントラ予測モードの個数は、35である。すなわち、M=35である。
なお、決定部121によるm個のイントラ予測モードの決定方法については、後で具体例を挙げながら説明する。
予測部122は、決定部121によって決定された予測モード候補の中から1つの予測モードを選択し、選択したイントラ予測モードを用いて予測対象のサブブロックのイントラ予測を行う。例えば、予測部122は、加算部107から出力された符号化済みの画素データを用いてイントラ予測を行う。予測部122は、イントラ予測を行うことで、予測画像を生成し、生成した予測画像を選択部113に出力する。
[イントラ予測処理]
以下、図面を参照しながら、本実施の形態に係る画像符号化方法について説明する。特に、イントラ予測部109におけるイントラ予測動作を中心に説明する。
図4は、本実施の形態に係るイントラ予測処理の動作を示すフローチャートである。
まず、ピクチャ分割部102は、入力画像の符号化対象ブロックを複数のサブブロックに分割する(S100)。イントラ予測部109は、サブブロック毎にイントラ予測を行う。
判定部120は、予測対象のサブブロックのサイズが所定のサイズ以下であるか否かを判定する(S110)。例えば、サイズの大小を判定する基準となる予め設定されたサブブロックサイズ(所定のサイズ)は、4×4画素サイズである。なお、予め設定されたサブブロックサイズは、上記のサブブロックサイズに限定するものではなく、8×8画素サイズなど、設計者の思想に応じて設定できる。以下、説明の便宜上、予め設定されたサブブロックサイズは、4×4画素サイズとする。
予測対象のサブブロックのサイズが4×4画素サイズと判定された場合(S110でYes)、決定部121は、M個のイントラ予測モードの数より少ないm個のイントラ予測モードを予測モード候補として決定する(S120)。言い換えると、決定部121は、M(M=35)個のイントラ予測モードをm個に制限する。このように、イントラ予測モードの数をm個に絞り込むことで、(35−m)個のイントラ予測に要する処理時間を削減することができる。
以下では、制限されたm個のイントラ予測モードのそれぞれについて、予測部122は、イントラ予測(S130)及びコスト計算(S140)を行う。
具体的には、予測部122は、制限されたm個のイントラ予測モードの1つである対象予測モードを用いてイントラ予測を行う(S130)。つまり、予測部122は、対象予測モードを用いて、予測対象のサブブロック内の画素毎に予測値を算出する。具体的な予測値の算出方法は、後で説明する。
予測部122は、算出した予測値に基づいて、対象予測モードの符号化コストを計算する(S140)。例えば、予測部122は、対象予測モードを用いて算出した予測値と、符号化対象ブロックに含まれる入力画像の画素データであって、予測対象のサブブロックに対応する画素データとの差分値を、符号化コストとして算出する。
そして、予測部122は、m個のイントラ予測モードの中から異なる予測モードを新たな対象予測モードとしてイントラ予測(S130)及びコスト計算(S140)を繰り返す。これにより、m個のイントラ予測モードのそれぞれについて、予測値と符号化コストとが算出される。
予測部122は、m個のイントラ予測モードの中から、算出した符号化コストに基づいて、適切なイントラ予測モードを決定する(S170)。例えば、予測部122は、符号化コストとして差分値を算出している場合、当該差分値が最も小さくなるイントラ予測モードを最適なイントラ予測モードとして決定する。
そして、予測部122は、決定したイントラ予測モードを用いてイントラ予測を行うことで、予測値を算出する(S180)。そして、予測部122は、算出した予測値を選択部113に出力する。なお、予測部122は、最適なイントラ予測モードを決定する際(S130及びS140)にすでに予測値を算出している場合、すでに算出された予測値を選択部113に出力してもよい。
一方、予測対象のサブブロックのサイズが4×4画素サイズよりも大きいと判定された場合(S110でNo)、予測部122は、全イントラ予測モードについて、すなわち、35個のイントラ予測モードについて、イントラ予測(S150)及びコスト計算(S160)を行う。
具体的には、予測部122は、M個のイントラ予測モードの1つである対象予測モードを用いてイントラ予測を行う(S150)。そして、予測部122は、算出した予測値に基づいて、対象予測モードの符号化コストを計算する(S160)。例えば、予測部122は、対象予測モードを用いて算出した予測値と、符号化対象ブロックに含まれる入力画像の画素データであって、予測対象のサブブロックに対応する画素データとの差分値を、符号化コストとして算出する。
そして、予測部122は、M個のイントラ予測モードの中から異なる予測モードを新たな対象予測モードとしてイントラ予測(S150)及びコスト計算(S160)を繰り返す。これにより、M個のイントラ予測モードのそれぞれについて、予測値と符号化コストが算出される。
以降、制限されたm個のイントラ予測モードの場合と同様に、予測部122は、適切なイントラ予測モードを決定し(S170)、決定したイントラ予測モードを用いて予測値を算出して(S180)、算出した予測値を選択部113に出力する。なお、予測部122は、最適なイントラ予測モードを決定する際(S150及びS160)にすでに予測値を算出している場合、すでに算出された予測値を選択部113に出力してもよい。
[イントラ予測における予測値の算出方法]
以下、図面を参照しながらイントラ予測時における予測値の算出方法について説明する。
以下、説明の便宜上、HEVCにおけるイントラ予測について説明する。
HEVCでは、図1に示すように、予測対象のブロックサイズに依存することなく、35種類のイントラ予測モードが規定されている。具体的には、HEVCでは、Planar予測モードと、DC予測モードと、33個の予測方向モードとが定義されている。
HEVCでは、例えば、予測対象のブロックサイズが4×4画素の場合には、35個のイントラ予測モードが利用可能であり、予測対象のブロックサイズが8×8画素の場合にも、35個のイントラ予測モードが利用可能である。つまり、HEVCでは、イントラ予測を行う場合、予測対象のブロックサイズがどのようなサイズであっても、35個のイントラ予測モードが利用可能であり、当該35個のイントラ予測モードから1つのイントラ予測モードを選択することができる。このように、35個のイントラ予測モードが予測モード候補として定義されているので、イントラ予測部109は、イントラ予測を行う際、35個のイントラ予測モードの中からいずれか1つを選択する。
図5は、本実施の形態に係る予測対象のサブブロックの画素位置を示す図である。
図5に示すように、水平方向にx軸、垂直方向にy軸を定義し、それぞれ右方向及び下方向に正(+)と定義する。以下では、座標(x,y)に位置する画素を、画素(x,y)と表現し、画素(x,y)の画素値をp(x,y)と表現する。なお、予測対象のサブブロックのサイズが、4×4画素の場合、図5に示すNは、N=3である。
図6は、本実施の形態に係る4×4画素のサブブロックをイントラ予測する際、最も右下の画素において参照する周辺画素を示す図である。説明の便宜上、4×4画素のうち最も右下の画素、すなわち、画素(3,3)について説明するが、それ以外の位置の画素についても同様の方法で予測が行われる。
イントラ予測部109は、以下のイントラ予測モードを利用して予測値を算出する。
1.垂直方向のイントラ予測モード
予測対象画素の真上に位置する画素の画素値をそのまま予測値として利用するイントラ予測モードである。例えば、垂直方向のイントラ予測モードを用いた場合、画素(3,3)の予測値は、画素(3,−1)の画素値p(3,−1)になる。
2.水平方向のイントラ予測モード
予測対象画素の真横に位置する画素の画素値をそのまま予測値として利用するイントラ予測モードである。例えば、水平方向のイントラ予測モードを用いた場合、画素(3,3)の予測値は、画素(−1,3)の画素値p(−1,3)になる。
3.DC予測モード
周辺画素の平均値を利用するイントラ予測モードである。例えば、DC予測モードを用いた場合、画素(3,3)の予測値は、周辺画素p(−1,0)、p(−1,1)、p(−1,2)、p(−1,3)、p(0,−1)、p(1,−1)、p(2,−1)、p(3,−1)の平均値になる。
なお、DC予測モードの場合、4×4画素に含まれる画素(3,3)以外の画素における予測値も画素(3,3)で算出された予測値と同じ値となる。
4.斜め方向のイントラ予測モード
斜めの矢印で指定された方向にある隣接した1画素又は2画素を参照し、(式1)又は(式2)を利用する斜め方向の予測モードである。
(式1) S(x,y)=p(a)
(式2) S(x,y)=[c×p(a)+d×p(b)+16]>>5
例えば、図6に示す方向200の場合、参照画素は、画素(7,−1)である。また、例えば、図6に示す方向201の場合、参照画素は、画素(5,−1)と画素(6,−1)とである。
ここで、(式1)は、画素位置(x,y)におけるイントラ予測の予測値S(x,y)を求める式であって、参照画素が1画素である場合に利用する式である。ここで、aは、予測方向から設定される参照画素の位置を示す値であり、p(a)は当該参照画素の値である。
また、(式2)は、画素位置(x,y)におけるイントラ予測の予測値S(x,y)を求める別の式であり、参照画素が2画素である場合に利用する式である。ここで、a及びbは、予測方向から設定される2つの参照画素の位置を示す値であり、p(a)及びp(b)は、隣り合う2つの参照画素の値である。また、c及びdは、各々の参照画素に乗ぜられる重み付け値である。
なお、HEVCでは、互いに方向が異なる複数の斜め方向のイントラ予測モードが規定されている。つまり、利用するイントラ予測モードによって、利用する画素(すなわち、a及びbの値)及び重み付け値(すなわち、c及びdの値)が異なる。
5.planar予測モード
4画素を用いた内挿予測(重み付け加算)を行う予測モードである。例えば、画素(3,3)の予測値は、4つの参照画素の画素値p(−1,3)、p(3,−1)、p(−1,4)、p(4,−1)の重み付け平均値である。
なお、上記においては4×4画素に対してイントラ予測し、予測値を算出する動作を説明したが、8×8画素など、他のサブブロックサイズに対してイントラ予測し、予測値を算出する際も同様の考えで算出することができる。なお、斜め方向の予測モードの場合、サブブロックサイズの大きさによって、同じイントラ予測モードであっても利用する画素が異なってくる。
[イントラ予測モードの数の制限方法]
以下、イントラ予測モードの数の制限方法、すなわち、予測モード候補の決定方法について、図面を参照しながら説明する。説明の便宜上、HEVCの符号化規格に基づいて説明する。
図7A及び図7Bは、本実施の形態に係る識別番号を利用してイントラ予測モードの数を制限する動作を説明するための図である。具体的には、図7Aは、イントラ予測モードとその使用可否とを対応付けた表を示している。図7Bは、使用不可のイントラ予測モードと、使用可能なイントラ予測モードとの関係を示す図である。なお、説明の便宜上、図7Bにおける破線の矢印は、使用不可のイントラ予測モードを示し、また、実線の矢印は、使用可能なイントラ予測モードを示している。これは、以降の図においても同様である。
決定部121は、イントラ予測モードの識別番号が等間隔になるm個のイントラ予測モードを予測モード候補として決定する。識別番号は、M個のイントラ予測モードを一意に識別するために、M個のイントラ予測モードのそれぞれに付された番号である。具体的には、識別番号は、図1に示すような0〜34の番号である。決定部121は、決定後のm個のイントラ予測モードの識別番号が等間隔になるように、すなわち、識別番号が等差数列を形成するようにm個のイントラ予測モードを決定する。
例えば、決定部121は、図7A及び図7Bに示すように、符号化規格に規定されるイントラ予測モードのうち、偶数番号で規定されるイントラ予測モードを使用可能にし、かつ、奇数番号で規定されるイントラ予測モードを使用不可にする。すなわち、決定部121は、偶数番号で規定されるイントラ予測モードを予測モード候補として決定する。なお、ここで、0は、偶数である。
なお、M個のイントラ予測モードの中から、どのm個のイントラ予測モードを予測モード候補として選択するかは、予め定められている。すなわち、m個のイントラ予測モードの種類、及び、個数(mの値)は、静的に定められている。例えば、静止画、動画像、自然画像、文字画像などの入力画像の種別に依存することなく、かつ、符号化対象ブロックのサイズ、予測対象のサブブロックサイズなどの符号化処理の処理単位のサイズに依存することなく、m個のイントラ予測モードの種類、及び、個数が定められている。具体的には、予測対象サブブロックのサイズが小さいと判定された場合には、偶数番号で規定されるイントラ予測モードを予測モード候補として決定することが、予め定められている。
イントラ予測モードのうち、水平方向、垂直方向及び斜め方向のイントラ予測モードでは、予測対象画素から周辺のサブブロックに向けて、選択したイントラ予測モードが示す予測方向にある周辺画素を参照する。したがって、4×4画素のように予測対象のサブブロックのサイズが小さい場合、イントラ予測モードが示す予測方向がなす角度が従来の符号化規格であるH.264と比べて小さいために、同じ周辺画素を参照する可能性がある。このように、予測対象のサブブロックが小さい程、識別番号が隣接するイントラ予測モードのそれぞれで参照する画素が重なってしまう。
これを解決するために、図7A及び図7Bに示すように、決定部121は、35個のイントラ予測モードの中で、偶数番号が設定されているイントラ予測モードのみを予測モード候補として決定する。このようにすれば、隣接するイントラ予測モードが示す方向が成す角度を大きくすることができる。よって、予測時に利用する周辺画素の重複を低減することができる。さらに、自然画でよく用いられる縦線及び横線を重視する割合を保ったまま、イントラ予測モードの数を制限することができる。
なお、制限するイントラ予測モードは、偶数番号でなく、奇数番号でもよい。又は、1以上の間隔となってもよい。
また、決定部121は、予測モード候補として決定されるm個のイントラ予測モードの種類及び個数は、動的に決定してもよい。
[まとめ]
以上のように、本実施の形態に係る画像符号化装置100は、入力画像を符号化する画像符号化装置100であって、入力画像の符号化対象ブロックを複数のサブブロックに分割するピクチャ分割部102と、ピクチャ分割部102によって分割されたサブブロック毎にイントラ予測を行うイントラ予測部109とを備え、イントラ予測部109は、予測対象のサブブロックのサイズが所定のサイズ以下であるか否かを判定する判定部120と、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、ブロックサイズに依存することなく予め規定されたM個(Mは、2以上の自然数)のイントラ予測モードの数より少ないm個(mは、自然数)のイントラ予測モードを予測モード候補として決定する決定部121と、決定部121によって決定された予測モード候補の中から1つのイントラ予測モードを選択し、選択したイントラ予測モードを用いて前記予測対象のサブブロックのイントラ予測を行う予測部122とを備える。
これにより、画像符号化装置100は、イントラ予測対象のサブブロックサイズが例えば4×4画素などの小さいブロックサイズである場合、利用できるイントラ予測モードの数を制限することができる。小さいサブブロックサイズである場合、隣接するイントラ予測モードを利用した結果、得られる予測値はほとんど変わらない。そのため、このようなイントラ予測モードを制限したとしても、符号化効率をほとんど落とすことなくイントラ予測に要する処理量を削減することができる。具体的には、本開示に係る画像符号化装置100では、利用可能なイントラ予測モードの数をM個からm個に制限するので、M−m個のイントラ予測モードを用いたイントラ予測に要する処理量を削減することができる。
さらに、決定部121は、イントラ予測モードの識別番号が等間隔になるm個のイントラ予測モードを前記予測モード候補として決定してもよい。これにより、簡易な制御方法で、予測対象のサブブロックのサイズが小さい場合に利用可能なイントラ予測モードを決定することができる。また、自然画でよく用いられる縦方向、横方向を重視するイントラ予測モード数の割合を保ったまま制限することができる。そのため、入力画像の特徴がどのようなものであっても、符号化効率を極端に悪化させることなく、イントラ予測に要する処理量を削減することができる。
(実施の形態の変形例)
以下、図面を参照しながら、上記とは異なるイントラ予測モードの数の制限方法について説明する。
(変形例1)
変形例1に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測方向がなす角度が等間隔になる少なくともm−2個のイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定する。
図8は、本実施の形態の変形例1に係る予測方向がなす角度を利用してイントラ予測モードの数を制限する動作を説明するための図である。
HEVCでは、互いに異なる予測方向を持つ33個のイントラ予測モード(方向予測モード)が定義されている。決定部121は、決定後の方向予測モードがなす予測方向の角度が等間隔になるように、少なくともm−2個の方向予測モードを含むm個のイントラ予測モードを予測モード候補として決定する。
例えば、図8に示すように、決定部121は、33個の方向予測モードの中から決定された9個の方向予測モードと、DC予測モードと、Planar予測モードとの11個のイントラ予測モードを予測モード候補として決定する。具体的には、決定部121は、イントラ予測モードの予測方向がなす角度が約22.5度毎になるように、9個の方向予測モードを決定する。つまり、決定後のイントラ予測モードにおいては、隣接する方向予測モードのなす角度が等しくなるように、決定部121は、少なくともm−2個の方向予測モードを決定する。
このようにすれば、予測モード候補の数(mの値)を少なくした場合でも、制限後のイントラ予測モードは全方位を網羅できる。すなわち、特定の方向に対するイントラ予測モードがすべて制限されることがない。
なお、イントラ予測モードの方向が成す角度は、約22.5度よりも大きくても小さくてもよい。なお、角度が大きい場合は、利用できるイントラ予測モードが少なくなる。つまり、予測精度が低下することにより、出力される符号列の符号量が大きくなる可能性があるが、イントラ予測に要する処理量を低減することができる。一方で、角度が小さい場合は、利用できるイントラ予測モードが多くなる。つまり、イントラ予測に要する処理量は増加するが、予測精度が向上することにより、出力される符号列の符号量を小さくすることができる。
(変形例2)
変形例2に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、Planar予測モード及びDC予測モードを含むm個のイントラ予測モードを予測モード候補として決定する。
図9は、本実施の形態の変形例2に係るPlanar予測モード及びDC予測モードが利用できるようにイントラ予測モードの数を制限する動作を説明するための図である。
HEVCでは、33個の方向予測モードの他に、Planar予測モードとDC予測モードとが規定されている。このとき、例えば、単にイントラ予測モードの識別番号に基づき制限した場合、図7BのようにDC予測モードが予測モード候補として利用できなくなる可能性がある。
決定部121は、図9に示すように、Planar予測モード及びDC予測モードが利用できるように、Planar予測モードとDC予測モードとを含むm個のイントラ予測モードを予測モード候補として決定する。これにより、予測の方向性に依存してしまうモードでは対応できない特徴を有する画像に対応することができる。つまり、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
なお、変形例2に係る決定部121は、Planar予測モード及びDC予測モードを除く、残りのm−2個のイントラ予測モードをどのように決定してもよい。例えば、決定部121は、識別番号が等間隔になるm−2個のイントラ予測モードを残りの予測モード候補として決定してもよい。あるいは、決定部121は、予測方向がなす角度が等間隔になるm−2個のイントラ予測モードを残りの予測モード候補として決定してもよい。
(変形例3)
変形例3に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測方向が水平方向及び垂直方向であるイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定する。
図10は、本実施の形態の変形例3に係る水平方向及び垂直方向のイントラ予測モードが利用できるようにイントラ予測モードの数を制限する動作を説明するための図である。
例えば、単に識別番号に基づいてイントラ予測モードを制限した場合、図10の(a)に示すように、予測方向が水平方向又は垂直方向であるイントラ予測モードが予測モード候補として利用できなくなる場合がある。
決定部121は、図10の(b)に示すように、予測方向が水平方向及び垂直方向であるイントラ予測モードが利用できるように、予測方向が水平方向及び垂直方向であるイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定する。これにより、イントラ予測部109は、縦線及び横線が多い人工的な画像の予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
なお、変形例3に係る決定部121は、予測方向が水平方向及び垂直方向であるイントラ予測モードを除く、残りのm−2個のイントラ予測モードをどのように決定してもよい。例えば、決定部121は、識別番号が等間隔になるm−2個のイントラ予測モードを残りの予測モード候補として決定してもよい。あるいは、決定部121は、予測方向がなす角度が等間隔になるm−2個のイントラ予測モードを残りの予測モード候補として決定してもよい。
(変形例4)
変形例4に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、イントラ予測モードの利用頻度を示す頻度情報に基づいて、m個のイントラ予測モードを予測モード候補として決定する。
図11は、本実施の形態の変形例4に係るイントラ予測モードの利用頻度に基づいてイントラ予測モードの数を制限する動作を説明するための図である。図11は、イントラ予測モードのモード番号(識別番号)を利用頻度が高い順に並べた表を示している。図11に示す例では、モード0が最も頻繁に使用されたイントラ予測モードであることを示し、モード1、モード26の順に利用頻度が低減している。
決定部121は、例えば、メモリを有し、図11に示すようなイントラ予測モードの利用頻度を示すデータを保持する。このデータは、現在の符号化対象ブロックを符号化する前、又は、現在のイントラ予測対象のサブブロックをイントラ予測する前に作成される。例えば、利用頻度を示すデータ(頻度情報)は、実験的にあらゆる動画像を符号化し、イントラ予測モードの利用状況を調査する。そして、データ(頻度情報)は、調査結果に基づいて使用頻度とイントラ予測モードとを対応づけたリストとして作成される。
決定部121は、データ(頻度情報)を利用して、例えば、利用頻度が多いイントラ予測モードの予測方向周辺の方向を示すイントラ予測モードを多く含むm個のイントラ予測モードを予測モード候補として決定する。このようにすれば、画像の一般的な特徴が分かり、それに応じて制限することができる。また、実験的にあらゆる動画像を符号化する際に、画像を分類しておけば、分類に該当する画像であった場合、画像の特徴に合わせた制限方法が可能になる。
また、決定部121は、利用頻度が最も高いイントラ予測モードからm番目に高いイントラ予測モードまでのm個のイントラ予測モードを予測モード候補として決定してもよい。また、決定部121は、m個全てのイントラ予測モードを頻度情報に基づいて決定しなくてもよい。言い換えると、決定部121は、予測モード候補として決定すべきm個のイントラ予測モードのうち、k(1≦k<m)個のイントラ予測モードを頻度情報に基づいて決定し、m−k個のイントラ予測モードをその他の方法によって決定してもよい。例えば、決定部121は、利用頻度が最も高いイントラ予測モードからk番目に高いイントラ予測モードまでのk個のイントラ予測モードと、識別番号が等間隔になるm−k個のイントラ予測モードとを予測モード候補として決定してもよい。
なお、頻度情報は、動的に更新してもよい。例えば、入力画像、符号化対象ブロック、又は、予測対象のサブブロック毎に、決定部121は、利用したイントラ予測モードの利用頻度を頻度情報に蓄積してもよい。そして、決定部121は、蓄積した頻度情報に基づいて、例えば、予測対象のサブブロック毎に、m個のイントラ予測モードを予測モード候補として決定してもよい。
(変形例5)
変形例5に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、入力画像、符号化対象ブロック及び予測対象のサブブロックの少なくとも1つに含まれるエッジを示すエッジ情報に基づいて、m個のイントラ予測モードを予測モード候補として決定する。エッジ情報は、例えば、エッジの位置、方向及び強度を示す情報である。
図12は、本実施の形態の変形例5に係るエッジに基づいてイントラ予測モードの数を制限する動作を示すフローチャートである。
決定部121は、例えば、サブブロック毎に、エッジ強度と強度の大きい成分の方向の判定結果とに基づいた予測方向を優遇するようにイントラ予測モードの数を制限する。具体的には、まず、決定部121は、符号化対象のサブブロックが属する画像において、エッジの強度を探索し、強度の大きい成分の方向を抽出する(S121)。
エッジ強度の大きい成分がある場合(S121でYes)、決定部121は、エッジの強度が大きい成分の方向を優遇して、イントラ予測モードの数を制限する(S122)。具体的には、決定部121は、エッジ強度の大きい成分の方向に最も近い予測方向の方向予測モードと、当該方向予測モードと特徴が類似するイントラ予測モードとを含むように、イントラ予測モードの数を制限する。具体的には、決定部121は、エッジ強度の大きい成分の方向に最も近い予測方向の方向予測モードと、当該方向予測モードに隣接する方向予測モードとを含むm個のイントラ予測モードを予測モード候補として決定する。
一方、エッジ強度の大きい成分がない場合(S121でNo)、決定部121は、エッジに依存することなく、イントラ予測モードの数を制限する(S123)。具体的には、決定部121は、例えば、本実施の形態、変形例1〜4に示したような方法に基づいて、イントラ予測モードの数を制限する。
このようにすれば、決定部121は、サブブロック毎に効率良くイントラ予測モードの数を制限することができる。また、エッジの方向に基づいてイントラ予測モードの数を制限するので、イントラ予測の精度を高めることができ、符号化効率を高めることができる。
また、エッジ強度の大きさのみを探索し、強度の大きいサブブロックにおいて使用可能な予測方向数を減らさない方法でもよい。すなわち、所定の大きさより大きい強度のエッジが検出されたサブブロックの場合、決定部121は、M個のイントラ予測モードを予測モード候補として決定してもよい。逆に、所定の大きさより小さい強度のエッジが検出されたサブブロック、あるいは、エッジが検出されないサブブロックの場合、決定部121は、m個のイントラ予測モードを予測モード候補として決定してもよい。例えば、決定部121は、例えば、本実施の形態、変形例1〜4に示したような方法に基づいて、イントラ予測モードの数を制限してもよい。このように、エッジの方向に依存せず、エッジの位置と強度とに基づいてm個のイントラ予測モードを決定してもよい。
また、決定部121は、予測対象のサブブロック毎ではなく、符号化対象ブロック毎、又は、入力画像毎に、エッジ情報を取得し、取得したエッジ情報に基づいて、m個のイントラ予測モードを決定してもよい。つまり、決定部121は、入力画像、符号化対象のブロック、又は、予測対象のサブブロックにおける画像の特徴に基づいて、m個のイントラ予測モードを予測モード候補として決定してもよい。
(変形例6)
変形例6に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測対象のサブブロックの各画素が参照する参照画素の組み合わせが互いに異なるm個のイントラ予測モードを予測モード候補として決定する。例えば、決定部121は、隣接するイントラ予測モードにおいて、(式2)の参照画素p(a)及びp(b)が同じ画素になった場合、隣接するイントラ予測モードをどちらか一方のみを含むようにm個のイントラ予測モードを予測モード候補として決定する。
図13は、本実施の形態の変形例6に係る2つのイントラ予測モードにおいて利用する参照画素の組み合わせを示す図である。図13では、一例として、モード4とモード5のイントラ予測モードの参照画素について示している。
図13に示すように、モード4とモード5では、4×4画素のサブブロック内の全ての画素において、利用する参照画素は同一になる。そこで、決定部121は、このような2つのイントラ予測モードのうちいずれか一方を制限する。つまり、決定部121は、同一の参照画素を利用するモード4とモード5の2つのイントラ予測モードのうち、例えば、モード4のイントラ予測モードを利用不可にする。
2つのイントラ予測モードにおいて、利用する参照画素が同じ場合、2つのイントラ予測モードのそれぞれに対応する予測画像は、ほぼ同じになる場合が多い。このため、いずれか一方のイントラ予測モードを利用不可にすることで、イントラ予測処理に要する処理量を削減することができる。このように、重なる参照画素に基づいて効率良く制限することができる。
決定部121は、決定後のm個のイントラ予測モードを用いた場合に、予測対象のサブブロックの各画素が参照する参照画素の組み合わせが互いに異なるように、m個のイントラ予測モードを予測モード候補として決定する。このとき、残りのM−m個のイントラ予測モードのイントラ予測モードの任意の1つを用いた場合の参照画素の組み合わせは、例えば、予測モード候補として決定されたm個のイントラ予測モードのいずれか1つと同一となる。
このように、参照画素の組み合わせが重なることがないように、かつ、様々な組み合わせが利用可能となるような最適な個数であるm個のイントラ予測モードを、決定部121は、予測モード候補として決定する。これにより、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測対象のサブブロックの各画素が参照する参照画素の一部が互いに異なるm個のイントラ予測モードを予測モード候補として決定してもよい。例えば、決定部121は、隣接する方向予測モードで、一部の画素の参照画素が同じになる場合についても、効率的であると判断されればどちらか一方に制限してもよい。例えば、決定部121は、4×4画素の場合、8画素以上で同一の参照画素を利用する場合は効率的であると判断しても構わない。
また、決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測対象のサブブロックの最も右下に位置する画素が参照する参照画素が互いに異なるm個のイントラ予測モードを予測モード候補として決定してもよい。つまり、決定部121は、予測対象のサブブロックの周辺に位置する画素から最も距離が遠い画素を基準に、イントラ予測モードの数を制限する。
予測対象のサブブロックの最も右下の画素は、サブブロック内の画素の中で最も参照画素が重ならない画素になる。
このようにすれば、サブブロック内の全画素を探索するという処理を省ける上に、最も右下の画素で制限することで、処理サブブロック内の多くの画素で参照画素が重なっている可能性が高くなり、効率良く制限することができる。
また、2つの参照画素と(式2)とを用いて予測値を求める場合以外にも、1つの参照画素と(式1)とを用いて予測値を求める場合でも、同じように制限できる。
また、決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測対象のサブブロックに隣接するサブブロックの予測に用いたイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定してもよい。例えば、決定部121は、本実施の形態、変形例1〜6に示したような方法に基づいて決定したm−1個のイントラ予測モードと、隣接するサブブロックの予測に用いたイントラ予測モードとを含むm個のイントラ予測モードを予測モード候補として決定すればよい。
隣接するサブブロック間では、画像が類似する可能性が高く、イントラ予測モードの予測方向が一致する可能性が高い。このため、隣接するサブブロックの予測に用いたイントラ予測モードを利用可能にすることで、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、上記の実施の形態、及び、変形例1〜6は、いくつか組み合わせても構わない。このようにすれば、決定部121は、単独の条件で制限する場合よりも、効率的に制限することができる可能性がある。例えば、約22.5度毎の角度で等間隔に制限する条件(変形例1)と、Planar予測モード及びDC予測モードが必ず含まれるように制限する条件(変形例2)とを組み合わせれば、H.264の4×4、8×8と同じようなモードを表現できる。これにより、H.264と同じ程度に演算処理が速くなる上に、開発技術の流用が可能となる。
[まとめ]
以上のように、本実施の形態の変形例に係る画像符号化装置100では、決定部121は、予測方向がなす角度が等間隔になる少なくともm−2個のイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、m−2個のイントラ予測モードの予測方向のなす角度が等間隔になるので、任意の方向に近い予測方向のイントラ予測モードを利用可能にすることができる。したがって、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、Planar予測モード及びDC予測モードを含むm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、予測方向に依存しないイントラ予測モードであるPlanar予測モード及びDC予測モードを利用可能にすることができる。したがって、例えば、入力画像が方向予測モードでは対応できない特徴を有する画像である場合に、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、予測方向が水平方向及び垂直方向であるイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、水平方向及び垂直方向のイントラ予測モードを利用することができる。したがって、例えば、入力画像が縦線及び横線が多い人工的な画像である場合に、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、イントラ予測モードの利用頻度を示す頻度情報に基づいて、m個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、頻度情報に基づいてm個のイントラ予測モードを決定するので、例えば、画像の特徴とイントラ予測モードの利用頻度とを対応付けておくことで、画像の特徴に応じて適切にm個のイントラ予測モードを決定することができる。したがって、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、入力画像、符号化対象ブロック及び予測対象のサブブロックの少なくとも1つに含まれるエッジを示すエッジ情報に基づいて、m個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、エッジ情報に基づいてm個のイントラ予測モードを決定するので、例えば、所定の大きさより大きな強度のエッジが検出された場合に、適切にm個のイントラ予測モードを決定することができる。例えば、決定部121は、エッジの方向に近接する予測方向のイントラ予測モードを多く含むようにm個のイントラ予測モードを決定することで、画像の特徴に適したイントラ予測モードを利用可能にすることができる。したがって、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、予測対象のサブブロックの各画素が参照する参照画素の組み合わせが互いに異なるm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、参照画素の組み合わせが同一になるイントラ予測モードを用いてイントラ予測を行った場合、互いに類似する予測画像が生成されることが多い。したがって、m個のイントラ予測モードの参照画素の組み合わせを互いに異ならせることで、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、予測対象のサブブロックの最も右下に位置する画素が参照する参照画素が互いに異なるm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、サブブロックの最も右下に位置する画素は、サブブロック内の画素の中で最も参照画素が重ならない画素になる。したがって、最も参照画素が重ならない最も右下の画素の予測の際に用いる参照画素が重ならないようにすることで、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、予測対象のサブブロックに隣接するサブブロックの予測に用いたイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、隣接するサブブロック間では画像が類似する可能性が高く、イントラ予測モードの予測方向が一致する可能性が高い。したがって、隣接するサブブロックで用いたイントラ予測モードを利用可能にすることで、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
以上のように、いずれの場合においても、符号化効率を極端に悪化させることなく、イントラ予測に要する処理量を削減することができる。
なお、上記の実施の形態において、決定部121は、入力画像の画面解像度に応じて、制限前に利用できるイントラ予測モードの数を変更する構成にしても構わない。つまり、入力画像の画面解像度が第1サイズである場合に、M1個のイントラ予測モードが利用可能であり、入力画像の画面解像度が第1サイズより小さい第2サイズである場合に、M2個のイントラ予測モードが利用可能となる。このとき、M1及びM2はともに、2以上の自然数であり、M1<M2≦Mの関係を満たす。
例えば、決定部121は、入力画像の画面解像度が1920×1080画素の場合、ブロックサイズに依存することなく予め規定されたM個のイントラ予測モードに代えて、M1個のイントラ予測モードからm個のイントラ予測モードを予測モード候補として決定する。一方、決定部121は、入力画像の画面解像度が920×720画素である場合、ブロックサイズに依存することなく予め規定されたM個のイントラ予測モードに代えて、M2個のイントラ予測モードから、m個のイントラ予測モードを予測モード候補として決定する。
なお、M1個又はM2個のイントラ予測モードからm個のイントラ予測モードを予測モード候補として決定する方法としては、例えば、本実施の形態、及び、変形例1〜6に示した方法を用いることができる。このように、入力画像の画面解像度に応じてイントラ予測モードの個数をM個からM1個又はM2個に制限し、さらに、予測対象のサブブロックのサイズに応じてイントラ予測モードの個数をM1個又はM2個からm個に制限することができる。
上記のように構成することにより、画面解像度が大きくなるにつれ増加するイントラ予測処理の処理量の影響を抑えながらイントラ予測モードの制限を実施することができる。
(他の実施の形態)
以上のように、本出願において開示する技術の例示として、実施の形態及びその変形例1〜6を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態及びその変形例1〜6で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面及び詳細な説明を提供した。
したがって、添付図面及び詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、請求の範囲又はその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
また、本開示に係る画像符号化装置は、入力画像を符号化する画像符号化装置であって、入力画像の符号化対象ブロックを複数のサブブロックに分割する分割部と、分割部によって分割されたサブブロック毎にイントラ予測を行うイントラ予測部とを備え、イントラ予測部は、ブロックサイズに依存することなく予め規定されたM個(Mは、2以上の自然数)のイントラ予測モードの数より少なく、かつ、入力画像に依存することなく予め定められたm個(mは、自然数)のイントラ予測モードを予測モード候補として決定する決定部と、決定部によって決定された予測モード候補の中から1つのイントラ予測モードを選択し、選択したイントラ予測モードを用いて予測対象のサブブロックのイントラ予測を行う予測部とを備えてもよい。
具体的には、本開示に係る画像符号化装置では、予めm個のイントラ予測モードが予測モード候補として規定されている。例えば、静止画、動画像、自然画像、文字画像などの入力画像の種別に依存することなく、かつ、符号化対象ブロックのサイズ、予測対象のサブブロックサイズなどの符号化処理の処理単位のサイズに依存することなく、イントラ予測部は、m個のみのイントラ予測モードが利用可能である。すなわち、いかなるイントラ予測処理においても、イントラ予測部は、予め定められたm個のイントラ予測モードの中から1つのイントラ予測モードを選択し、選択したイントラ予測モードを用いてイントラ予測を行う。
このように、符号化規格で規定されたM個のイントラ予測モードの中からm個のイントラ予測モードが、利用可能な予測モード候補として、入力画像及び符号化処理の処理単位のサイズに依存することなく定められていてもよい。これにより、どのような入力画像が入力された場合であっても、イントラ予測に要する処理量を削減することができる。
また、決定部は、符号化規格で規定されたM個のイントラ予測モードの中から、入力画像の画面解像度に応じて異なる個数のイントラ予測モードを予測モード候補として決定してもよい。
具体的には、決定部は、入力画像の画面解像度が第1サイズ(例えば、1920×1080画素)である場合に、M1個のイントラ予測モードを予測モード候補として決定してもよい。また、決定部は、入力画像の画面解像度が第1サイズより小さい第2サイズ(例えば、920×720画素)である場合に、M2個のイントラ予測モードを予測モード候補として決定してもよい。このとき、M1及びM2はともに、2以上の自然数であり、M1<M2≦Mの関係を満たす。
このように、決定部は、符号化対象ブロックのサイズ、予測対象のサブブロックサイズなどの符号化処理の処理単位のサイズに依存することなく、入力画像の画面解像度に応じて予測モード候補を決定する。画面解像度が大きくなるにつれ増加するイントラ予測処理の処理量の影響を抑えながらイントラ予測モードの制限を実施することができる。
なお、本開示に係る画像符号化装置100を構成する各構成要素(ピクチャバッファ101、ピクチャ分割部102、減算部103、予測残差符号化部104、係数符号列生成部105、予測残差復号化部106、加算部107、予測画像生成部108、イントラ予測部109、ループフィルタ110、フレームメモリ111、インター予測部112、選択部113、量子化値決定部114、ヘッダ符号列生成部115、判定部120、決定部121及び予測部122)は、CPU(Central Processing Unit)、RAM、ROM(Read Only Memory)通信インターフェース、I/Oポート、ハードディスク、ディスプレイなどを備えるコンピュータ上で実行されるプログラムなどのソフトウェアで実現されてもよく、電子回路などのハードウェアで実現されてもよい。
本開示は、イントラ予測するサブブロックサイズに基づいて、イントラ予測モードを制限する画像符号化装置に適用可能である。具体的には、レコーダ、デジタルカメラ又はタブレット端末装置などに、本開示は適用可能である。
100 画像符号化装置
101 ピクチャバッファ
102 ピクチャ分割部
103 減算部
104 予測残差符号化部
105 係数符号列生成部
106 予測残差復号化部
107 加算部
108 予測画像生成部
109 イントラ予測部
110 ループフィルタ
111 フレームメモリ
112 インター予測部
113 選択部
114 量子化値決定部
115 ヘッダ符号列生成部
120 判定部
121 決定部
122 予測部
200、201 方向
本開示は、画像符号化装置及び画像符号化方法に関する。
現在、H.264の次の世代の動画像符号化規格であるHigh Efficiency Video Coding(HEVC)が策定中である。このHEVCでは、図1に示すように、イントラ予測時において選択可能なイントラ予測モードが35種類ある。HEVCでは、この35種類の中から選択されるイントラ予測モードを用いて符号化を実施する。
しかし、イントラ予測を実行するブロックサイズが4×4画素のように小さいサイズである場合、隣り合うイントラ予測モードでは、同じ参照画素を利用してイントラ予測するものが存在する。同じ参照画素を利用してイントラ予測する場合、イントラ予測モードが異なる場合であっても、結果として得られる差分画像信号の値はほとんど変わらないものとなる。
Joint Collaborative Team on Video Coding (JCT−VC)of ITU −T SG16 WP3 andISO/IEC JTC1/SC29/WG、10th Meeting Stockholm、SE、11−20 July 2012、Document JCTVC−J1003_d7
上記のように多くのイントラ予測モードを利用できる場合、詳細な予測が可能となるため画質又は符号化効率が向上する。しかし、例えば、符号化対象のサブブロックサイズが4×4画素のように小さいサイズである場合、イントラ予測の結果として得られる差分画像信号の値にほとんど変化がない場合、画質又は符号化効率の大きな向上は見込めない。この場合は、単にイントラ予測の処理量だけが増加することになる。
そこで本開示は、符号化効率の悪化を抑制し、かつ、イントラ予測に必要な処理量を削減することができる画像符号化装置及び画像符号化方法を提供する。
本開示における画像符号化装置は、入力画像を符号化する画像符号化装置であって、入力画像の符号化対象ブロックを複数のサブブロックに分割する分割部と、分割部によって分割されたサブブロック毎にイントラ予測を行うイントラ予測部とを備え、イントラ予測部は、予測対象のサブブロックのサイズが所定のサイズ以下であるか否かを判定する判定部と、判定部によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、ブロックサイズに依存することなく予め規定されたM個(Mは、2以上の自然数)のイントラ予測モードの数より少ないm個(mは、自然数)のイントラ予測モードを予測モード候補として決定する決定部と、決定部によって決定された予測モード候補の中から1つのイントラ予測モードを選択し、選択したイントラ予測モードを用いて予測対象のサブブロックのイントラ予測を行う予測部とを備える。
本開示における画像符号化装置及び画像符号化方法は、符号化効率の悪化を抑制し、かつ、イントラ予測に必要な処理量を削減することができる。
図1は、HEVC規格におけるイントラ予測モードの種類を示す図である。 図2は、本実施の形態に係る画像符号化装置の構成を示すブロック図である。 図3は、本実施の形態に係るイントラ予測部の構成を示すブロック図である。 図4は、本実施の形態に係るイントラ予測処理の動作を示すフローチャートである。 図5は、本実施の形態に係る予測対象のサブブロックの画素位置を示す図である。 図6は、本実施の形態に係る4×4画素のサブブロックをイントラ予測する際、最も右下の画素において参照する周辺画素を示す図である。 図7Aは、本実施の形態に係る識別番号を利用してイントラ予測モードの数を制限する動作を説明するための図である。 図7Bは、本実施の形態に係る識別番号を利用してイントラ予測モードの数を制限する動作を説明するための図である。 図8は、本実施の形態の変形例1に係る予測方向がなす角度を利用してイントラ予測モードの数を制限する動作を説明するための図である。 図9は、本実施の形態の変形例2に係るPlanar予測モード及びDC予測モードが利用できるようにイントラ予測モードの数を制限する動作を説明するための図である。 図10は、本実施の形態の変形例3に係る水平方向及び垂直方向のイントラ予測モードが利用できるようにイントラ予測モードの数を制限する動作を説明するための図である。 図11は、本実施の形態の変形例4に係るイントラ予測モードの利用頻度に基づいてイントラ予測モードの数を制限する動作を説明するための図である。 図12は、本実施の形態の変形例5に係るエッジに基づいてイントラ予測モードの数を制限する動作を示すフローチャートである。 図13は、本実施の形態の変形例6に係る2つのイントラ予測モードにおいて利用する参照画素の組み合わせを示す図である。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。ただし、必要以上に詳細な説明は省略する場合がある。例えば、すでによく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、発明者らは、当業者が本開示を十分に理解するために添付図面及び以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
(実施の形態)
以下、図1〜図13を用いて、本実施の形態を説明する。説明の便宜上、HEVCを用いて符号化する際の動作を説明する。
[画像符号化装置の構成]
図2は、本実施の形態に係る画像符号化装置100のブロック図である。
画像符号化装置100は、ピクチャ単位で入力された動画像をブロック(符号化対象ブロック)に分割し、ブロック単位で符号化処理を行うことで、符号列を生成する。なお、上記ブロックには複数のサブブロックが含まれる。画像符号化装置100が有する構成要素は、ブロック単位又はサブブロック単位で処理する。
図2に示す画像符号化装置100は、ピクチャバッファ101と、ピクチャ分割部102と、減算部103と、予測残差符号化部104と、係数符号列生成部105と、予測残差復号化部106と、加算部107と、予測画像生成部108と、量子化値決定部114と、ヘッダ符号列生成部115とを備える。なお、予測画像生成部108は、イントラ予測部109と、ループフィルタ110と、フレームメモリ111と、インター予測部112と、選択部113とを備える。
画像符号化装置100は、入力画像をHEVCの規格に基づいて圧縮符号化し、符号列を生成して出力する。
ピクチャバッファ101は、取得部の一例であり、入力画像を取得し、記憶媒体に一時的に記憶する。例えば、ピクチャバッファ101は、表示を行う順にピクチャ単位で入力される入力画像を、符号化を行う順にピクチャの並び替えを行って蓄積する。ピクチャバッファ101における記憶媒体は、DRAM(Dynamic Random Access Memory)メモリなど、入力画像を記憶できる記憶媒体であればどのようなものを利用しても構わない。
ピクチャ分割部102は、入力画像の符号化対象ブロックを複数のサブブロックに分割する分割部の一例である。ピクチャ分割部102は、減算部103又は量子化値決定部114からの読出し命令を受け付けた場合、ピクチャバッファ101から入力画像を取得する。そして、ピクチャ分割部102は、読出し命令に対応する画像信号を減算部103に出力する。
このとき、各々のピクチャは、以降の符号化処理単位であるコーディングユニット(CU)と呼ばれる複数の画素から構成される符号化単位に分割される。CUは、符号化対象ブロックの一例であり、例えば、64×64画素のブロック、32×32画素のブロック、16×16画素のブロックなどからなる。
減算部103は、ピクチャ分割部102から出力される対象ブロックと、予測画像生成部108から出力される予測画像であって、対象ブロックの予測画像との差分を算出することで、差分画像信号を生成する。例えば、減算部103は、符号化対象ブロック毎に差分を算出する。減算部103は、差分画像信号を予測残差符号化部104に出力する。つまり、減算部103は、ピクチャ分割部102から読み出された画像信号と、予測画像生成部108から出力される予測画像信号との差分値である差分画像信号を生成し、予測残差符号化部104に出力する。
予測残差符号化部104は、減算部103から出力される差分画像信号を直交変換することで、直交変換係数を生成する。予測残差符号化部104は、差分画像信号を直交変換する場合、直交変換用のサブブロック単位で処理する。ここで、直交変換用のサブブロックは、トランスフォームユニット(TU)と呼ばれる複数の画素から構成される直交変換処理単位である。例えば、直交変換用のサブブロック(TU)は、例えば、32×32画素のブロック、16×16画素のブロック、8×8画素のブロック、4×4画素のブロックなどからなる。
予測残差符号化部104は、さらに、得られた直交変換係数の各周波数成分を量子化することで、量子化係数を生成する。そして、予測残差符号化部104は、量子化係数を係数符号列生成部105及び予測残差復号化部106に出力する。なお、予測残差符号化部104は、量子化値決定部114によって決定された量子化値信号を用いて、直交変換係数を量子化する。
係数符号列生成部105は、予測残差符号化部104から出力される量子化係数を可変長符号化する。係数符号列生成部105は、可変長符号化によって生成される符号列をヘッダ符号列生成部115が生成した符号列に続けて追記する。これにより、係数符号列生成部105は、出力用の符号列信号を生成する。
予測残差復号化部106は、予測残差符号化部104から出力される量子化係数を逆量子化及び逆直交変換することで、残差復号化信号を再構成する。予測残差復号化部106は、再構成して得られる残差復号化信号を加算部107に出力する。
加算部107は、予測残差復号化部106から出力される残差復号化信号と予測画像生成部108から出力される予測画像とを加算することで、再構成画像信号を生成する。そして、加算部107は、再構成画像信号をイントラ予測部109及びループフィルタ110に出力する。
予測画像生成部108は、少なくとも加算部107から出力される再構成画像信号に基づいて、ピクチャ分割部102から出力されるブロックに対する予測画像を生成する。予測画像生成部108は、予測画像を生成する場合、イントラ予測又はインター予測を用いる。
なお、予測画像生成部108は、予測用のサブブロック単位で予測画像を生成する。ここで、予測用のサブブロックとは、プレディクションユニット(PU)と呼ばれる複数の画素から構成される予測処理単位である。例えば、予測用のサブブロック(PU)は、ピクチャ分割部102が出力する符号化対象ブロックを少なくとも1つ以上に分割して生成される領域を示す。例えば、PUは、64×64画素のブロック、32×32画素のブロック、16×16画素のブロック、8×8画素のブロック、4×4画素のブロックなどからなる。
また、予測画像生成部108は、ピクチャ分割部102が出力する符号化対象ブロック単位でイントラ予測又はインター予測を切り替える。つまり、符号化対象ブロック内に属するサブブロックには、イントラ予測及びインター予測のうちいずれか一方が適用される。
予測画像生成部108は、イントラ予測部109と、ループフィルタ110と、フレームメモリ111と、インター予測部112と、選択部113とを備える。
イントラ予測部109は、既に符号化済みのブロックにおける画素データであって、符号化対象ブロック周辺に位置する画素データを用いて、符号化対象ブロックの予測画像を予測用のサブブロック毎に生成する。具体的には、イントラ予測部109は、少なくとも符号化対象ブロックに隣接する既に符号化済みの画素データに基づいてイントラ予測を行うことで、予測画像を生成する。
イントラ予測部109は、画像符号化装置100で想定している符号化規格であるHEVCに規定される35個のイントラ予測モードから1つのイントラ予測モードを選択する。さらに、イントラ予測部109は、選択したイントラ予測モードに基づいてイントラ予測を行うことで、予測対象のサブブロックの予測画像を生成する。イントラ予測部109は、サブブロック毎に予測画像を生成した結果として得られる予測画像であって、ピクチャ分割部102が出力するブロックの予測画像を、減算部103及び加算部107に出力する。
なお、イントラ予測部109のより詳細な構成及び動作については、後で説明する。
ループフィルタ110は、加算部107から出力される再構成画像信号にフィルタ処理を行う。例えば、ループフィルタ110は、再構成画像信号に対して、ブロックノイズを軽減するフィルタ処理を施す。ループフィルタ110は、フィルタ処理された再構成画像信号をフレームメモリ111に出力する。
フレームメモリ111は、ループフィルタ110から出力されるフィルタ処理後の再構成画像信号を蓄積する。再構成画像信号は、現在符号化対象となっているピクチャ以降のピクチャの符号化における予測符号化処理に用いられる。つまり、再構成画像信号は、現在、符号化対象となっているピクチャ以降のピクチャを符号化する際に、インター予測を用いて予測画像を生成する際の画素データとして利用される。フレームメモリ111は、インター予測部112からの読出し命令に応じて、格納している再構成画像信号を画素データとしてインター予測部112に出力する。
インター予測部112は、フレームメモリ111に格納されている再構成画像信号を参照画像として用いてインター予測を行うことで、サブブロック毎に予測画像信号を生成する。インター予測を行う際は、フレームメモリ111に蓄積される既に符号化済みの過去のピクチャの再構成画像信号を用いる。インター予測部112は、生成した予測画像信号を減算部103及び加算部107に出力する。
選択部113は、予測の結果得られる差分画像信号の符号量又は予測値に基づいて、イントラ予測及びインター予測のうちいずれか一方を選択する。具体的には、選択部113は、イントラ予測で得られる差分画像信号の符号量又は予測値が少ない又は小さい場合、イントラ予測を選択する。イントラ予測で得られる差分画像信号の符号量又は予測値が多い又は大きい場合、選択部113は、インター予測を選択する。
なお、予測画像生成部108は、インター予測を使わなくてもよい。このようにすれば、予測画像生成部108は、静止画像など、イントラ予測のみを用いる場合に処理構成を単純化することができる。
量子化値決定部114は、ピクチャ分割部102に格納されるピクチャに基づいて、予測残差符号化部104において差分画像信号を量子化する際の量子化値(量子化幅)を設定する。量子化値決定部114は、設定した量子化値を予測残差符号化部104及びヘッダ符号列生成部115に出力する。なお、量子化値決定部114における量子化値の設定方法は、符号列信号のビットレートが目標とするビットレートに近づくように量子化値を設定する、いわゆるレート制御に基づく量子化値の設定方法を利用しても構わない。
ヘッダ符号列生成部115は、予測画像生成部108が出力する予測情報信号と、量子化値決定部114が出力する量子化値信号と、その他の符号化制御に関する制御情報とを可変長符号化することで符号列を生成する。なお、予測情報には、例えば、イントラ予測モード、インター予測モード、動きベクトル、参照ピクチャを示す情報などが含まれる。また、制御情報は、係数符号列生成部105における処理前までに取得可能な情報であって、ブロックの符号化時に適用した符号化条件を示す情報である。例えば、制御情報には、ピクチャ符号化タイプ又はブロック分割情報などが含まれる。例えば、ピクチャ符号化タイプとは、Iピクチャ、Pピクチャ又はBピクチャを示す情報、又は、ブロックに適用された予測方法に関する情報などを含む情報である。また、ブロック分割情報は、例えば、直交変換時におけるサブブロックの分割情報、又は、予測画像生成部108におけるサブブロックの分割情報などを含む情報である。
[イントラ予測部の構成]
続いて、イントラ予測部109のより詳細な構成について説明する。
図3は、本実施の形態に係るイントラ予測部109を示すブロック図である。イントラ予測部109は、判定部120と、決定部121と、予測部122とを備える。
判定部120は、予測対象のサブブロックのサイズが所定のサイズ以下であるか否かを判定する。言い換えると、判定部120は、予測対象のサブブロックのサイズが小さいか否かを判定する。具体的には、所定のサイズは、4×4画素であり、判定部120は、予測対象のサブブロックが4×4画素以下のサイズである場合に、当該予測対象のサブブロックのサイズが小さいと判定する。より具体的には、判定部120は、ピクチャ分割部102から取得した予測対象のサブブロックが4×4画素である場合にのみ、当該予測対象のサブブロックのサイズが小さいと判定する。
なお、所定のサイズは、これに限られない。例えば、所定のサイズは、8×8画素のサイズでもよい。つまり、判定部120は、予測対象のサブブロックのサイズが8×8画素以下である場合に、当該予測対象のサブブロックが小さいと判定してもよい。
決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、ブロックサイズに依存することなく予め規定されたM個(Mは、2以上の自然数)のイントラ予測モードの数より少ないm個(mは、自然数)のイントラ予測モードを予測モード候補として決定する。また、決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズより大きいと判定された場合には、ブロックサイズに依存することなく予め規定されたM個のイントラ予測モードを予測モード候補として決定する。
ここで、M個のイントラ予測モードは、所定の符号化規格によって規定されたイントラ予測モードである。具体的には、M個のイントラ予測モードは、HEVCによって規定されている。図1に示すように、HEVCによって規定されたイントラ予測モードの個数は、35である。すなわち、M=35である。
なお、決定部121によるm個のイントラ予測モードの決定方法については、後で具体例を挙げながら説明する。
予測部122は、決定部121によって決定された予測モード候補の中から1つの予測モードを選択し、選択したイントラ予測モードを用いて予測対象のサブブロックのイントラ予測を行う。例えば、予測部122は、加算部107から出力された符号化済みの画素データを用いてイントラ予測を行う。予測部122は、イントラ予測を行うことで、予測画像を生成し、生成した予測画像を選択部113に出力する。
[イントラ予測処理]
以下、図面を参照しながら、本実施の形態に係る画像符号化方法について説明する。特に、イントラ予測部109におけるイントラ予測動作を中心に説明する。
図4は、本実施の形態に係るイントラ予測処理の動作を示すフローチャートである。
まず、ピクチャ分割部102は、入力画像の符号化対象ブロックを複数のサブブロックに分割する(S100)。イントラ予測部109は、サブブロック毎にイントラ予測を行う。
判定部120は、予測対象のサブブロックのサイズが所定のサイズ以下であるか否かを判定する(S110)。例えば、サイズの大小を判定する基準となる予め設定されたサブブロックサイズ(所定のサイズ)は、4×4画素サイズである。なお、予め設定されたサブブロックサイズは、上記のサブブロックサイズに限定するものではなく、8×8画素サイズなど、設計者の思想に応じて設定できる。以下、説明の便宜上、予め設定されたサブブロックサイズは、4×4画素サイズとする。
予測対象のサブブロックのサイズが4×4画素サイズと判定された場合(S110でYes)、決定部121は、M個のイントラ予測モードの数より少ないm個のイントラ予測モードを予測モード候補として決定する(S120)。言い換えると、決定部121は、M(M=35)個のイントラ予測モードをm個に制限する。このように、イントラ予測モードの数をm個に絞り込むことで、(35−m)個のイントラ予測に要する処理時間を削減することができる。
以下では、制限されたm個のイントラ予測モードのそれぞれについて、予測部122は、イントラ予測(S130)及びコスト計算(S140)を行う。
具体的には、予測部122は、制限されたm個のイントラ予測モードの1つである対象予測モードを用いてイントラ予測を行う(S130)。つまり、予測部122は、対象予測モードを用いて、予測対象のサブブロック内の画素毎に予測値を算出する。具体的な予測値の算出方法は、後で説明する。
予測部122は、算出した予測値に基づいて、対象予測モードの符号化コストを計算する(S140)。例えば、予測部122は、対象予測モードを用いて算出した予測値と、符号化対象ブロックに含まれる入力画像の画素データであって、予測対象のサブブロックに対応する画素データとの差分値を、符号化コストとして算出する。
そして、予測部122は、m個のイントラ予測モードの中から異なる予測モードを新たな対象予測モードとしてイントラ予測(S130)及びコスト計算(S140)を繰り返す。これにより、m個のイントラ予測モードのそれぞれについて、予測値と符号化コストとが算出される。
予測部122は、m個のイントラ予測モードの中から、算出した符号化コストに基づいて、適切なイントラ予測モードを決定する(S170)。例えば、予測部122は、符号化コストとして差分値を算出している場合、当該差分値が最も小さくなるイントラ予測モードを最適なイントラ予測モードとして決定する。
そして、予測部122は、決定したイントラ予測モードを用いてイントラ予測を行うことで、予測値を算出する(S180)。そして、予測部122は、算出した予測値を選択部113に出力する。なお、予測部122は、最適なイントラ予測モードを決定する際(S130及びS140)にすでに予測値を算出している場合、すでに算出された予測値を選択部113に出力してもよい。
一方、予測対象のサブブロックのサイズが4×4画素サイズよりも大きいと判定された場合(S110でNo)、予測部122は、全イントラ予測モードについて、すなわち、35個のイントラ予測モードについて、イントラ予測(S150)及びコスト計算(S160)を行う。
具体的には、予測部122は、M個のイントラ予測モードの1つである対象予測モードを用いてイントラ予測を行う(S150)。そして、予測部122は、算出した予測値に基づいて、対象予測モードの符号化コストを計算する(S160)。例えば、予測部122は、対象予測モードを用いて算出した予測値と、符号化対象ブロックに含まれる入力画像の画素データであって、予測対象のサブブロックに対応する画素データとの差分値を、符号化コストとして算出する。
そして、予測部122は、M個のイントラ予測モードの中から異なる予測モードを新たな対象予測モードとしてイントラ予測(S150)及びコスト計算(S160)を繰り返す。これにより、M個のイントラ予測モードのそれぞれについて、予測値と符号化コストが算出される。
以降、制限されたm個のイントラ予測モードの場合と同様に、予測部122は、適切なイントラ予測モードを決定し(S170)、決定したイントラ予測モードを用いて予測値を算出して(S180)、算出した予測値を選択部113に出力する。なお、予測部122は、最適なイントラ予測モードを決定する際(S150及びS160)にすでに予測値を算出している場合、すでに算出された予測値を選択部113に出力してもよい。
[イントラ予測における予測値の算出方法]
以下、図面を参照しながらイントラ予測時における予測値の算出方法について説明する。
以下、説明の便宜上、HEVCにおけるイントラ予測について説明する。
HEVCでは、図1に示すように、予測対象のブロックサイズに依存することなく、35種類のイントラ予測モードが規定されている。具体的には、HEVCでは、Planar予測モードと、DC予測モードと、33個の予測方向モードとが定義されている。
HEVCでは、例えば、予測対象のブロックサイズが4×4画素の場合には、35個のイントラ予測モードが利用可能であり、予測対象のブロックサイズが8×8画素の場合にも、35個のイントラ予測モードが利用可能である。つまり、HEVCでは、イントラ予測を行う場合、予測対象のブロックサイズがどのようなサイズであっても、35個のイントラ予測モードが利用可能であり、当該35個のイントラ予測モードから1つのイントラ予測モードを選択することができる。このように、35個のイントラ予測モードが予測モード候補として定義されているので、イントラ予測部109は、イントラ予測を行う際、35個のイントラ予測モードの中からいずれか1つを選択する。
図5は、本実施の形態に係る予測対象のサブブロックの画素位置を示す図である。
図5に示すように、水平方向にx軸、垂直方向にy軸を定義し、それぞれ右方向及び下方向に正(+)と定義する。以下では、座標(x,y)に位置する画素を、画素(x,y)と表現し、画素(x,y)の画素値をp(x,y)と表現する。なお、予測対象のサブブロックのサイズが、4×4画素の場合、図5に示すNは、N=3である。
図6は、本実施の形態に係る4×4画素のサブブロックをイントラ予測する際、最も右下の画素において参照する周辺画素を示す図である。説明の便宜上、4×4画素のうち最も右下の画素、すなわち、画素(3,3)について説明するが、それ以外の位置の画素についても同様の方法で予測が行われる。
イントラ予測部109は、以下のイントラ予測モードを利用して予測値を算出する。
1.垂直方向のイントラ予測モード
予測対象画素の真上に位置する画素の画素値をそのまま予測値として利用するイントラ予測モードである。例えば、垂直方向のイントラ予測モードを用いた場合、画素(3,3)の予測値は、画素(3,−1)の画素値p(3,−1)になる。
2.水平方向のイントラ予測モード
予測対象画素の真横に位置する画素の画素値をそのまま予測値として利用するイントラ予測モードである。例えば、水平方向のイントラ予測モードを用いた場合、画素(3,3)の予測値は、画素(−1,3)の画素値p(−1,3)になる。
3.DC予測モード
周辺画素の平均値を利用するイントラ予測モードである。例えば、DC予測モードを用いた場合、画素(3,3)の予測値は、周辺画素p(−1,0)、p(−1,1)、p(−1,2)、p(−1,3)、p(0,−1)、p(1,−1)、p(2,−1)、p(3,−1)の平均値になる。
なお、DC予測モードの場合、4×4画素に含まれる画素(3,3)以外の画素における予測値も画素(3,3)で算出された予測値と同じ値となる。
4.斜め方向のイントラ予測モード
斜めの矢印で指定された方向にある隣接した1画素又は2画素を参照し、(式1)又は(式2)を利用する斜め方向の予測モードである。
(式1) S(x,y)=p(a)
(式2) S(x,y)=[c×p(a)+d×p(b)+16]>>5
例えば、図6に示す方向200の場合、参照画素は、画素(7,−1)である。また、例えば、図6に示す方向201の場合、参照画素は、画素(5,−1)と画素(6,−1)とである。
ここで、(式1)は、画素位置(x,y)におけるイントラ予測の予測値S(x,y)を求める式であって、参照画素が1画素である場合に利用する式である。ここで、aは、予測方向から設定される参照画素の位置を示す値であり、p(a)は当該参照画素の値である。
また、(式2)は、画素位置(x,y)におけるイントラ予測の予測値S(x,y)を求める別の式であり、参照画素が2画素である場合に利用する式である。ここで、a及びbは、予測方向から設定される2つの参照画素の位置を示す値であり、p(a)及びp(b)は、隣り合う2つの参照画素の値である。また、c及びdは、各々の参照画素に乗ぜられる重み付け値である。
なお、HEVCでは、互いに方向が異なる複数の斜め方向のイントラ予測モードが規定されている。つまり、利用するイントラ予測モードによって、利用する画素(すなわち、a及びbの値)及び重み付け値(すなわち、c及びdの値)が異なる。
5.planar予測モード
4画素を用いた内挿予測(重み付け加算)を行う予測モードである。例えば、画素(3,3)の予測値は、4つの参照画素の画素値p(−1,3)、p(3,−1)、p(−1,4)、p(4,−1)の重み付け平均値である。
なお、上記においては4×4画素に対してイントラ予測し、予測値を算出する動作を説明したが、8×8画素など、他のサブブロックサイズに対してイントラ予測し、予測値を算出する際も同様の考えで算出することができる。なお、斜め方向の予測モードの場合、サブブロックサイズの大きさによって、同じイントラ予測モードであっても利用する画素が異なってくる。
[イントラ予測モードの数の制限方法]
以下、イントラ予測モードの数の制限方法、すなわち、予測モード候補の決定方法について、図面を参照しながら説明する。説明の便宜上、HEVCの符号化規格に基づいて説明する。
図7A及び図7Bは、本実施の形態に係る識別番号を利用してイントラ予測モードの数を制限する動作を説明するための図である。具体的には、図7Aは、イントラ予測モードとその使用可否とを対応付けた表を示している。図7Bは、使用不可のイントラ予測モードと、使用可能なイントラ予測モードとの関係を示す図である。なお、説明の便宜上、図7Bにおける破線の矢印は、使用不可のイントラ予測モードを示し、また、実線の矢印は、使用可能なイントラ予測モードを示している。これは、以降の図においても同様である。
決定部121は、イントラ予測モードの識別番号が等間隔になるm個のイントラ予測モードを予測モード候補として決定する。識別番号は、M個のイントラ予測モードを一意に識別するために、M個のイントラ予測モードのそれぞれに付された番号である。具体的には、識別番号は、図1に示すような0〜34の番号である。決定部121は、決定後のm個のイントラ予測モードの識別番号が等間隔になるように、すなわち、識別番号が等差数列を形成するようにm個のイントラ予測モードを決定する。
例えば、決定部121は、図7A及び図7Bに示すように、符号化規格に規定されるイントラ予測モードのうち、偶数番号で規定されるイントラ予測モードを使用可能にし、かつ、奇数番号で規定されるイントラ予測モードを使用不可にする。すなわち、決定部121は、偶数番号で規定されるイントラ予測モードを予測モード候補として決定する。なお、ここで、0は、偶数である。
なお、M個のイントラ予測モードの中から、どのm個のイントラ予測モードを予測モード候補として選択するかは、予め定められている。すなわち、m個のイントラ予測モードの種類、及び、個数(mの値)は、静的に定められている。例えば、静止画、動画像、自然画像、文字画像などの入力画像の種別に依存することなく、かつ、符号化対象ブロックのサイズ、予測対象のサブブロックサイズなどの符号化処理の処理単位のサイズに依存することなく、m個のイントラ予測モードの種類、及び、個数が定められている。具体的には、予測対象サブブロックのサイズが小さいと判定された場合には、偶数番号で規定されるイントラ予測モードを予測モード候補として決定することが、予め定められている。
イントラ予測モードのうち、水平方向、垂直方向及び斜め方向のイントラ予測モードでは、予測対象画素から周辺のサブブロックに向けて、選択したイントラ予測モードが示す予測方向にある周辺画素を参照する。したがって、4×4画素のように予測対象のサブブロックのサイズが小さい場合、イントラ予測モードが示す予測方向がなす角度が従来の符号化規格であるH.264と比べて小さいために、同じ周辺画素を参照する可能性がある。このように、予測対象のサブブロックが小さい程、識別番号が隣接するイントラ予測モードのそれぞれで参照する画素が重なってしまう。
これを解決するために、図7A及び図7Bに示すように、決定部121は、35個のイントラ予測モードの中で、偶数番号が設定されているイントラ予測モードのみを予測モード候補として決定する。このようにすれば、隣接するイントラ予測モードが示す方向が成す角度を大きくすることができる。よって、予測時に利用する周辺画素の重複を低減することができる。さらに、自然画でよく用いられる縦線及び横線を重視する割合を保ったまま、イントラ予測モードの数を制限することができる。
なお、制限するイントラ予測モードは、偶数番号でなく、奇数番号でもよい。又は、1以上の間隔となってもよい。
また、決定部121は、予測モード候補として決定されるm個のイントラ予測モードの種類及び個数は、動的に決定してもよい。
[まとめ]
以上のように、本実施の形態に係る画像符号化装置100は、入力画像を符号化する画像符号化装置100であって、入力画像の符号化対象ブロックを複数のサブブロックに分割するピクチャ分割部102と、ピクチャ分割部102によって分割されたサブブロック毎にイントラ予測を行うイントラ予測部109とを備え、イントラ予測部109は、予測対象のサブブロックのサイズが所定のサイズ以下であるか否かを判定する判定部120と、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、ブロックサイズに依存することなく予め規定されたM個(Mは、2以上の自然数)のイントラ予測モードの数より少ないm個(mは、自然数)のイントラ予測モードを予測モード候補として決定する決定部121と、決定部121によって決定された予測モード候補の中から1つのイントラ予測モードを選択し、選択したイントラ予測モードを用いて前記予測対象のサブブロックのイントラ予測を行う予測部122とを備える。
これにより、画像符号化装置100は、イントラ予測対象のサブブロックサイズが例えば4×4画素などの小さいブロックサイズである場合、利用できるイントラ予測モードの数を制限することができる。小さいサブブロックサイズである場合、隣接するイントラ予測モードを利用した結果、得られる予測値はほとんど変わらない。そのため、このようなイントラ予測モードを制限したとしても、符号化効率をほとんど落とすことなくイントラ予測に要する処理量を削減することができる。具体的には、本開示に係る画像符号化装置100では、利用可能なイントラ予測モードの数をM個からm個に制限するので、M−m個のイントラ予測モードを用いたイントラ予測に要する処理量を削減することができる。
さらに、決定部121は、イントラ予測モードの識別番号が等間隔になるm個のイントラ予測モードを前記予測モード候補として決定してもよい。これにより、簡易な制御方法で、予測対象のサブブロックのサイズが小さい場合に利用可能なイントラ予測モードを決定することができる。また、自然画でよく用いられる縦方向、横方向を重視するイントラ予測モード数の割合を保ったまま制限することができる。そのため、入力画像の特徴がどのようなものであっても、符号化効率を極端に悪化させることなく、イントラ予測に要する処理量を削減することができる。
(実施の形態の変形例)
以下、図面を参照しながら、上記とは異なるイントラ予測モードの数の制限方法について説明する。
(変形例1)
変形例1に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測方向がなす角度が等間隔になる少なくともm−2個のイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定する。
図8は、本実施の形態の変形例1に係る予測方向がなす角度を利用してイントラ予測モードの数を制限する動作を説明するための図である。
HEVCでは、互いに異なる予測方向を持つ33個のイントラ予測モード(方向予測モード)が定義されている。決定部121は、決定後の方向予測モードがなす予測方向の角度が等間隔になるように、少なくともm−2個の方向予測モードを含むm個のイントラ予測モードを予測モード候補として決定する。
例えば、図8に示すように、決定部121は、33個の方向予測モードの中から決定された9個の方向予測モードと、DC予測モードと、Planar予測モードとの11個のイントラ予測モードを予測モード候補として決定する。具体的には、決定部121は、イントラ予測モードの予測方向がなす角度が約22.5度毎になるように、9個の方向予測モードを決定する。つまり、決定後のイントラ予測モードにおいては、隣接する方向予測モードのなす角度が等しくなるように、決定部121は、少なくともm−2個の方向予測モードを決定する。
このようにすれば、予測モード候補の数(mの値)を少なくした場合でも、制限後のイントラ予測モードは全方位を網羅できる。すなわち、特定の方向に対するイントラ予測モードがすべて制限されることがない。
なお、イントラ予測モードの方向が成す角度は、約22.5度よりも大きくても小さくてもよい。なお、角度が大きい場合は、利用できるイントラ予測モードが少なくなる。つまり、予測精度が低下することにより、出力される符号列の符号量が大きくなる可能性があるが、イントラ予測に要する処理量を低減することができる。一方で、角度が小さい場合は、利用できるイントラ予測モードが多くなる。つまり、イントラ予測に要する処理量は増加するが、予測精度が向上することにより、出力される符号列の符号量を小さくすることができる。
(変形例2)
変形例2に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、Planar予測モード及びDC予測モードを含むm個のイントラ予測モードを予測モード候補として決定する。
図9は、本実施の形態の変形例2に係るPlanar予測モード及びDC予測モードが利用できるようにイントラ予測モードの数を制限する動作を説明するための図である。
HEVCでは、33個の方向予測モードの他に、Planar予測モードとDC予測モードとが規定されている。このとき、例えば、単にイントラ予測モードの識別番号に基づき制限した場合、図7BのようにDC予測モードが予測モード候補として利用できなくなる可能性がある。
決定部121は、図9に示すように、Planar予測モード及びDC予測モードが利用できるように、Planar予測モードとDC予測モードとを含むm個のイントラ予測モードを予測モード候補として決定する。これにより、予測の方向性に依存してしまうモードでは対応できない特徴を有する画像に対応することができる。つまり、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
なお、変形例2に係る決定部121は、Planar予測モード及びDC予測モードを除く、残りのm−2個のイントラ予測モードをどのように決定してもよい。例えば、決定部121は、識別番号が等間隔になるm−2個のイントラ予測モードを残りの予測モード候補として決定してもよい。あるいは、決定部121は、予測方向がなす角度が等間隔になるm−2個のイントラ予測モードを残りの予測モード候補として決定してもよい。
(変形例3)
変形例3に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測方向が水平方向及び垂直方向であるイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定する。
図10は、本実施の形態の変形例3に係る水平方向及び垂直方向のイントラ予測モードが利用できるようにイントラ予測モードの数を制限する動作を説明するための図である。
例えば、単に識別番号に基づいてイントラ予測モードを制限した場合、図10の(a)に示すように、予測方向が水平方向又は垂直方向であるイントラ予測モードが予測モード候補として利用できなくなる場合がある。
決定部121は、図10の(b)に示すように、予測方向が水平方向及び垂直方向であるイントラ予測モードが利用できるように、予測方向が水平方向及び垂直方向であるイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定する。これにより、イントラ予測部109は、縦線及び横線が多い人工的な画像の予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
なお、変形例3に係る決定部121は、予測方向が水平方向及び垂直方向であるイントラ予測モードを除く、残りのm−2個のイントラ予測モードをどのように決定してもよい。例えば、決定部121は、識別番号が等間隔になるm−2個のイントラ予測モードを残りの予測モード候補として決定してもよい。あるいは、決定部121は、予測方向がなす角度が等間隔になるm−2個のイントラ予測モードを残りの予測モード候補として決定してもよい。
(変形例4)
変形例4に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、イントラ予測モードの利用頻度を示す頻度情報に基づいて、m個のイントラ予測モードを予測モード候補として決定する。
図11は、本実施の形態の変形例4に係るイントラ予測モードの利用頻度に基づいてイントラ予測モードの数を制限する動作を説明するための図である。図11は、イントラ予測モードのモード番号(識別番号)を利用頻度が高い順に並べた表を示している。図11に示す例では、モード0が最も頻繁に使用されたイントラ予測モードであることを示し、モード1、モード26の順に利用頻度が低減している。
決定部121は、例えば、メモリを有し、図11に示すようなイントラ予測モードの利用頻度を示すデータを保持する。このデータは、現在の符号化対象ブロックを符号化する前、又は、現在のイントラ予測対象のサブブロックをイントラ予測する前に作成される。例えば、利用頻度を示すデータ(頻度情報)は、実験的にあらゆる動画像を符号化し、イントラ予測モードの利用状況を調査する。そして、データ(頻度情報)は、調査結果に基づいて使用頻度とイントラ予測モードとを対応づけたリストとして作成される。
決定部121は、データ(頻度情報)を利用して、例えば、利用頻度が多いイントラ予測モードの予測方向周辺の方向を示すイントラ予測モードを多く含むm個のイントラ予測モードを予測モード候補として決定する。このようにすれば、画像の一般的な特徴が分かり、それに応じて制限することができる。また、実験的にあらゆる動画像を符号化する際に、画像を分類しておけば、分類に該当する画像であった場合、画像の特徴に合わせた制限方法が可能になる。
また、決定部121は、利用頻度が最も高いイントラ予測モードからm番目に高いイントラ予測モードまでのm個のイントラ予測モードを予測モード候補として決定してもよい。また、決定部121は、m個全てのイントラ予測モードを頻度情報に基づいて決定しなくてもよい。言い換えると、決定部121は、予測モード候補として決定すべきm個のイントラ予測モードのうち、k(1≦k<m)個のイントラ予測モードを頻度情報に基づいて決定し、m−k個のイントラ予測モードをその他の方法によって決定してもよい。例えば、決定部121は、利用頻度が最も高いイントラ予測モードからk番目に高いイントラ予測モードまでのk個のイントラ予測モードと、識別番号が等間隔になるm−k個のイントラ予測モードとを予測モード候補として決定してもよい。
なお、頻度情報は、動的に更新してもよい。例えば、入力画像、符号化対象ブロック、又は、予測対象のサブブロック毎に、決定部121は、利用したイントラ予測モードの利用頻度を頻度情報に蓄積してもよい。そして、決定部121は、蓄積した頻度情報に基づいて、例えば、予測対象のサブブロック毎に、m個のイントラ予測モードを予測モード候補として決定してもよい。
(変形例5)
変形例5に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、入力画像、符号化対象ブロック及び予測対象のサブブロックの少なくとも1つに含まれるエッジを示すエッジ情報に基づいて、m個のイントラ予測モードを予測モード候補として決定する。エッジ情報は、例えば、エッジの位置、方向及び強度を示す情報である。
図12は、本実施の形態の変形例5に係るエッジに基づいてイントラ予測モードの数を制限する動作を示すフローチャートである。
決定部121は、例えば、サブブロック毎に、エッジ強度と強度の大きい成分の方向の判定結果とに基づいた予測方向を優遇するようにイントラ予測モードの数を制限する。具体的には、まず、決定部121は、符号化対象のサブブロックが属する画像において、エッジの強度を探索し、強度の大きい成分の方向を抽出する(S121)。
エッジ強度の大きい成分がある場合(S121でYes)、決定部121は、エッジの強度が大きい成分の方向を優遇して、イントラ予測モードの数を制限する(S122)。具体的には、決定部121は、エッジ強度の大きい成分の方向に最も近い予測方向の方向予測モードと、当該方向予測モードと特徴が類似するイントラ予測モードとを含むように、イントラ予測モードの数を制限する。具体的には、決定部121は、エッジ強度の大きい成分の方向に最も近い予測方向の方向予測モードと、当該方向予測モードに隣接する方向予測モードとを含むm個のイントラ予測モードを予測モード候補として決定する。
一方、エッジ強度の大きい成分がない場合(S121でNo)、決定部121は、エッジに依存することなく、イントラ予測モードの数を制限する(S123)。具体的には、決定部121は、例えば、本実施の形態、変形例1〜4に示したような方法に基づいて、イントラ予測モードの数を制限する。
このようにすれば、決定部121は、サブブロック毎に効率良くイントラ予測モードの数を制限することができる。また、エッジの方向に基づいてイントラ予測モードの数を制限するので、イントラ予測の精度を高めることができ、符号化効率を高めることができる。
また、エッジ強度の大きさのみを探索し、強度の大きいサブブロックにおいて使用可能な予測方向数を減らさない方法でもよい。すなわち、所定の大きさより大きい強度のエッジが検出されたサブブロックの場合、決定部121は、M個のイントラ予測モードを予測モード候補として決定してもよい。逆に、所定の大きさより小さい強度のエッジが検出されたサブブロック、あるいは、エッジが検出されないサブブロックの場合、決定部121は、m個のイントラ予測モードを予測モード候補として決定してもよい。例えば、決定部121は、例えば、本実施の形態、変形例1〜4に示したような方法に基づいて、イントラ予測モードの数を制限してもよい。このように、エッジの方向に依存せず、エッジの位置と強度とに基づいてm個のイントラ予測モードを決定してもよい。
また、決定部121は、予測対象のサブブロック毎ではなく、符号化対象ブロック毎、又は、入力画像毎に、エッジ情報を取得し、取得したエッジ情報に基づいて、m個のイントラ予測モードを決定してもよい。つまり、決定部121は、入力画像、符号化対象のブロック、又は、予測対象のサブブロックにおける画像の特徴に基づいて、m個のイントラ予測モードを予測モード候補として決定してもよい。
(変形例6)
変形例6に係る決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測対象のサブブロックの各画素が参照する参照画素の組み合わせが互いに異なるm個のイントラ予測モードを予測モード候補として決定する。例えば、決定部121は、隣接するイントラ予測モードにおいて、(式2)の参照画素p(a)及びp(b)が同じ画素になった場合、隣接するイントラ予測モードをどちらか一方のみを含むようにm個のイントラ予測モードを予測モード候補として決定する。
図13は、本実施の形態の変形例6に係る2つのイントラ予測モードにおいて利用する参照画素の組み合わせを示す図である。図13では、一例として、モード4とモード5のイントラ予測モードの参照画素について示している。
図13に示すように、モード4とモード5では、4×4画素のサブブロック内の全ての画素において、利用する参照画素は同一になる。そこで、決定部121は、このような2つのイントラ予測モードのうちいずれか一方を制限する。つまり、決定部121は、同一の参照画素を利用するモード4とモード5の2つのイントラ予測モードのうち、例えば、モード4のイントラ予測モードを利用不可にする。
2つのイントラ予測モードにおいて、利用する参照画素が同じ場合、2つのイントラ予測モードのそれぞれに対応する予測画像は、ほぼ同じになる場合が多い。このため、いずれか一方のイントラ予測モードを利用不可にすることで、イントラ予測処理に要する処理量を削減することができる。このように、重なる参照画素に基づいて効率良く制限することができる。
決定部121は、決定後のm個のイントラ予測モードを用いた場合に、予測対象のサブブロックの各画素が参照する参照画素の組み合わせが互いに異なるように、m個のイントラ予測モードを予測モード候補として決定する。このとき、残りのM−m個のイントラ予測モードのイントラ予測モードの任意の1つを用いた場合の参照画素の組み合わせは、例えば、予測モード候補として決定されたm個のイントラ予測モードのいずれか1つと同一となる。
このように、参照画素の組み合わせが重なることがないように、かつ、様々な組み合わせが利用可能となるような最適な個数であるm個のイントラ予測モードを、決定部121は、予測モード候補として決定する。これにより、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測対象のサブブロックの各画素が参照する参照画素の一部が互いに異なるm個のイントラ予測モードを予測モード候補として決定してもよい。例えば、決定部121は、隣接する方向予測モードで、一部の画素の参照画素が同じになる場合についても、効率的であると判断されればどちらか一方に制限してもよい。例えば、決定部121は、4×4画素の場合、8画素以上で同一の参照画素を利用する場合は効率的であると判断しても構わない。
また、決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測対象のサブブロックの最も右下に位置する画素が参照する参照画素が互いに異なるm個のイントラ予測モードを予測モード候補として決定してもよい。つまり、決定部121は、予測対象のサブブロックの周辺に位置する画素から最も距離が遠い画素を基準に、イントラ予測モードの数を制限する。
予測対象のサブブロックの最も右下の画素は、サブブロック内の画素の中で最も参照画素が重ならない画素になる。
このようにすれば、サブブロック内の全画素を探索するという処理を省ける上に、最も右下の画素で制限することで、処理サブブロック内の多くの画素で参照画素が重なっている可能性が高くなり、効率良く制限することができる。
また、2つの参照画素と(式2)とを用いて予測値を求める場合以外にも、1つの参照画素と(式1)とを用いて予測値を求める場合でも、同じように制限できる。
また、決定部121は、判定部120によって予測対象のサブブロックのサイズが所定のサイズ以下であると判定された場合に、予測対象のサブブロックに隣接するサブブロックの予測に用いたイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定してもよい。例えば、決定部121は、本実施の形態、変形例1〜6に示したような方法に基づいて決定したm−1個のイントラ予測モードと、隣接するサブブロックの予測に用いたイントラ予測モードとを含むm個のイントラ予測モードを予測モード候補として決定すればよい。
隣接するサブブロック間では、画像が類似する可能性が高く、イントラ予測モードの予測方向が一致する可能性が高い。このため、隣接するサブブロックの予測に用いたイントラ予測モードを利用可能にすることで、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、上記の実施の形態、及び、変形例1〜6は、いくつか組み合わせても構わない。このようにすれば、決定部121は、単独の条件で制限する場合よりも、効率的に制限することができる可能性がある。例えば、約22.5度毎の角度で等間隔に制限する条件(変形例1)と、Planar予測モード及びDC予測モードが必ず含まれるように制限する条件(変形例2)とを組み合わせれば、H.264の4×4、8×8と同じようなモードを表現できる。これにより、H.264と同じ程度に演算処理が速くなる上に、開発技術の流用が可能となる。
[まとめ]
以上のように、本実施の形態の変形例に係る画像符号化装置100では、決定部121は、予測方向がなす角度が等間隔になる少なくともm−2個のイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、m−2個のイントラ予測モードの予測方向のなす角度が等間隔になるので、任意の方向に近い予測方向のイントラ予測モードを利用可能にすることができる。したがって、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、Planar予測モード及びDC予測モードを含むm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、予測方向に依存しないイントラ予測モードであるPlanar予測モード及びDC予測モードを利用可能にすることができる。したがって、例えば、入力画像が方向予測モードでは対応できない特徴を有する画像である場合に、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、予測方向が水平方向及び垂直方向であるイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、水平方向及び垂直方向のイントラ予測モードを利用することができる。したがって、例えば、入力画像が縦線及び横線が多い人工的な画像である場合に、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、イントラ予測モードの利用頻度を示す頻度情報に基づいて、m個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、頻度情報に基づいてm個のイントラ予測モードを決定するので、例えば、画像の特徴とイントラ予測モードの利用頻度とを対応付けておくことで、画像の特徴に応じて適切にm個のイントラ予測モードを決定することができる。したがって、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、入力画像、符号化対象ブロック及び予測対象のサブブロックの少なくとも1つに含まれるエッジを示すエッジ情報に基づいて、m個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、エッジ情報に基づいてm個のイントラ予測モードを決定するので、例えば、所定の大きさより大きな強度のエッジが検出された場合に、適切にm個のイントラ予測モードを決定することができる。例えば、決定部121は、エッジの方向に近接する予測方向のイントラ予測モードを多く含むようにm個のイントラ予測モードを決定することで、画像の特徴に適したイントラ予測モードを利用可能にすることができる。したがって、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、予測対象のサブブロックの各画素が参照する参照画素の組み合わせが互いに異なるm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、参照画素の組み合わせが同一になるイントラ予測モードを用いてイントラ予測を行った場合、互いに類似する予測画像が生成されることが多い。したがって、m個のイントラ予測モードの参照画素の組み合わせを互いに異ならせることで、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、予測対象のサブブロックの最も右下に位置する画素が参照する参照画素が互いに異なるm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、サブブロックの最も右下に位置する画素は、サブブロック内の画素の中で最も参照画素が重ならない画素になる。したがって、最も参照画素が重ならない最も右下の画素の予測の際に用いる参照画素が重ならないようにすることで、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
また、画像符号化装置100では、決定部121は、予測対象のサブブロックに隣接するサブブロックの予測に用いたイントラ予測モードを含むm個のイントラ予測モードを予測モード候補として決定してもよい。
これにより、隣接するサブブロック間では画像が類似する可能性が高く、イントラ予測モードの予測方向が一致する可能性が高い。したがって、隣接するサブブロックで用いたイントラ予測モードを利用可能にすることで、予測の精度を大きく損なうことなく、イントラ予測処理に要する処理量を削減することができる。
以上のように、いずれの場合においても、符号化効率を極端に悪化させることなく、イントラ予測に要する処理量を削減することができる。
なお、上記の実施の形態において、決定部121は、入力画像の画面解像度に応じて、制限前に利用できるイントラ予測モードの数を変更する構成にしても構わない。つまり、入力画像の画面解像度が第1サイズである場合に、M1個のイントラ予測モードが利用可能であり、入力画像の画面解像度が第1サイズより小さい第2サイズである場合に、M2個のイントラ予測モードが利用可能となる。このとき、M1及びM2はともに、2以上の自然数であり、M1<M2≦Mの関係を満たす。
例えば、決定部121は、入力画像の画面解像度が1920×1080画素の場合、ブロックサイズに依存することなく予め規定されたM個のイントラ予測モードに代えて、M1個のイントラ予測モードからm個のイントラ予測モードを予測モード候補として決定する。一方、決定部121は、入力画像の画面解像度が920×720画素である場合、ブロックサイズに依存することなく予め規定されたM個のイントラ予測モードに代えて、M2個のイントラ予測モードから、m個のイントラ予測モードを予測モード候補として決定する。
なお、M1個又はM2個のイントラ予測モードからm個のイントラ予測モードを予測モード候補として決定する方法としては、例えば、本実施の形態、及び、変形例1〜6に示した方法を用いることができる。このように、入力画像の画面解像度に応じてイントラ予測モードの個数をM個からM1個又はM2個に制限し、さらに、予測対象のサブブロックのサイズに応じてイントラ予測モードの個数をM1個又はM2個からm個に制限することができる。
上記のように構成することにより、画面解像度が大きくなるにつれ増加するイントラ予測処理の処理量の影響を抑えながらイントラ予測モードの制限を実施することができる。
(他の実施の形態)
以上のように、本出願において開示する技術の例示として、実施の形態及びその変形例1〜6を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態及びその変形例1〜6で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面及び詳細な説明を提供した。
したがって、添付図面及び詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、請求の範囲又はその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
また、本開示に係る画像符号化装置は、入力画像を符号化する画像符号化装置であって、入力画像の符号化対象ブロックを複数のサブブロックに分割する分割部と、分割部によって分割されたサブブロック毎にイントラ予測を行うイントラ予測部とを備え、イントラ予測部は、ブロックサイズに依存することなく予め規定されたM個(Mは、2以上の自然数)のイントラ予測モードの数より少なく、かつ、入力画像に依存することなく予め定められたm個(mは、自然数)のイントラ予測モードを予測モード候補として決定する決定部と、決定部によって決定された予測モード候補の中から1つのイントラ予測モードを選択し、選択したイントラ予測モードを用いて予測対象のサブブロックのイントラ予測を行う予測部とを備えてもよい。
具体的には、本開示に係る画像符号化装置では、予めm個のイントラ予測モードが予測モード候補として規定されている。例えば、静止画、動画像、自然画像、文字画像などの入力画像の種別に依存することなく、かつ、符号化対象ブロックのサイズ、予測対象のサブブロックサイズなどの符号化処理の処理単位のサイズに依存することなく、イントラ予測部は、m個のみのイントラ予測モードが利用可能である。すなわち、いかなるイントラ予測処理においても、イントラ予測部は、予め定められたm個のイントラ予測モードの中から1つのイントラ予測モードを選択し、選択したイントラ予測モードを用いてイントラ予測を行う。
このように、符号化規格で規定されたM個のイントラ予測モードの中からm個のイントラ予測モードが、利用可能な予測モード候補として、入力画像及び符号化処理の処理単位のサイズに依存することなく定められていてもよい。これにより、どのような入力画像が入力された場合であっても、イントラ予測に要する処理量を削減することができる。
また、決定部は、符号化規格で規定されたM個のイントラ予測モードの中から、入力画像の画面解像度に応じて異なる個数のイントラ予測モードを予測モード候補として決定してもよい。
具体的には、決定部は、入力画像の画面解像度が第1サイズ(例えば、1920×1080画素)である場合に、M1個のイントラ予測モードを予測モード候補として決定してもよい。また、決定部は、入力画像の画面解像度が第1サイズより小さい第2サイズ(例えば、920×720画素)である場合に、M2個のイントラ予測モードを予測モード候補として決定してもよい。このとき、M1及びM2はともに、2以上の自然数であり、M1<M2≦Mの関係を満たす。
このように、決定部は、符号化対象ブロックのサイズ、予測対象のサブブロックサイズなどの符号化処理の処理単位のサイズに依存することなく、入力画像の画面解像度に応じて予測モード候補を決定する。画面解像度が大きくなるにつれ増加するイントラ予測処理の処理量の影響を抑えながらイントラ予測モードの制限を実施することができる。
なお、本開示に係る画像符号化装置100を構成する各構成要素(ピクチャバッファ101、ピクチャ分割部102、減算部103、予測残差符号化部104、係数符号列生成部105、予測残差復号化部106、加算部107、予測画像生成部108、イントラ予測部109、ループフィルタ110、フレームメモリ111、インター予測部112、選択部113、量子化値決定部114、ヘッダ符号列生成部115、判定部120、決定部121及び予測部122)は、CPU(Central Processing Unit)、RAM、ROM(Read Only Memory)通信インターフェース、I/Oポート、ハードディスク、ディスプレイなどを備えるコンピュータ上で実行されるプログラムなどのソフトウェアで実現されてもよく、電子回路などのハードウェアで実現されてもよい。
本開示は、イントラ予測するサブブロックサイズに基づいて、イントラ予測モードを制限する画像符号化装置に適用可能である。具体的には、レコーダ、デジタルカメラ又はタブレット端末装置などに、本開示は適用可能である。
100 画像符号化装置
101 ピクチャバッファ
102 ピクチャ分割部
103 減算部
104 予測残差符号化部
105 係数符号列生成部
106 予測残差復号化部
107 加算部
108 予測画像生成部
109 イントラ予測部
110 ループフィルタ
111 フレームメモリ
112 インター予測部
113 選択部
114 量子化値決定部
115 ヘッダ符号列生成部
120 判定部
121 決定部
122 予測部
200、201 方向

Claims (12)

  1. 入力画像を符号化する画像符号化装置であって、
    前記入力画像の符号化対象ブロックを複数のサブブロックに分割する分割部と、
    前記分割部によって分割されたサブブロック毎にイントラ予測を行うイントラ予測部とを備え、
    前記イントラ予測部は、
    予測対象のサブブロックのサイズが所定のサイズ以下であるか否かを判定する判定部と、
    前記判定部によって前記予測対象のサブブロックのサイズが前記所定のサイズ以下であると判定された場合に、ブロックサイズに依存することなく予め規定されたM個(Mは、2以上の自然数)のイントラ予測モードの数より少ないm個(mは、自然数)のイントラ予測モードを予測モード候補として決定する決定部と、
    前記決定部によって決定された予測モード候補の中から1つのイントラ予測モードを選択し、選択したイントラ予測モードを用いて前記予測対象のサブブロックのイントラ予測を行う予測部とを備える
    画像符号化装置。
  2. 前記決定部は、イントラ予測モードの識別番号が等間隔になるm個のイントラ予測モードを前記予測モード候補として決定する
    請求項1に記載の画像符号化装置。
  3. 前記決定部は、予測方向がなす角度が等間隔になる少なくともm−2個のイントラ予測モードを含むm個のイントラ予測モードを前記予測モード候補として決定する
    請求項1に記載の画像符号化装置。
  4. 前記決定部は、予測方向が水平方向及び垂直方向であるイントラ予測モードを含むm個のイントラ予測モードを前記予測モード候補として決定する
    請求項1に記載の画像符号化装置。
  5. 前記決定部は、Planar予測モード及びDC予測モードを含むm個のイントラ予測モードを前記予測モード候補として決定する
    請求項1に記載の画像符号化装置。
  6. 前記決定部は、前記入力画像、前記符号化対象ブロック及び前記予測対象のサブブロックの少なくとも1つに含まれるエッジを示すエッジ情報に基づいて、m個のイントラ予測モードを前記予測モード候補として決定する
    請求項1に記載の画像符号化装置。
  7. 前記決定部は、前記予測対象のサブブロックの各画素が参照する参照画素の組み合わせが互いに異なるm個のイントラ予測モードを前記予測モード候補として決定する
    請求項1に記載の画像符号化装置。
  8. 前記決定部は、前記予測対象のサブブロックの最も右下に位置する画素が参照する参照画素が互いに異なるm個のイントラ予測モードを前記予測モード候補として決定する
    請求項1に記載の画像符号化装置。
  9. 前記決定部は、イントラ予測モードの利用頻度を示す頻度情報に基づいて、前記m個のイントラ予測モードを前記予測モード候補として決定する
    請求項1に記載の画像符号化装置。
  10. 前記決定部は、前記予測対象のサブブロックに隣接するサブブロックの予測に用いたイントラ予測モードを含むm個のイントラ予測モードを前記予測モード候補として決定する
    請求項1に記載の画像符号化装置。
  11. 前記所定のサイズは、4×4画素である
    請求項1に記載の画像符号化装置。
  12. 入力画像を符号化する画像符号化方法であって、
    前記入力画像の符号化対象ブロックを複数のサブブロックに分割し、
    分割されたサブブロック毎にイントラ予測を行い、
    前記イントラ予測では、
    予測対象のサブブロックのサイズが所定のサイズ以下であるか否かを判定し、
    前記予測対象のサブブロックのサイズが前記所定のサイズ以下であると判定した場合に、ブロックサイズに依存することなく予め規定されたM個(Mは、2以上の自然数)のイントラ予測モードの数より少ないm個(mは、自然数)のイントラ予測モードを予測モード候補として決定し、
    決定された予測モード候補の中から1つのイントラ予測モードを選択し、選択したイントラ予測モードを用いて前記予測対象のサブブロックのイントラ予測を行う
    画像符号化方法。

JP2014539606A 2012-10-01 2013-09-30 画像符号化装置及び画像符号化方法 Pending JPWO2014054267A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012219109 2012-10-01
JP2012219109 2012-10-01
PCT/JP2013/005811 WO2014054267A1 (ja) 2012-10-01 2013-09-30 画像符号化装置及び画像符号化方法

Publications (1)

Publication Number Publication Date
JPWO2014054267A1 true JPWO2014054267A1 (ja) 2016-08-25

Family

ID=50434611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014539606A Pending JPWO2014054267A1 (ja) 2012-10-01 2013-09-30 画像符号化装置及び画像符号化方法

Country Status (3)

Country Link
US (1) US20150208090A1 (ja)
JP (1) JPWO2014054267A1 (ja)
WO (1) WO2014054267A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016171561A (ja) * 2015-03-09 2016-09-23 パナソニックIpマネジメント株式会社 画面内予測装置、画面内予測方法及び画面内予測回路
KR101621358B1 (ko) * 2015-04-16 2016-05-17 아주대학교 산학협력단 Hevc 부호화 장치 및 그 인트라 예측 모드 결정 방법
US10547854B2 (en) 2016-05-13 2020-01-28 Qualcomm Incorporated Neighbor based signaling of intra prediction modes
US10506228B2 (en) 2016-10-04 2019-12-10 Qualcomm Incorporated Variable number of intra modes for video coding
AU2018230328B2 (en) * 2017-03-10 2021-05-06 Hfi Innovation Inc. Method and apparatus of implicit intra coding tool settings with intra directional prediction modes for video coding
WO2020004902A1 (ko) * 2018-06-25 2020-01-02 김기백 영상 부호화/복호화 방법 및 장치
CN110662058B (zh) 2018-06-29 2023-06-30 北京字节跳动网络技术有限公司 查找表的使用条件
KR20240007299A (ko) 2018-06-29 2024-01-16 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 룩업 테이블의 업데이트: fifo, 제약된 fifo
CA3105330C (en) 2018-06-29 2023-12-05 Beijing Bytedance Network Technology Co., Ltd. Interaction between lut and amvp
MX2020013829A (es) 2018-06-29 2022-05-18 Beijing Bytedance Network Tech Co Ltd Poda parcial/total cuando se añade un candidato a hmvp para fusión/amvp.
KR20210025537A (ko) 2018-06-29 2021-03-09 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 하나 또는 다수의 룩업 테이블들을 사용하여 이전에 코딩된 모션 정보를 순서대로 저장하고 이를 사용하여 후속 블록들을 코딩하는 개념
WO2020003270A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Number of motion candidates in a look up table to be checked according to mode
CN110677648B (zh) 2018-07-02 2022-06-07 北京字节跳动网络技术有限公司 处理视频数据的方法、装置及非暂时性存储介质
CN111064959B (zh) 2018-09-12 2023-09-01 北京字节跳动网络技术有限公司 要检查多少个hmvp候选
US10881956B2 (en) * 2018-12-28 2021-01-05 Intel Corporation 3D renderer to video encoder pipeline for improved visual quality and low latency
KR102648159B1 (ko) 2019-01-10 2024-03-18 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Lut 업데이트의 호출
WO2020143824A1 (en) 2019-01-13 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Interaction between lut and shared merge list
CN113330739A (zh) 2019-01-16 2021-08-31 北京字节跳动网络技术有限公司 Lut中的运动候选的插入顺序
CN114208198A (zh) * 2019-01-31 2022-03-18 联发科技股份有限公司 视频编码中用于帧内分区的转换类型分配方法和装置
US11178427B2 (en) * 2019-02-08 2021-11-16 Qualcomm Incorporated Dynamic sub-partition intra prediction for video coding
WO2020192611A1 (en) 2019-03-22 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. Interaction between merge list construction and other tools
CN113411598B (zh) * 2019-06-21 2022-05-31 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
US20230022215A1 (en) * 2019-12-09 2023-01-26 Nippon Telegraph And Telephone Corporation Encoding method, encoding apparatus and program
US11856204B2 (en) * 2020-05-04 2023-12-26 Ssimwave Inc. Macroblocking artifact detection

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI116819B (fi) * 2000-01-21 2006-02-28 Nokia Corp Menetelmä kuvien lähettämiseksi ja kuvakooderi
JP4235162B2 (ja) * 2004-11-18 2009-03-11 日本電信電話株式会社 画像符号化装置,画像符号化方法,画像符号化プログラムおよびコンピュータ読み取り可能な記録媒体
JP4797009B2 (ja) * 2007-10-24 2011-10-19 日本電信電話株式会社 予測モード情報符号化方法,予測モード情報復号方法,これらの装置,およびこれらのプログラム並びにコンピュータ読み取り可能な記録媒体
CN103053162B (zh) * 2010-09-30 2017-12-08 太阳专利托管公司 图像编码方法、图像编码装置
JP5781313B2 (ja) * 2011-01-12 2015-09-16 株式会社Nttドコモ 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム
JP2012147332A (ja) * 2011-01-13 2012-08-02 Sony Corp 符号化装置および符号化方法、並びに復号装置および復号方法

Also Published As

Publication number Publication date
WO2014054267A1 (ja) 2014-04-10
US20150208090A1 (en) 2015-07-23

Similar Documents

Publication Publication Date Title
WO2014054267A1 (ja) 画像符号化装置及び画像符号化方法
CN111066326B (zh) 机器学习视频处理系统和方法
RU2509436C1 (ru) Способ и устройство для кодирования и декодирования блока кодирования границы картинки
CN107241605B (zh) 视频编码器以及视频编码方法
JP4763422B2 (ja) イントラ予測装置
KR101459714B1 (ko) 공간 분할을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
JP6072678B2 (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
KR20230065366A (ko) 영상 부호화/복호화 방법 및 장치
KR20120049109A (ko) 다단계 예측을 이용한 영상 부/복호화 방법 및 이러한 방법을 사용하는 부/복호화 장치
KR102503760B1 (ko) 영상 분석을 이용한 비디오 부호화/복호화 방법 및 장치
JP2017098696A (ja) 動画像符号化装置、動画像符号化方法、及びプログラム
JP7448558B2 (ja) 画像エンコーディングおよびデコーディングのための方法およびデバイス
KR102570374B1 (ko) 영상 부호화 장치, 영상 부호화 방법, 영상 부호화 프로그램, 영상 복호 장치, 영상 복호 방법, 및 영상 복호 프로그램
JP6259272B2 (ja) 映像符号化装置及び映像符号化プログラム
JP2017228827A (ja) イントラ予測器、画像符号化装置、画像復号装置およびプログラム
JP2017126829A (ja) 動画像符号化装置、動画像符号化方法、及びプログラム
KR101543313B1 (ko) 공간 분할을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
CN116325722A (zh) 用于帧内预测模式的熵编码
KR101543310B1 (ko) 공간 분할을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
KR101543309B1 (ko) 공간 분할을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
JP6080077B2 (ja) 画像符号化方法及び画像符号化装置
JP6841709B2 (ja) 画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム
JP6331972B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
KR101543323B1 (ko) 공간 분할을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
CN117044203A (zh) 用于一维变换跳过的eob的信令